You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

API 网关

API 网关(API Gateway,APIG)是一款高扩展、高可用的云上网关托管服务。提供智能路由、多协议支持和 AI 模型代理。结合弹性伸缩、认证鉴权及灰度发布,保障 AI 服务高效稳定运行。
API 网关(API Gateway,APIG)是基于云原生的、高扩展、高可用的云上网关托管服务。能保障 AI 服务高效稳定运行。
产品优势
应用场景
产品功能
产品架构
使用流程
使用指南

产品优势

灵活高效

高性能 AI 插件

支持 C++/Lua/Golang 等多种语言开发插件,满足 AI 应用快速上量、高速迭代及高性能服务。
卓越性能

AI 智能路由

针对 LLM 和多模态模型提供更符合推理场景的负载能力,采用智能的路由决策调度机制。
安全可控

企业级权限

提供基于身份体系的 Token 限流机制,管理 AI 服务中不同用户的身份认证及使用额度,协调 AI 服务调用的资源分配。
生态兼容

拥抱云原生

不仅支持无缝对接函数服务,而且能够自动发现 Kubernetes 集群、微服务注册中心的后端服务,全面拥抱云原生与微服务架构。

应用场景

基于 GPU 负载的智能路由

基于消费者的全局 Token 限流

多集群管理& Ingress 配置同步

架构图
基于 GPU 负载的智能路由
根据自定义指标,综合判断 GPU 实际负载情况,将请求调度到最优实例,提升整体利用率。

架构优势

支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能

相关产品

架构图

架构优势

支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能
基于消费者的全局 Token 限流
基于消费者的全局 Token 限流
基于 API-Key 的身份体系认证和监控能力,准确识别消费者身份并进行智能限流。

架构优势

兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配

相关产品

基于消费者的全局 Token 限流

架构优势

兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配
架构图
多集群管理& Ingress 配置同步
同时具备南北向和东西向流量管控能力,帮助业务集中化管理 API,减少转发次数和系统复杂度。

架构优势

支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步

相关产品

架构图

架构优势

支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步

基于 GPU 负载的智能路由

架构图

架构优势

支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能
基于消费者的全局 Token 限流

架构优势

兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配
架构图

架构优势

支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步

产品功能

能力丰富的云原生网关
API 全生命周期管理

API 全生命周期管理

提供 API 全生命周期托管服务,包括 API 的创建、维护、发布、监控等功能,帮助开发者快速构建以 API 为核心的系统架构。
AI 智能路由

AI 智能路由

根据后端 GPU 的负载情况,如 GPU KV-Cache 的使用率、排队请求数等,将请求调度到负载最低的实例,保证后端推理实例尽可能均匀处理请求。
精确的流量管控

精确的流量管控

支持根据 Method/Path/Query String 路由、URL 重写、按流量比例灰度发布等功能,对流量进行精确管控和路由。
灵活的后端配置

灵活的后端配置

具有相同功能的后端应用可抽象为一个 Upstream,实现路由和后端应用解耦,满足后端应用的多版本管理等需求。
精细的服务治理

精细的服务治理

提供熔断、限流、重试及超时控制等服务治理功能,助力业务顺利应对流量洪峰。
热更新插件配置

热更新插件配置

插件提供丰富的产品能力,强化网关可拓展性;通过插件可以快速生效网关配置,不影响线上流量。
强大的安全防护

强大的安全防护

支持 HTTPS 协议、IP 黑白名单、多种认证鉴权方式,集成 WAF 网关,多方位保护 API 调用的安全。
多方位监控

多方位监控

提供网关/服务维度的指标监控能力,支持统计 QPS、响应时间、返回码等性能指标,随时掌握网关的健康状态。
API 全生命周期管理

API 全生命周期管理

提供 API 全生命周期托管服务,包括 API 的创建、维护、发布、监控等功能,帮助开发者快速构建以 API 为核心的系统架构。
AI 智能路由

AI 智能路由

根据后端 GPU 的负载情况,如 GPU KV-Cache 的使用率、排队请求数等,将请求调度到负载最低的实例,保证后端推理实例尽可能均匀处理请求。
精确的流量管控

精确的流量管控

支持根据 Method/Path/Query String 路由、URL 重写、按流量比例灰度发布等功能,对流量进行精确管控和路由。
灵活的后端配置

灵活的后端配置

具有相同功能的后端应用可抽象为一个 Upstream,实现路由和后端应用解耦,满足后端应用的多版本管理等需求。
精细的服务治理

精细的服务治理

提供熔断、限流、重试及超时控制等服务治理功能,助力业务顺利应对流量洪峰。
热更新插件配置

热更新插件配置

插件提供丰富的产品能力,强化网关可拓展性;通过插件可以快速生效网关配置,不影响线上流量。
强大的安全防护

强大的安全防护

支持 HTTPS 协议、IP 黑白名单、多种认证鉴权方式,集成 WAF 网关,多方位保护 API 调用的安全。
多方位监控

多方位监控

提供网关/服务维度的指标监控能力,支持统计 QPS、响应时间、返回码等性能指标,随时掌握网关的健康状态。
展开查看更多

产品架构

云原生 API 网关
架构图
云上网关托管服务
在传统流量网关的基础上,集成丰富的服务发现和服务治理能力,打通微服务架构的内外部网络,快速实现各服务之间、服务与客户端之间的安全通信。

架构优势

拥抱云原生
优异性价比
省心全托管
稳定高可用

相关产品

架构图

架构优势

拥抱云原生
优异性价比
省心全托管
架构图

架构优势

拥抱云原生
优异性价比
省心全托管

使用流程

流畅的使用体验
01

创建实例

创建资源相互隔离的网关实例。
02

创建服务

服务是路由对外暴露的入口。
03

创建上游服务

将相同的后端服务抽象为一个 Upstream。
04

创建路由

将请求转发到一个或多个 Upstream。
05

监控与运维

监控网关实例和服务的性能是否符合预期。

使用指南

欢迎查看使用指南
产品介绍
API 网关(API Gateway,APIG)是基于云原生、高扩展、高可用的云上网关托管服务,现已成为生产级 AI 服务必备组件。提供智能路由、多协议支持及 AI 模型代理能力。内置多种 AI 插件,结合弹性伸缩、认证鉴权及灰度发布,保障 AI 服务高效稳定运行。
什么是 API 网关?
产品优势
产品功能
应用场景
基本概念
地域和可用区
一键启动火山引擎之旅
联系我们