You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

API 网关

API 网关(API Gateway,APIG)是一款高扩展、高可用的云上网关托管服务。提供智能路由、多协议支持和 AI 模型代理。结合弹性伸缩、认证鉴权及灰度发布,保障 AI 服务高效稳定运行。
API 网关(API Gateway,APIG)是基于云原生的、高扩展、高可用的云上网关托管服务。能保障 AI 服务高效稳定运行。
产品优势
应用场景
产品功能
产品架构
使用流程
使用指南

产品优势

灵活高效

高性能 AI 插件

支持 C++/Lua/Golang 等多种语言开发插件,满足 AI 应用快速上量、高速迭代及高性能服务。
卓越性能

AI 智能路由

针对 LLM 和多模态模型提供更符合推理场景的负载能力,采用智能的路由决策调度机制。
安全可控

企业级权限

提供基于身份体系的 Token 限流机制,管理 AI 服务中不同用户的身份认证及使用额度,协调 AI 服务调用的资源分配。
生态兼容

拥抱 MCP

全面支持 MCP SSE 有状态协议和认证鉴权,同时能够自动 REST API 转化为 MCP Server,让在线业务能够快速享受 MCP 的红利。

应用场景

基于 GPU 负载的智能路由

大模型 Token 用量限制

多模型管理

多集群管理& Ingress 配置同步

架构图
基于 GPU 负载的智能路由
根据自定义指标,综合判断 GPU 实际负载情况,将请求调度到最优实例,提升整体利用率。

架构优势

支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能

相关产品

架构图

架构优势

支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能
场景图
大模型 Token 用量限制
基于 API-Key 的身份体系认证和监控能力,准确识别消费者身份并进行智能限流。

架构优势

兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配

相关产品

场景图

架构优势

兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配
场景图
多模型管理
AI 网关支持对接常见的大语言模型服务和用户自建推理服务,为大语言模型提供统一的访问入口。

架构优势

屏蔽不同模型调用差异、简化调用
不同模型间 Fallback 、增强稳定性
模型不同版本通过流量镜像灰度测试

相关产品

场景图

架构优势

屏蔽不同模型调用差异、简化调用
不同模型间 Fallback 、增强稳定性
模型不同版本通过流量镜像灰度测试
架构图
多集群管理& Ingress 配置同步
同时具备南北向和东西向流量管控能力,帮助业务集中化管理 API,减少转发次数和系统复杂度。

架构优势

支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步

相关产品

架构图

架构优势

支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步

基于 GPU 负载的智能路由

架构图

架构优势

支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能
场景图

架构优势

兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配
场景图

架构优势

屏蔽不同模型调用差异、简化调用
不同模型间 Fallback 、增强稳定性
模型不同版本通过流量镜像灰度测试
架构图

架构优势

支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步

产品功能

能力丰富的云原生网关
模型安全认证

模型安全认证

支持 HTTPS 协议、IP 黑白名单、API-KEY 等多种认证鉴权方式,多方位保护 API 调用的安全,避免恶意用户访问。
AI 智能路由

AI 智能路由

根据后端 GPU 负载情况,如排队请求数等,将请求调度到负载最低的实例,保证后端推理实例尽可能均匀处理请求。
Token 监控

Token 监控

监控不同部门&团队的 Token 使用,帮助用户有效跟踪模型使用情况,例如了解哪些项目或者消耗的 Token 最多。
Token 用量控制

Token 用量控制

基于对大模型使用的 Token 数量的监控,对模型整体调用 Token 或不同的部门Token 的用量进行配额现在,有效管理模型资源使用。
精确的流量管控

精确的流量管控

支持根据 Method/Path/Query String 路由、URL 重写、按流量比例灰度发布等功能,对流量进行精确管控和路由。
灵活的后端配置

灵活的后端配置

具有相同功能的后端应用可抽象为一个 Upstream,实现路由和后端应用解耦,满足后端应用的多版本管理等需求。
热更新插件配置

热更新插件配置

插件提供丰富的产品能力,强化网关可拓展性;通过插件可以快速生效网关配置,不影响线上流量。
MCP 协议支持

MCP 协议支持

Remote MCP Server 提供请求代理、安全认证、动态注册发现、会话保持等能力。
模型安全认证

模型安全认证

支持 HTTPS 协议、IP 黑白名单、API-KEY 等多种认证鉴权方式,多方位保护 API 调用的安全,避免恶意用户访问。
AI 智能路由

AI 智能路由

根据后端 GPU 负载情况,如排队请求数等,将请求调度到负载最低的实例,保证后端推理实例尽可能均匀处理请求。
Token 监控

Token 监控

监控不同部门&团队的 Token 使用,帮助用户有效跟踪模型使用情况,例如了解哪些项目或者消耗的 Token 最多。
Token 用量控制

Token 用量控制

基于对大模型使用的 Token 数量的监控,对模型整体调用 Token 或不同的部门Token 的用量进行配额现在,有效管理模型资源使用。
精确的流量管控

精确的流量管控

支持根据 Method/Path/Query String 路由、URL 重写、按流量比例灰度发布等功能,对流量进行精确管控和路由。
灵活的后端配置

灵活的后端配置

具有相同功能的后端应用可抽象为一个 Upstream,实现路由和后端应用解耦,满足后端应用的多版本管理等需求。
热更新插件配置

热更新插件配置

插件提供丰富的产品能力,强化网关可拓展性;通过插件可以快速生效网关配置,不影响线上流量。
MCP 协议支持

MCP 协议支持

Remote MCP Server 提供请求代理、安全认证、动态注册发现、会话保持等能力。
展开查看更多

产品架构

云原生 API 网关
架构图
云上网关托管服务
在传统流量网关的基础上,集成丰富的服务发现和服务治理能力,打通微服务架构的内外部网络,快速实现各服务之间、服务与客户端之间的安全通信。

架构优势

拥抱云原生
优异性价比
省心全托管
稳定高可用

相关产品

架构图

架构优势

拥抱云原生
优异性价比
省心全托管
架构图

架构优势

拥抱云原生
优异性价比
省心全托管

使用流程

流畅的使用体验
01

创建实例

创建资源相互隔离的网关实例。
02

创建服务

服务是路由对外暴露的入口。
03

创建上游服务

将相同的后端服务抽象为一个 Upstream。
04

创建路由

将请求转发到一个或多个 Upstream。
05

监控与运维

监控网关实例和服务的性能是否符合预期。

使用指南

欢迎查看使用指南
产品介绍
API 网关(API Gateway,APIG)是基于云原生、高扩展、高可用的云上网关托管服务,现已成为生产级 AI 服务必备组件。提供智能路由、多协议支持及 AI 模型代理能力。内置多种 AI 插件,结合弹性伸缩、认证鉴权及灰度发布,保障 AI 服务高效稳定运行。
什么是 API 网关?
产品优势
产品功能
应用场景
基本概念
地域和可用区
一键启动火山引擎之旅
联系我们