We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
文档
备案
控制台
登录
立即注册
API 网关
API 网关(API Gateway,APIG)是一款高扩展、高可用的云上网关托管服务。提供智能路由、多协议支持和 AI 模型代理。结合弹性伸缩、认证鉴权及灰度发布,保障 AI 服务高效稳定运行。
API 网关(API Gateway,APIG)是基于云原生的、高扩展、高可用的云上网关托管服务。能保障 AI 服务高效稳定运行。
立即使用
产品文档
产品动态
AI 代理
多种大模型统一代理
智能路由
基于 GPU 负载的调度能力
灰度发布
精准流量控制,服务灰度上线
认证鉴权
基于消费者的访问权限控制
产品优势
应用场景
产品功能
产品架构
使用流程
使用指南
产品优势
立即咨询
灵活高效
高性能 AI 插件
支持 C++/Lua/Golang 等多种语言开发插件,满足 AI 应用快速上量、高速迭代及高性能服务。
卓越性能
AI 智能路由
针对 LLM 和多模态模型提供更符合推理场景的负载能力,采用智能的路由决策调度机制。
安全可控
企业级权限
提供基于身份体系的 Token 限流机制,管理 AI 服务中不同用户的身份认证及使用额度,协调 AI 服务调用的资源分配。
生态兼容
拥抱 MCP
全面支持 MCP SSE 有状态协议和认证鉴权,同时能够自动 REST API 转化为 MCP Server,让在线业务能够快速享受 MCP 的红利。
应用场景
基于 GPU 负载的智能路由
大模型 Token 用量限制
多模型管理
多集群管理& Ingress 配置同步
基于 GPU 负载的智能路由
根据自定义指标,综合判断 GPU 实际负载情况,将请求调度到最优实例,提升整体利用率。
架构优势
支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能
立即咨询
相关产品
容器服务
云服务器
架构优势
支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能
相关产品
容器服务
云服务器
大模型 Token 用量限制
基于 API-Key 的身份体系认证和监控能力,准确识别消费者身份并进行智能限流。
架构优势
兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配
立即咨询
相关产品
云服务器
容器服务
函数服务
架构优势
兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配
相关产品
云服务器
容器服务
函数服务
多模型管理
AI 网关支持对接常见的大语言模型服务和用户自建推理服务,为大语言模型提供统一的访问入口。
架构优势
屏蔽不同模型调用差异、简化调用
不同模型间 Fallback 、增强稳定性
模型不同版本通过流量镜像灰度测试
立即咨询
相关产品
API 网关
容器服务
火山方舟
架构优势
屏蔽不同模型调用差异、简化调用
不同模型间 Fallback 、增强稳定性
模型不同版本通过流量镜像灰度测试
相关产品
API 网关
容器服务
火山方舟
多集群管理& Ingress 配置同步
同时具备南北向和东西向流量管控能力,帮助业务集中化管理 API,减少转发次数和系统复杂度。
架构优势
支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步
立即咨询
相关产品
云服务器
容器服务
函数服务
架构优势
支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步
相关产品
云服务器
容器服务
函数服务
基于 GPU 负载的智能路由
架构优势
支持流式处理能力,减少内存占用
动态调度 GPU 资源
基于 Token 的治理功能
相关产品
容器服务
云服务器
大模型 Token 用量限制
架构优势
兼容 OpenAI 的 API-Key 认证
监控不同 API-Key 的 Token 使用
不同消费者的 Token 用量分配
相关产品
云服务器
容器服务
函数服务
多模型管理
架构优势
屏蔽不同模型调用差异、简化调用
不同模型间 Fallback 、增强稳定性
模型不同版本通过流量镜像灰度测试
相关产品
API 网关
容器服务
火山方舟
多集群管理& Ingress 配置同步
架构优势
支持多集群管理,灵活部署
统一流量入口,简化运维管理
兼容业界 ingress 标准,监听资源自动同步
相关产品
云服务器
容器服务
函数服务
产品功能
能力丰富的云原生网关
立即咨询
模型安全认证
支持 HTTPS 协议、IP 黑白名单、API-KEY 等多种认证鉴权方式,多方位保护 API 调用的安全,避免恶意用户访问。
AI 智能路由
根据后端 GPU 负载情况,如排队请求数等,将请求调度到负载最低的实例,保证后端推理实例尽可能均匀处理请求。
Token 监控
监控不同部门&团队的 Token 使用,帮助用户有效跟踪模型使用情况,例如了解哪些项目或者消耗的 Token 最多。
Token 用量控制
基于对大模型使用的 Token 数量的监控,对模型整体调用 Token 或不同的部门Token 的用量进行配额现在,有效管理模型资源使用。
精确的流量管控
支持根据 Method/Path/Query String 路由、URL 重写、按流量比例灰度发布等功能,对流量进行精确管控和路由。
灵活的后端配置
具有相同功能的后端应用可抽象为一个 Upstream,实现路由和后端应用解耦,满足后端应用的多版本管理等需求。
热更新插件配置
插件提供丰富的产品能力,强化网关可拓展性;通过插件可以快速生效网关配置,不影响线上流量。
MCP 协议支持
Remote MCP Server 提供请求代理、安全认证、动态注册发现、会话保持等能力。
模型安全认证
支持 HTTPS 协议、IP 黑白名单、API-KEY 等多种认证鉴权方式,多方位保护 API 调用的安全,避免恶意用户访问。
AI 智能路由
根据后端 GPU 负载情况,如排队请求数等,将请求调度到负载最低的实例,保证后端推理实例尽可能均匀处理请求。
Token 监控
监控不同部门&团队的 Token 使用,帮助用户有效跟踪模型使用情况,例如了解哪些项目或者消耗的 Token 最多。
Token 用量控制
基于对大模型使用的 Token 数量的监控,对模型整体调用 Token 或不同的部门Token 的用量进行配额现在,有效管理模型资源使用。
精确的流量管控
支持根据 Method/Path/Query String 路由、URL 重写、按流量比例灰度发布等功能,对流量进行精确管控和路由。
灵活的后端配置
具有相同功能的后端应用可抽象为一个 Upstream,实现路由和后端应用解耦,满足后端应用的多版本管理等需求。
热更新插件配置
插件提供丰富的产品能力,强化网关可拓展性;通过插件可以快速生效网关配置,不影响线上流量。
MCP 协议支持
Remote MCP Server 提供请求代理、安全认证、动态注册发现、会话保持等能力。
展开查看更多
产品架构
云原生 API 网关
云上网关托管服务
在传统流量网关的基础上,集成丰富的服务发现和服务治理能力,打通微服务架构的内外部网络,快速实现各服务之间、服务与客户端之间的安全通信。
架构优势
拥抱云原生
优异性价比
省心全托管
稳定高可用
立即咨询
相关产品
容器服务
微服务引擎
函数服务
架构优势
拥抱云原生
优异性价比
省心全托管
相关产品
容器服务
微服务引擎
函数服务
架构优势
拥抱云原生
优异性价比
省心全托管
相关产品
容器服务
微服务引擎
函数服务
使用流程
流畅的使用体验
获取1v1专家支持
01
创建实例
创建资源相互隔离的网关实例。
02
创建服务
服务是路由对外暴露的入口。
03
创建上游服务
将相同的后端服务抽象为一个 Upstream。
04
创建路由
将请求转发到一个或多个 Upstream。
05
监控与运维
监控网关实例和服务的性能是否符合预期。
使用指南
欢迎查看使用指南
产品介绍
API 网关(API Gateway,APIG)是基于云原生、高扩展、高可用的云上网关托管服务,现已成为生产级 AI 服务必备组件。提供智能路由、多协议支持及 AI 模型代理能力。内置多种 AI 插件,结合弹性伸缩、认证鉴权及灰度发布,保障 AI 服务高效稳定运行。
什么是 API 网关?
产品优势
产品功能
应用场景
基本概念
地域和可用区
基础操作
实例管理
服务管理
路由管理
Upstream 管理
AI 网关
什么是 AI 网关
AI 多模型代理
API Key 认证
插件管理
限流插件
HMAC 插件
IP 黑白名单插件
Key Auth 插件
实践教程
使用 API 网关发布容器服务集群中部署的应用
使用 API 网关发布微服务引擎注册中心管理的应用
使用 API 网关发布云服务器中部署的应用
使用 API 网关发布函数服务中的函数
一键启动火山引擎之旅
联系我们