本文介绍了如何通过边缘大模型网关调用您自己私有化部署的模型。
“自部署模型”指您在自己管控的算力环境中私有化部署的模型,一般通过内网或公网提供服务。“自部署模型”与“三方模型提供商模型”都属于自有三方模型,两者的区别如下表所示。
| 对比项 | 自部署模型 | 三方提供商模型 |
|---|---|---|
| 计算资源 | 您自己管控 | 模型提供商所有 |
| 模型密钥 | 您自己设置 | 模型提供商分配 |
| 访问方式 | 允许内网访问、公网访问 | 公网访问 |
对于仅支持内网访问的自部署模型,边缘大模型网关提供了基于远程访问代理的内网穿透方案。您需要在本地或局域网内服务器上运行指定的代理工具(详见步骤2),以将内网中的模型服务暴露给边缘大模型网关。
要通过边缘大模型网关调用您的自部署模型,需要完成以下配置:
将您的自部署模型添加到边缘大模型网关。
登录边缘大模型网关控制台。

模型名称:为模型设置一个显示名称。
调用名称:为模型设置一个标识符。只能使用字母、数字和下划线(_)。
说明
通过边缘大模型网关接口调用该模型时,模型调用请求中的 model 参数需传入您设置的模型标识符。
模型系列:选择模型所属系列。
提供商:仅支持 自部署模型。
模型格式:仅支持 OpenAI。
模型类型:选择模型的类型。可选项:
不同类型的模型采用不同的用量计量方式。您可以在类型选项上查看对应的计量方式(如 Chat 类型对应于 Token用量)。支持多选,但只能选择用量计量方式相同的多个类型。
当 模型类型 为 Speech(语音合成) 时,会出现 参数配置。参数配置用于定义该语音合成模型所能支持的音频规格范围。具体包含以下参数:
采样率(Hz):
您可以输入模型支持的一个或多个采样率数值。每个数值请输入一个正整数,输入后按回车键确认。最多允许配置10个不同的采样率值。
位深:
选择模型能够处理的音频位深度。仅支持16位。
通道数:
选择模型能够处理的音频通道数量。可选值:1 (单声道)、2 (立体声)。
集成方式:
指定网关在转发 HTTP 协议的自部署 TTS 模型请求时的处理逻辑。可选值:
两种集成方式各有优劣,您需要根据自部署模型的具体时延和语音合成效果来选择最适合的方案。
服务端处理逻辑说明
当客户端通过 API(具体为 session.update 事件)请求建立连接并传入其期望的音频规格参数(例如,客户端希望使用特定采样率)时,服务端会进行如下判断:
当 模型类型 为 Audio(语音识别) 时,会出现以下参数:
边缘大模型网关通过调用渠道访问您的自部署模型。为了建立这个渠道,您需要提供自部署模型的调用密钥。有了密钥,边缘大模型网关才能够顺利访问和调用自部署模型。
登录边缘大模型网关控制台。

本机服务代理:适用于模型服务部署在本地计算机,只支持内网访问。该模式表示通过代理本地模型服务实现内网穿透,使本地模型服务可通过边缘大模型网关的公网域名远程访问。
若选择该模式,
本地局域网服务代理:适用于模型服务部署在本地局域网内的某台服务器,只支持内网访问。该模式表示通过代理局域网内模型服务实现内网穿透,使局域网内模型服务可通过边缘大模型网关的公网域名远程访问。
若选择该模式,
域名代理:适用于通过公网域名访问模型服务的情形。
若选择该模式,
https://dashscope.aliyuncs.com/compatible-mode/v1。在自部署模型列表,调用渠道 数字表示一个自部署模型下已创建的调用渠道的数量。
以上操作完成后,相应自部署模型的 调用渠道 数量会增加。您可以单击 调用渠道 数字,查看和管理(如编辑、删除)自部署模型下已添加的调用渠道。

如果调用渠道中的 模型代理方式 是 本机服务代理 或 本地局域网代理,您必须在调用渠道创建成功后安装代理工具,否则边缘大模型网关无法访问您的模型。
本机服务代理 模式
参照以下步骤在本地计算机上安装并运行代理工具:
单击 调用渠道 数字。
在 调用渠道 面板,单击 本机服务代理 页签。
找到调用渠道,单击 状态 列的 获取代理工具。
在弹出的 获取代理工具 提示框,单击 复制。
在本地计算机上打开命令行工具,运行复制的命令。
等待命令运行完成,您可前往调用渠道面板查看连接 状态。当状态显示已连通,表示该调用渠道正常工作。
本地局域网服务代理 模式
参照以下步骤在模型服务所在局域网内的任意一台服务器上安装并运行代理工具:
等待命令运行完成,您可前往调用渠道面板查看连接 状态。当状态显示已连通,表示该调用渠道正常工作。
要访问边缘大模型网关 API,您需要一个网关访问密钥。通过将您的模型调用渠道绑定到一个网关访问密钥,您就可以在使用此网关访问密钥时,选择指定模型作为被调用对象。
说明
您可以在创建网关访问密钥时绑定调用渠道,也可以编辑已有网关访问密钥来绑定新的调用渠道。
登录边缘大模型网关控制台。

当您的网关访问密钥绑定了自部署模型调用渠道,您在获取此网关访问密钥对应的示例代码时,就可以选择指定模型作为被调用对象。将示例代码集成到您的业务逻辑后,您的边缘大模型网关请求将触发指定模型调用。
具体操作,请参见使用网关访问密钥。需要注意的是,当您查看示例代码时,在 选择模型 中选择您的 自部署模型。
说明
如需调用自部署语音识别(ASR)模型或语音合成(TTS)模型,推荐您使用 Realtime API。使用方法请参见以下文档:
