本文介绍了如何通过边缘大模型网关调用您自己私有化部署的模型。
“自部署模型”指您在自己管控的算力环境中私有化部署的模型,一般通过内网或公网提供服务。“自部署模型”与“三方模型提供商模型”都属于自有三方模型,两者的区别如下表所示。
对比项 | 自部署模型 | 三方提供商模型 |
---|---|---|
计算资源 | 您自己管控 | 模型提供商所有 |
模型密钥 | 您自己设置 | 模型提供商分配 |
访问方式 | 允许内网访问、公网访问 | 公网访问 |
对于仅支持内网访问的自部署模型,边缘大模型网关提供了基于远程访问代理的内网穿透方案。您需要在本地或局域网内服务器上运行指定的代理工具(详见步骤2),以将内网中的模型服务暴露给边缘大模型网关。
要通过边缘大模型网关调用您的自部署模型,需要完成以下配置:
将您的自部署模型添加到边缘大模型网关。
登录边缘大模型网关控制台。
在左侧导航栏,选择 模型配置管理 > 大模型管理。
在 自有三方模型 标签页,单击 自部署模型 标签,然后单击 添加模型。
在 添加模型 对话框,完成以下参数配置,然后单击 确定。
说明
通过边缘大模型网关接口调用该模型时,模型调用请求中的 model
参数需传入您设置的模型标识符。
边缘大模型网关通过调用渠道访问您的自部署模型。为了建立这个渠道,您需要提供自部署模型的调用密钥。有了密钥,边缘大模型网关才能够顺利访问和调用自部署模型。
登录边缘大模型网关控制台。
本机服务代理:适用于模型服务部署在本地计算机,只支持内网访问。该模式表示通过代理本地模型服务实现内网穿透,使本地模型服务可通过边缘大模型网关的公网域名远程访问。
若选择该模式,
本地局域网服务代理:适用于模型服务部署在本地局域网内的某台服务器,只支持内网访问。该模式表示通过代理局域网内模型服务实现内网穿透,使局域网内模型服务可通过边缘大模型网关的公网域名远程访问。
若选择该模式,
域名代理:适用于通过公网域名访问模型服务的情形。
若选择该模式,
https://dashscope.aliyuncs.com/compatible-mode/v1
。在自部署模型列表,调用渠道 数字表示一个自部署模型下已创建的调用渠道的数量。
以上操作完成后,相应自部署模型的 调用渠道 数量会增加。您可以单击 调用渠道 数字,查看和管理(如编辑、删除)自部署模型下已添加的调用渠道。
如果调用渠道中的 模型代理方式 是 本机服务代理 或 本地局域网代理,您必须在调用渠道创建成功后安装代理工具,否则边缘大模型网关无法访问您的模型。
本机服务代理 模式
参照以下步骤在本地计算机上安装并运行代理工具:
单击 调用渠道 数字。
在 调用渠道 面板,单击 本机服务代理 页签。
找到调用渠道,单击 操作 列的 获取代理工具。
在弹出的 获取代理工具 提示框,单击 复制。
在本地计算机上打开命令行工具,运行复制的命令。
本地局域网服务代理 模式
参照以下步骤在模型服务所在局域网内的任意一台服务器上安装并运行代理工具:
要访问边缘大模型网关 API,您需要一个网关访问密钥。通过将您的模型调用渠道绑定到一个网关访问密钥,您就可以在使用此网关访问密钥时,选择指定模型作为被调用对象。
说明
您可以在创建网关访问密钥时绑定调用渠道,也可以编辑已有网关访问密钥来绑定新的调用渠道。
登录边缘大模型网关控制台。
当您的网关访问密钥绑定了自部署模型调用渠道,您在获取此网关访问密钥对应的示例代码时,就可以选择指定模型作为被调用对象。将示例代码集成到您的业务逻辑后,您的边缘大模型网关请求将触发指定模型调用。
具体操作,请参见使用网关访问密钥。需要注意的是,当您查看示例代码时,在 选择模型 中选择您的 自部署模型。