说明
以客户使用Jeddak AICC提供的【开源模型】发布部署到AICC机密容器后,完成模型服务部署,进一步提供推理接口供模型推理联调测试。
AICC规格 | 说明 |
|---|---|
基础版 | 支持小尺寸的模型,如1.5B,具体以实际验证为准。 |
高级版 | 支持中尺寸的模型,如32B,具体以实际验证为准。 |
旗舰版 | 支持大尺寸的模型,如DeepSeek R1-671B(满血版),具体以实际验证为准。 |
说明
终端服务:是创建机密容器时自动创建的服务;
终端节点:需要用户手动创建的终端节点,并绑定终端服务。
效果
把机密容器作为后端服务绑定到终端节点上,即可通过终端节点访问机密容器。
网络配置-私有网络选择前置条件中建立的私有网络,并选择相应的可用区下的子网
网络配置-安全组需要配置新的访问规则,放通最终访问机密容器服务所需的端口范围
需要配置的访问规则示例:
访问规则具体说明参考安全组概述--私有网络-火山引擎
如果需要新建安全组,参考创建安全组--私有网络-火山引擎
如果需要修改已有安全组的访问规则,参考管理安全组规则--私有网络-火山引擎
将配置好的安全组绑定到终端节点
配置完毕,点击立即购买
说明
在火山账号下创建一个ecs (velinux)并按照如下方式进行模型服务测试;
IP: 参考步骤2
model_name:与上面脚本自定义模型名称保持一致;
测试接口
export ip={替换为你的模型服务地址} export model_name={替换为合适的模型名称} python3 completion_plain.py
正式接口
{ "ra_url": "open.volcengineapi.com", "ra_service_name": "替换成机密容器界面的service-name", "ra_policy_id": "9eb6b259-a3fe-580c-90c5-ef20a92309c8", "ra_uid": "替换成自己火山账号的uid", "bytedance_top_info": "{\"ak\": \"按照实际情况填写\", \"sk\": \"按照实际情况填写\", \"service\": \"pcc\"}", "attest_interval": 3600 }
export ip={替换为你的模型服务地址} export model_name={替换为合适的模型名称} python3 completion_cipher.py