说明
以客户使用Jeddak AICC提供的【开源模型】发布部署到AICC机密容器后,完成模型服务部署,进一步提供密文接口供模型推理联调测试。
AICC规格 | 说明 |
---|---|
基础版 | 支持小尺寸的模型,如1.5B,具体以实际验证为准。 |
高级版 | 支持中尺寸的模型,如32B,具体以实际验证为准。 |
旗舰版 | 支持大尺寸的模型,如DeepSeek R1-671B(满血版),具体以实际验证为准。 |
说明
在火山账号下创建一个ecs (velinux)并按照如下方式进行模型服务测试;
IP:参考2.获取服务终端节点IP;
model_name:与上面脚本自定义模型名称保持一致;
明文接口
export ip={替换为你的模型服务地址} export model_name={替换为合适的模型名称} python3 completion_plain.py
密文接口
{ "ra_url": "open.volcengineapi.com", "ra_service_name": "替换成机密容器界面的service-name", "ra_policy_id": "9eb6b259-a3fe-580c-90c5-ef20a92309c8", "ra_uid": "替换成自己火山账号的uid", "bytedance_top_info": "{\"ak\": \"按照实际情况填写\", \"sk\": \"按照实际情况填写\", \"service\": \"pcc\"}", "attest_interval": 3600 }
export ip={替换为你的模型服务地址} export model_name={替换为合适的模型名称} python3 completion_plain.py