You need to enable JavaScript to run this app.
导航
典型场景3【模型部署】开源模型部署
最近更新时间:2025.06.12 17:02:09首次发布时间:2025.04.21 16:40:02
我的收藏
有用
有用
无用
无用

说明

以客户使用Jeddak AICC提供的【开源模型】发布部署到AICC机密容器后,完成模型服务部署,进一步提供密文接口供模型推理联调测试

整体流程说明

Image

开源模型发布与部署

步骤1:模型发布

  • 进入【模型管理服务】模块,点击「发布模型」;
  • 切换「模型类型」为“开源模型”,字段填写如下:
    • 填写模型名称,自定义;
    • 模型版本,自定义;
    • 模型描述,自定义;
    • 选择开源模型后,点击「确定」完成发布。

步骤2:模型部署

  • 进入【模型管理服务】模块,选择刚刚已发布且处于【待部署】状态的模型所在列,点击「部署」按钮,
  • 选择AICC规格、推理框架和实例个数等,AICC将根据默认参数进行部署。

AICC规格

说明

基础版

支持小尺寸的模型,如1.5B,具体以实际验证为准。

高级版

支持中尺寸的模型,如32B,具体以实际验证为准。

旗舰版

支持大尺寸的模型,如DeepSeek R1-671B(满血版),具体以实际验证为准。

Image

  • 部署成功后,可看到模型部署状态变化,如下图:

Image

步骤3:模型测试

  • 进入【模型管理服务】模块,选择刚刚已部署成功的模型所在列,点击「测试」按钮,对模型可用性做检测,检测通过则状态从【未测试】更新为【测试成功】。
    Image

推理服务联调

说明

在火山账号下创建一个ecs (velinux)并按照如下方式进行模型服务测试;
IP:参考2.获取服务终端节点IP
model_name:与上面脚本自定义模型名称保持一致;

  • 明文接口

    export ip={替换为你的模型服务地址}
    export model_name={替换为合适的模型名称}
    python3 completion_plain.py
    
  • 密文接口

    {
      "ra_url": "open.volcengineapi.com",
      "ra_service_name": "替换成机密容器界面的service-name",
      "ra_policy_id": "9eb6b259-a3fe-580c-90c5-ef20a92309c8",
      "ra_uid": "替换成自己火山账号的uid",
      "bytedance_top_info": "{\"ak\": \"按照实际情况填写\", \"sk\": \"按照实际情况填写\", \"service\": \"pcc\"}",
      "attest_interval": 3600
    }
    
    • 执行以下命令
    export ip={替换为你的模型服务地址}
    export model_name={替换为合适的模型名称}
    python3 completion_plain.py