You need to enable JavaScript to run this app.
导航
典型场景3【模型部署】开源模型部署
最近更新时间:2025.12.16 11:47:35首次发布时间:2025.04.21 16:40:02
复制全文
我的收藏
有用
有用
无用
无用

说明

以客户使用Jeddak AICC提供的【开源模型】发布部署到AICC机密容器后,完成模型服务部署,进一步提供推理接口供模型推理联调测试

整体流程说明

开源模型发布与部署

步骤1:模型发布

  • 进入【模型管理服务】模块,点击「发布模型」;
  • 切换「模型类型」为“开源模型”,字段填写如下:
    • 填写模型名称,自定义;
    • 模型版本,自定义;
    • 模型描述,自定义;
    • 选择开源模型后,点击「确定」完成发布。

步骤2:模型部署

  • 进入【模型管理服务】模块,选择刚刚已发布且处于【待部署】状态的模型所在列,点击「部署」按钮,
  • 选择AICC规格、推理框架和实例个数等,AICC将根据默认参数进行部署。

AICC规格

说明

基础版

支持小尺寸的模型,如1.5B,具体以实际验证为准。

高级版

支持中尺寸的模型,如32B,具体以实际验证为准。

旗舰版

支持大尺寸的模型,如DeepSeek R1-671B(满血版),具体以实际验证为准。

Image

  • 部署成功后,可看到模型部署状态变化,如下图:

Image

步骤3:模型测试

  • 进入【模型管理服务】模块,选择刚刚已部署成功的模型所在列,点击「测试」按钮,对模型可用性做检测,检测通过则状态从【未测试】更新为【测试成功】。
    Image

推理服务联调

步骤1:终端服务绑定终端节点

说明

终端服务:是创建机密容器时自动创建的服务;
终端节点:需要用户手动创建的终端节点,并绑定终端服务。
效果
把机密容器作为后端服务绑定到终端节点上,即可通过终端节点访问机密容器。

  1. 在 机密容器管理列表页,复制【终端服务】名称,并点击「绑定」按钮,跳转到创建终端节点页面。
    Image
  2. 配置终端节点信息,完成终端服务与终端节点的绑定。
    Image
  • 网络配置-私有网络选择前置条件中建立的私有网络,并选择相应的可用区下的子网

  • 网络配置-安全组需要配置新的访问规则,放通最终访问机密容器服务所需的端口范围

  • 配置完毕,点击立即购买

步骤2:获取终端节点IP

  • 进入 机密容器服务模块,点击终端节点名称,跳转到终端节点详情页

Image

  • 点击可用区与网卡页签,记录终端节点的IP地址

Image

步骤3:推理服务测试

说明

在火山账号下创建一个ecs (velinux)并按照如下方式进行模型服务测试;
IP: 参考步骤2
model_name:与上面脚本自定义模型名称保持一致;

  • 测试接口

    export ip={替换为你的模型服务地址}
    export model_name={替换为合适的模型名称}
    python3 completion_plain.py
    
  • 正式接口

    {
      "ra_url": "open.volcengineapi.com",
      "ra_service_name": "替换成机密容器界面的service-name",
      "ra_policy_id": "9eb6b259-a3fe-580c-90c5-ef20a92309c8",
      "ra_uid": "替换成自己火山账号的uid",
      "bytedance_top_info": "{\"ak\": \"按照实际情况填写\", \"sk\": \"按照实际情况填写\", \"service\": \"pcc\"}",
      "attest_interval": 3600
    }
    
    • 执行以下命令
    export ip={替换为你的模型服务地址}
    export model_name={替换为合适的模型名称}
    python3 completion_cipher.py