本文介绍管理模型单元相关的操作,包括调整数量、续费、退订、修改弹性规则、切换模型版本等。
调整数量/续费/退订
- 访问方舟控制台-在线推理,切换到自定义推理接入点页签。
- 单击目标接入点名称,进入接入点概览页。在算力保障区域,根据需要对模型单元进行调整数量、续费或退订。

注意
- 模型单元是按实例组购买的,接入点名称详情中复制的模型单元 ID 是实例组 ID,实例组存在强绑定关系,因此续费、退订须同步发起。
- 请注意,未到期的模型单元退订会产生惩罚系数,无法 100%退费。
修改弹性规则
对于按小时后付费的模型单元,支持在接入点详情页修改弹性规则。
- 访问方舟控制台-在线推理,切换到自定义推理接入点页签。
- 单击目标接入点名称,进入接入点概览页。在算力保障区域,单击 调整,修改后付费模型单元的弹性规则。
切换模型版本
模型单元支持在同一基座模型、相同精度的可部署版本之间切换;请注意,若您当前使用的是平台精调后模型,暂时仅支持全量精调产物之间的切换。
注意
建议选择流量低峰期切换版本,以减少对业务的潜在影响。
- 访问方舟控制台-在线推理,切换到自定义推理接入点页签。
- 单击目标接入点名称,进入接入点概览页。在基本信息区域,单击接入模型右侧的 切换版本,选择要切换的版本。
- 确认所选版本无误后,单击 确认切换,系统将开始滚动更新。
算力保障分析
支持在接入点详情页面的 算力保障分析 区域,观测模型单元的用量情况。