创建精调任务
入口与核心步骤
- 在 模型精调 页面,点击左上角 创建精调任务 按钮。
- 按照控制台提示,完成基本信息、训练方式、数据配置、训练配置、数据安全等配置,平台会根据配置预估本次精调的算力费用。
- 确认信息无误后,提交精调任务。
核心步骤说明
训练方式
- 训练类型(必选):支持类型以及对应详情请参见选择精调类型。
- 模型选择(必选):根据训练类型不同,支持的基础模型列表会有差异,详情请参见选择模型。
选择完模型后,控制台会出现训练方法的选项,包括LoRA和全量训练(支持的训练方法会有差异,以控制台为准)。
- 强化学习配置(训练类型为GRPO/PPO时需配置):
- Rollout函数(条件必选):
- 奖励规则(条件必选):
- 可以选择“预置函数”和“自定义函数”。
- 预置函数中包含了几种常用的奖励规则函数,具体请参见控制台描述。
- 您也可以选择自定义函数,通过Python代码的方式编写规则。
- 点击 添加新函数 ,输入函数名称。
- 在
reward.py中编辑自定义函数,完成后可以点击上方的 安装依赖 按钮准备好函数运行环境。点击 下一步:代码发布 ,进入代码发布页面。 - 代码创建完成后,可以进行 测试、日志查看等操作,点击 完成 结束函数创建。
- 支持添加多个奖励规则(包括预置函数和自定义函数)并赋予权重,计算奖励时加权求和得到最终奖励值。共支持添加5个规则,预置奖励函数可多次添加。
数据配置
- 训练集:控制台支持 本地上传数据集文件、从TOS中导入,或选择已经上传的数据集。
- 混入预置数据集:在用户上传的训练集数据中混入豆包模型的SFT数据,此功能可能产生额外训练费用。
- 验证集:与训练集一起计算总 tokens ,若验证集选择从训练集中按比例分割,则不会增加总 tokens。
- 数据安全:支持平台默认密钥 或 自定义密钥。其中自定义密钥将在火山 KMS 产品管理私有密钥,计费参见密钥管理计费说明。
训练费用
- 计费方式有 按 token 后付费 或者 按算力付费
- 不同训练训练方法支持的计费模式不同,请以控制台显示为准。
- 计费方式信息请参见精调计费;计费单价信息请参见模型精调。
查看精调任务详情
创建完成的任务,可在 模型精调 页面的精调任务列表中查看。
- 任务右侧提供了“终止任务”功能;如果任务已完成,则提供“导出模型”功能。
- 在最后侧的「...」按钮中提供了“复制任务”和“删除”功能。

点击精调任务名称,进入任务详情页,可查看任务概览、效果指标、日志、时间线、模型产出、精调安全审计等信息。下面将对其中关键信息进行说明。
概览信息

效果指标
您可点击右上角下载按钮,导出效果指标信息;点击平滑模式,对效果指标进行平滑设置。

查看日志
点击「日志」栏,可以查看当前精调任务的「训练日志」信息。
训练日志包括任务生命周期信息,训练进度,训练指标等信息。在任务启动后,您可以通过查看训练日志来确认任务是否正常启动;在训练过程中,您可监控训练进度以及是否有异常失败等等信息。
安全审计信息
精调安全审计页面提供安全状态监控与行为审计功能,降低精调过程中的潜在风险,详情请参见控制台-精调安全审计。