You need to enable JavaScript to run this app.
导航
创建并查看模型精调任务
最近更新时间:2025.11.06 14:51:13首次发布时间:2023.06.27 23:50:07
复制全文
我的收藏
有用
有用
无用
无用

创建精调任务

入口与核心步骤

  1. 模型精调 页面,点击左上角 创建精调任务 按钮。
  2. 按照控制台提示,完成基本信息、训练方式、数据配置、训练配置、数据安全等配置,平台会根据配置预估本次精调的算力费用。
  3. 确认信息无误后,提交精调任务。

核心步骤说明

训练方式

  • 训练类型(必选):支持类型以及对应详情请参见选择精调类型
  • 模型选择(必选):根据训练类型不同,支持的基础模型列表会有差异,详情请参见选择模型

选择完模型后,控制台会出现训练方法的选项,包括LoRA和全量训练(支持的训练方法会有差异,以控制台为准)。

  • 强化学习配置(训练类型为GRPO/PPO时需配置):
    • Rollout函数(条件必选)
      • 单轮模型推理:根据样本进行一轮推理后直接打分。
    • 奖励规则(条件必选)
      • 可以选择“预置函数”和“自定义函数”。
        1. 预置函数中包含了几种常用的奖励规则函数,具体请参见控制台描述。
        2. 您也可以选择自定义函数,通过Python代码的方式编写规则。
          1. 点击 添加新函数 ,输入函数名称。
          2. reward.py中编辑自定义函数,完成后可以点击上方的 安装依赖 按钮准备好函数运行环境。点击 下一步:代码发布 ,进入代码发布页面。
          3. 代码创建完成后,可以进行 测试、日志查看等操作,点击 完成 结束函数创建。
      • 支持添加多个奖励规则(包括预置函数和自定义函数)并赋予权重,计算奖励时加权求和得到最终奖励值。共支持添加5个规则,预置奖励函数可多次添加。

数据配置

  • 训练集:​控制台支持 本地上传数据集文件、从TOS中导入,或选择已经上传的数据集。
  • 混入预置数据集:在用户上传的训练集数据中混入豆包模型的SFT数据,此功能可能产生额外训练费用。
  • 验证集:与训练集一起计算总 tokens ,若验证集选择从训练集中按比例分割,则不会增加总 tokens。
  • 数据安全:​支持平台默认密钥 或 自定义密钥。其中自定义密钥将在火山 KMS 产品管理私有密钥,计费参见密钥管理计费说明

训练费用

  • 计费方式有 按 token 后付费 或者 按算力付费
  • 不同训练训练方法支持的计费模式不同,请以控制台显示为准。
  • 计费方式信息请参见精调计费;计费单价信息请参见模型精调
  • 训练费用预估数据仅供参考,具体费用以账单为准。

查看精调任务详情

创建完成的任务,可在 模型精调 页面的精调任务列表中查看。

  • 任务右侧提供了“终止任务”功能;如果任务已完成,则提供“导出模型”功能。
  • 在最后侧的「...」按钮中提供了“复制任务”和“删除”功能。

Image
点击精调任务名称,进入任务详情页,可查看任务概览、效果指标、日志、时间线、模型产出、精调安全审计等信息。下面将对其中关键信息进行说明。

概览信息

Image

效果指标

您可点击右上角下载按钮,导出效果指标信息;点击平滑模式,对效果指标进行平滑设置。
Image

查看日志

点击「日志」栏,可以查看当前精调任务的「训练日志」信息。

  • 训练日志

训练日志包括任务生命周期信息,训练进度,训练指标等信息。在任务启动后,您可以通过查看训练日志来确认任务是否正常启动;在训练过程中,您可监控训练进度以及是否有异常失败等等信息。

安全审计信息

精调安全审计页面提供安全状态监控与行为审计功能,降低精调过程中的潜在风险,详情请参见控制台-精调安全审计