当前模型精调支持上传或导入jsonl格式数据集文件,以下为详细格式说明。
格式示例:
{"messages": [{"role": "user", "content": "孤灯照不寐,风雨满西林。下一句是?"}, {"role": "assistant", "content": "多少关心事,书灰到夜深。"}]} {"messages": [{"role": "system", "content": "请根据古诗内容,仅回复作者的名字。"}, {"role": "user", "content": "孤灯照不寐,风雨满西林。多少关心事,书灰到夜深。"}, {"role": "assistant", "content": "李群玉", "loss_weight": 1.0}]}
下载样例文件
格式说明:
每行一条JSON格式的数据:
说明
特别说明:如希望提升模型的Function Calling能力,需选择支持Function Calling训练的模型并提供包含Function Calling格式数据的训练集用于精调,具体模型和格式可参考精调。
格式示例:
{"query":"乐清市珍俊服装店","docs":[{"text":"标题:先跪着把钱挣了.才能站着做选择.一定要好好赚钱.人这一生.","label":0},{"text":"标题:看来彩礼是要高了些..CCC#服装人#抖音助手#做个快乐的女孩#实体店#穿搭#实体王府大酒店","label":1},{"text":"标题:最近很喜欢一段话:照顾好自己的健康和情绪,这场人生,你就赢了一大半,其余的其余,人生自有","label":0}]}
下载样例文件
格式说明:
每行一条JSON格式的数据:
基础格式
支持两个回答正负例的偏好对比学习
{ "messages": [ { "role": "system", "content":"This is a system" }, { "role": "user", "content": "What your name?" }, { "role": "assistant", "content": "My name is doubao." }, { "role": "user", "content": "How to learn Python?" }, { "role":"assistant", "chosen": "It's so easy. First, you need to learn Python syntax...", "rejected":"Check python doc yourself" } ] }
下载样例文件
格式说明:
每行一条JSON格式的数据:
高级格式
{ "messages": [ { "role": "system", "content": [ { "text": "This is a system" } ] }, { "role": "user", "content": [ { "text": "What your name?" } ] }, { "role": "assistant", "content": [ { "text": "My name is doubao." } ] }, { "role": "user", "content": [ { "text": "How to learn Python?" } ] }, { "role": "assistant", "content": [ { "text": "I don't know!", "score": 0.5 }, { "text": "Check python doc yourself", "score": 0.1 }, { "text": "It's so easy. First, you need to learn Python syntax...", "score": 1, "lm_loss_mask": 1 } ], "loss_weight": 1 } ] }
dpo.yaml
高级格式支持提供多个模型回复列表,通过 score 来指定对回复的偏好。训练过程将根据 score 的大小自动生成两两对比的偏序对进行训练,注意:score 相同的两个回复不会生成相应的偏序对。
格式说明:
每行一条JSON格式的数据:
格式示例:
{"text":"火山引擎机器学习平台是面向机器学习应用开发者,提供【开发机】和【自定义训练】等丰富建模工具、多框架高性能模型推理服务的企业级开发平台,支持从数据托管、代码开发、模型训练、模型部署的全生命周期工作流。"} {"text":"支持运行超大规模的分布式任务,包含多种预置算法框架和自定义算法框架。提供稳定、灵活、高性能的机器学习训练环境。"} {"text":"支持多种框架的模型在异构硬件上的一键部署,具有高吞吐、低延时、实时扩缩容等特点,使推理服务更具弹性和容错性。"}
下载样例文件
格式说明:
每行一条JSON格式的数据: