文档中心

机器学习平台

请输入

实验管理

概述

机器学习的用户在平台上进行模型训练的最终目的是，希望通过调整参数，配置或者模型结构等，以得到一个在各种指标上都表现较好的模型。开发模型的用户会设定测评指标，在每一次训练后，观察评估本次训练的成果，并根据模型表现和模型预测结果，进行相应调整。多次训练后，不同的模型数据和表现会被汇总，进行横向对比，并整理成实验报告，以便选择表现较好的模型进行上线。

以下是实验管理模块的一些重点功能介绍：

1 完整记录训练过程

通过log语句记录一次完整的训练过程，以便观察各项指标随训练进程的变化趋势。目前支持scalar，histogram，多媒体（图片，音频，视频）展示，默认以step为横轴也可自定义横轴（如epochs）

2 横向对比训练效果

以实验项目为单位，支持用户对同一模型的多次训练进行对比，以便找到最优超参组合。目前支持记录每次实验的config（参数项）和summary（指标项），以及各项数据伴随step的变化图表。

3 丰富的可视化图表和数据

以实验为单位，支持用户自行对实验中的各项数据进行记录，包括文本，图片，音频和视频。用户可根据需求，将丰富的图表类型按step记录，或者定义为二维表格进行展示。
如图，我们演示了自定义表格的展示效果。

4 开放性记录方式

平台的SDK在使用上和Weights&Biases兼容，对以下最常用的3种记录语句实现了0代码修改的无缝切换：

wandb.config — track hyperparameters and metadata
wandb.summary - track experiment results and performance metrics
wandb.log — log metrics and media over time within your training loop

平台也同步支持Tensorboard的主要指标记录：

wandb.init(project="demo-sync-tb", sync_tensorboard=True)

后续，我们还会根据用户的使用场景进行语句拓展，以及更多实验记录工具的兼容。

最近更新时间：2023.09.05 10:54:50

这个页面对您有帮助吗？

有用

无用

机器学习平台

1 完整记录训练过程 #

2 横向对比训练效果 #

3 丰富的可视化图表和数据 #

4 开放性记录方式 #

1 完整记录训练过程

2 横向对比训练效果

3 丰富的可视化图表和数据

4 开放性记录方式