- 文档首页
机器学习平台
产品动态
平台发布记录
Release Notes 2024.8
平台发布记录
Release Notes 2024.8
Release Notes 2024.8
2024年8月
- 涉及地域:若无特别说明,以下功能都会在 华北2(北京)、华北3(北京2)、华东4(大同)、华东2(上海)、华南1(广州)、亚太东南(柔佛) 几个地域发布。
功能 | 说明 | 开放状态 | 相关文档 |
|---|
推理服务支持7层负载均衡APIG | - 提供7层负载均衡器能力,实现 HTTP2、GRPC 等多种协议。
- 支持监控QPS、响应时间、错误码等数据。
| 基于多部署使用 | |
自定义训练任务支持多机诊断 | 在自定义任务时,支持校验GPU设备和机内带宽(NVLink和PCIe)是否正常,同时对机器之间的RDMA网卡通信和交换机的连通性也做检查。需注意只支持HPC规格。 | 全量开放 | |
TensorBoard 服务升级 | - 自定义任务支持开启 TensorBoard 服务并发起对比实验。
- 用户可以自定义设置 TensorBoard Logs 存储位置,将实验数据存储在 vePFS 或者 NAS。
- 使用该功能时,选择的 vePFS 实例需要处于运行中状态,且选择的 vePFS 实例的 VPC 与资源组的存储VPC 一致。
- 对比任务所在资源组的存储 VPC 需要一致,否则无法发起对比实验。
| 全量开放 | |
最近更新时间:2025.05.28 14:36:41