You need to enable JavaScript to run this app.
机器学习平台

机器学习平台

复制全文
平台发布记录
Release Notes 2024.8
复制全文
Release Notes 2024.8

2024年8月
  • 涉及地域:若无特别说明,以下功能都会在 华北2(北京)华北3(北京2)华东4(大同)华东2(上海)华南1(广州)亚太东南(柔佛) 几个地域发布。

功能

说明

开放状态

相关文档

推理服务支持7层负载均衡APIG

  • 提供7层负载均衡器能力,实现 HTTP2、GRPC 等多种协议。
  • 支持监控QPS、响应时间、错误码等数据。

基于多部署使用

自定义训练任务支持多机诊断

在自定义任务时,支持校验GPU设备和机内带宽(NVLink和PCIe)是否正常,同时对机器之间的RDMA网卡通信和交换机的连通性也做检查。需注意只支持HPC规格。

全量开放

TensorBoard 服务升级

  • 自定义任务支持开启 TensorBoard 服务并发起对比实验。
  • 用户可以自定义设置 TensorBoard Logs 存储位置,将实验数据存储在 vePFS 或者 NAS。
  • 使用该功能时,选择的 vePFS 实例需要处于运行中状态,且选择的 vePFS 实例的 VPC 与资源组的存储VPC 一致。
  • 对比任务所在资源组的存储 VPC 需要一致,否则无法发起对比实验。

全量开放

最近更新时间:2025.05.28 14:36:41
这个页面对您有帮助吗?
有用
有用
无用
无用