You need to enable JavaScript to run this app.
导航

mgpu

最近更新时间2024.04.23 20:25:23

首次发布时间2022.11.25 18:47:26

mgpu 组件是容器服务提供的共享 GPU 组件,通过实现容器间显存、算力隔离,支持多个容器间共享 GPU 卡。本文主要介绍 mgpu 组件的变更记录。

更多组件相关介绍和使用方法,请参见 组件管理

说明

邀测·申请试用】:该组件目前处于邀测阶段,如需使用,请提交申请。

2024.03

版本号版本状态变更内容变更影响
v0.5.0维护中Pod 独占整卡时,卡级别指标添加 Pod 相关 Label。

2023.11

版本号版本状态变更内容变更影响
v0.4.2维护中支持 mem_copy_util 指标。

2023.09

版本号版本状态变更内容变更影响
v0.4.1维护中优化 exporter 监听资源的逻辑。

2023.08

版本号版本状态变更内容变更影响
v0.4.0维护中组件参数命名规范化。

2023.06

推荐选择合适时机升级组件,方便后续功能使用。

版本号版本状态变更内容变更影响

v0.3.0

维护中

  • 支持向节点输出 mgpu version label。
  • 集成 mGPU 驱动安装功能,支持用户选择性安装 mGPU 驱动。
  • 用户新建节点池场景必须升级版本到 v0.3.0 版本,以便正常安装 mGPU 驱动和使用 mGPU 功能。
  • 存量 GPU 节点池在没有变配、没有刷新初始化脚本的情况下可以正常使用,扩容节点不受影响。

2023.03

版本号版本状态变更内容变更影响
v0.2.0停止维护支持多卡共享及配套监控。

2023.01

版本号版本状态变更内容变更影响
v0.1.1停止维护支持 mgpu-driver 健康检查。

2022.11

版本号版本状态变更内容变更影响

v0.0.3

停止维护

  • 允许自定义安装共享 GPU 资源监控插件 mgpu-exporter。
  • 支持配置算力分配策略 QoS Policy。

2022.10

版本号版本状态变更内容变更影响
v0.0.2停止维护优化 mGPU 组件与非 GPU 节点的调度关系。

2022.09

版本号版本状态变更内容变更影响
v0.0.1停止维护mGPU 组件首次邀测发布。