通过 NVML(NVIDIA Management Library) API 或 nvidia-smi pmon 看到的进程 SM(Stream Multi-processor)使用率和 mGPU 配置的算力比例不匹配。
说明
mGPU 功能目前处于 公测 阶段。
通过 NVIDIA 官方工具采集的 SM 利用率是指固定周期内的 SM 使用率,mGPU 配置的算力比例是指用户应用程序在整个生命周期中使用的算力资源所占比例,二者的时间维度不一致,无法等价衡量。
如需评估 mGPU 的算力隔离能力,需要通过用户应用程序包含的性能指标(如 QPS)来衡量。