You need to enable JavaScript to run this app.
导航
mGPU 常见指标
最近更新时间:2023.04.27 11:00:37首次发布时间:2022.12.12 15:45:24

mGPU 是火山引擎基于内核虚拟化隔离 GPU 并结合自研调度框架提供的容器共享 GPU 方案。本文介绍 mGPU 方案中的常见查询指标。

指标名称含义
nvml_pod_core_requestPod 的 mGPU 算力请求量(单位:毫核)
nvml_pod_core_usagePod 的 mGPU 算力使用量(单位:毫核)
nvml_pod_mem_requestPod 的 mGPU 显存请求量(单位:MiB)
nvml_pod_mem_usagePod 的 mGPU 显存使用量(单位:MiB)
nvml_pod_mem_utilizationPod 的 mGPU 显存利用率(单位:%)
nvml_container_core_request容器的 mGPU 算力请求量(单位:毫核)
nvml_container_core_usage容器的 mGPU 算力使用量(单位:毫核)
nvml_container_mem_request容器的 mGPU 显存请求量(单位:MiB)
nvml_container_mem_usage容器的 mGPU 显存使用量(单位:MiB)
nvml_container_mem_utilization容器的 mGPU 显存利用率(单位:%)