托管 Prometheus 提供多种类型的预置看板,方便您查看监控信息。本文为您介绍预置看板的分类和使用方式。
预置看板
集群监控
看板名称 | 看板说明 |
---|
vke-cluster-dashboard | 集群监控概览看板,展示了集群整体的监控信息。包括:节点信息、内存信息、CPU 信息、磁盘信息等。 |
vke-namespace-dashboard | 集群命名空间监控看板,展示了集群命名空间的监控信息。包括:命名空间工作负载、资源使用信息。 |
核心组件监控
看板名称 | 看板说明 |
---|
vke-apiserver-dashboard | kube-apiserver 组件的监控看板,展示了该控制面组件的监控信息。包括:APIServer QPS、读请求成功率、写请求成功率、请求延迟等。 |
vke-etcd-dashboard | ETCD 组件的监控看板,展示了该控制面组件的监控信息。包括:has leader、Backend commit 平均时延 [P90]、Proposal failed、Proposal pending 等。 |
vke-scheduler-dashboard | kube-scheduler 组件的监控看板,展示了该控制面组件的监控信息。包括:存活的调度器实例、处于 Pending Phase 的 Pods 数、请求 APIServer 的 P90 时延等。 |
vke-ca-dashboard | cluster-autoscaler 组件的监控看板,展示了该控制面组件的监控信息。包括:集群伸缩状态、是否处于缩容冷却、最近检查扩容时间、弹性伸缩耗时 [P99] 等。 |
节点监控
看板名称 | 看板说明 |
---|
vke-node-dashboard | 集群节点监控看板,展示了集群指定节点的监控信息,包括:节点内存信息、节点 CPU 信息、节点磁盘信息、节点网络信息。 |
工作负载监控
看板名称 | 看板说明 |
---|
vke-pod-dashboard | 容器组监控看板,展示了指定命名空间下容器组(Pod)的监控信息。包括:Pod 内存、Pod CPU、Pod 磁盘、Pod 网络等。 |
vke-container-dashboard | 容器监控看板,展示了指定命名空间下容器(Container)的监控信息,包括:容器资源、容器信息。 |
网络服务监控
看板名称 | 看板说明 |
---|
vke-core-dns-dashboard | core-dns 监控看板,展示了集群中所有或指定 core-dns 实例的监控信息,包括:DNS 请求、DNS 错误率、DNS 转发、DNS 缓存命中率、请求响应延时(P90)、转发请求响应延时(P90)等。 |
vke-local-dns-dashboard | node-local-dns 监控看板,展示了所有或指定 node-local-dns 实例的监控信息,包括:DNS 请求、DNS 错误率、DNS 转发、DNS 缓存命中率、请求响应延时(P90)、转发请求响应延时(P90)等。 |
vke-ingress-dashboard | ingress 监控看板,展示了集群中 ingress 实例的监控信息,包括:ingress 网络信息、ingress 资源信息。 |
存储服务监控
看板名称 | 看板说明 |
---|
vke-pvc-dashboard | 集群存储服务看板,展示了集群中的存储卷声明的监控信息。包括:容量使用率、inode 使用率。 |
GPU 监控
看板名称 | 看板说明 |
---|
vke-pod-gpu-dashboard | 容器组 GPU 监控看板,展示了容器组级别的 GPU 监控信息,包括:GPU 使用率、GPU 显存使用率、GPU 显存用量等。 |
vke-instance-gpu-dashboard | GPU 实例监控看板,展示了 GPU 卡级别的 GPU 监控信息,包括:GPU 利用率、GPU 使用显存、GPU 温度、GPU 功耗、GPU 解码器利用率、GPU 编码器利用率等。 |
vke-cluster-gpu-dashboard | 集群 GPU 监控看板,展示了集群级别的 GPU 监控信息,包括:集群总 GPU 数、已分配 GPU 数、已使用 GPU 数、集群 GPU 分配率等。 |
镜像加速服务监控
看板名称 | 看板说明 |
---|
vke-p2p-dashboard | P2P 镜像加速功能看板,展示了该功能的监控信息。包括:代理请求总次数、当前代理请求总次数、任务总个数、失败的任务总个数、分片的总个数等。 |
vke-nydus-dashboard | 镜像懒加载(Nydus)功能看板,展示了该功能的监控信息。包括:Nydus Daemon 数量、Nydus Daemon 内存用量等。 |
基础操作
数据接入
使用看板前,您需要保证监控数据已经正确接入托管 Prometheus 工作区,并配置了正确的采集规则。
选择数据源
使用看板时,您需要选择正确的数据源,即工作区。
- 登录 VMP 服务控制台。
- 在顶部导航栏,选择目标地域。
- 单击左侧导航栏的 监控看板,进入监控看板页面。
- 在 监控看板 右上角的 工作区 下拉菜单中,选择工作区。
配置数据时间段
在 监控看板 右上角的菜单栏中,配置看板的时间区间。支持预定义区间(过去 30 分钟、过去 1 小时、过去 6 小时等)或通过自定义开始时间和结束时间,实现自定义查询时间。
配置刷新方式
看板支持手动刷新或自动刷新,其中,自动刷新支持多种预置时间段(每隔 1 min 刷新、每隔 5 min 刷新等)。在 监控看板 右上角的菜单栏中,配置看板的刷新方式。