You need to enable JavaScript to run this app.
导航

看板概述

最近更新时间2023.12.14 15:02:39

首次发布时间2023.11.17 15:31:30

托管 Prometheus 提供多种类型的预置看板,方便您查看监控信息。本文为您介绍预置看板的分类和使用方式。

预置看板

集群监控

看板名称看板说明
vke-cluster-dashboard集群监控概览看板,展示了集群整体的监控信息。包括:节点信息、内存信息、CPU 信息、磁盘信息等。
vke-namespace-dashboard集群命名空间监控看板,展示了集群命名空间的监控信息。包括:命名空间工作负载、资源使用信息。

核心组件监控

看板名称看板说明
vke-apiserver-dashboardkube-apiserver 组件的监控看板,展示了该控制面组件的监控信息。包括:APIServer QPS、读请求成功率、写请求成功率、请求延迟等。
vke-etcd-dashboardETCD 组件的监控看板,展示了该控制面组件的监控信息。包括:has leader、Backend commit 平均时延 [P90]、Proposal failed、Proposal pending 等。
vke-scheduler-dashboardkube-scheduler 组件的监控看板,展示了该控制面组件的监控信息。包括:存活的调度器实例、处于 Pending Phase 的 Pods 数、请求 APIServer 的 P90 时延等。
vke-ca-dashboardcluster-autoscaler 组件的监控看板,展示了该控制面组件的监控信息。包括:集群伸缩状态、是否处于缩容冷却、最近检查扩容时间、弹性伸缩耗时 [P99] 等。

节点监控

看板名称看板说明
vke-node-dashboard集群节点监控看板,展示了集群指定节点的监控信息,包括:节点内存信息、节点 CPU 信息、节点磁盘信息、节点网络信息。

工作负载监控

看板名称看板说明
vke-pod-dashboard容器组监控看板,展示了指定命名空间下容器组(Pod)的监控信息。包括:Pod 内存、Pod CPU、Pod 磁盘、Pod 网络等。
vke-container-dashboard容器监控看板,展示了指定命名空间下容器(Container)的监控信息,包括:容器资源、容器信息。

网络服务监控

看板名称看板说明
vke-core-dns-dashboardcore-dns 监控看板,展示了集群中所有或指定 core-dns 实例的监控信息,包括:DNS 请求、DNS 错误率、DNS 转发、DNS 缓存命中率、请求响应延时(P90)、转发请求响应延时(P90)等。
vke-local-dns-dashboardnode-local-dns 监控看板,展示了所有或指定 node-local-dns 实例的监控信息,包括:DNS 请求、DNS 错误率、DNS 转发、DNS 缓存命中率、请求响应延时(P90)、转发请求响应延时(P90)等。
vke-ingress-dashboardingress 监控看板,展示了集群中 ingress 实例的监控信息,包括:ingress 网络信息、ingress 资源信息。

存储服务监控

看板名称看板说明
vke-pvc-dashboard集群存储服务看板,展示了集群中的存储卷声明的监控信息。包括:容量使用率、inode 使用率。

GPU 监控

看板名称看板说明
vke-pod-gpu-dashboard容器组 GPU 监控看板,展示了容器组级别的 GPU 监控信息,包括:GPU 使用率、GPU 显存使用率、GPU 显存用量等。
vke-instance-gpu-dashboardGPU 实例监控看板,展示了 GPU 卡级别的 GPU 监控信息,包括:GPU 利用率、GPU 使用显存、GPU 温度、GPU 功耗、GPU 解码器利用率、GPU 编码器利用率等。
vke-cluster-gpu-dashboard集群 GPU 监控看板,展示了集群级别的 GPU 监控信息,包括:集群总 GPU 数、已分配 GPU 数、已使用 GPU 数、集群 GPU 分配率等。

镜像加速服务监控

看板名称看板说明
vke-p2p-dashboardP2P 镜像加速功能看板,展示了该功能的监控信息。包括:代理请求总次数、当前代理请求总次数、任务总个数、失败的任务总个数、分片的总个数等。
vke-nydus-dashboard镜像懒加载(Nydus)功能看板,展示了该功能的监控信息。包括:Nydus Daemon 数量、Nydus Daemon 内存用量等。

基础操作

数据接入

使用看板前,您需要保证监控数据已经正确接入托管 Prometheus 工作区,并配置了正确的采集规则。

选择数据源

使用看板时,您需要选择正确的数据源,即工作区。

  1. 登录 VMP 服务控制台
  2. 在顶部导航栏,选择目标地域。
  3. 单击左侧导航栏的 监控看板,进入监控看板页面。
  4. 监控看板 右上角的 工作区 下拉菜单中,选择工作区。

alt

配置数据时间段

监控看板 右上角的菜单栏中,配置看板的时间区间。支持预定义区间(过去 30 分钟、过去 1 小时、过去 6 小时等)或通过自定义开始时间和结束时间,实现自定义查询时间。
alt

配置刷新方式

看板支持手动刷新或自动刷新,其中,自动刷新支持多种预置时间段(每隔 1 min 刷新、每隔 5 min 刷新等)。在 监控看板 右上角的菜单栏中,配置看板的刷新方式。

alt