You need to enable JavaScript to run this app.
导航

使用托管 Prometheus 监控 VCI

最近更新时间2024.03.06 14:16:30

首次发布时间2023.12.25 16:07:53

VCI 基于托管 Prometheus 服务(VMP)对 VCI 实例进行基础监控。本文主要介绍配置 VCI 监控指标采集规则和查询指标信息的方法。

前提条件

配置监控采集规则

当您将 VPC-CNI 集群正确接入托管 Prometheus,并安装了对应的组件后,需要配置对应的采集规则,才能正确采集指标。下文主要描述 VCI 场景下配置监控采集规则的方法,详细的操作步骤和说明,请参见 采集规则

  1. 登录 容器服务控制台
  2. 在左侧导航栏中选择 集群
  3. 在集群列表页面,单击目标集群。
  4. 在集群管理页面的左侧导航栏中,选择 监控中心 > 监控看板
  5. 在配置页面右上角,单击 指标采集配置
  6. 在 数据面组件 和 控制面组件 页签中的组件列表 是否采集 列,开启所需指标对应组件的开关,并在对应 操作 列下单击 编辑指标,控制采集指标的范围。

    说明

    VCI 实例支持的监控指标,请参见 通过虚拟节点获取 VCI 监控指标VCI GPU 监控指标

    alt
  7. 单击 确定,完成配置。

查询监控指标

配置好监控采集规则后,可在托管 Prometheus 控制台查询 VCI 实例监控指标。详细的操作,请参见 指标查询

  1. 登录 VMP 服务控制台
  2. 在顶部导航栏,选择目标地域。
  3. 单击左侧导航栏的 Explore,进入 Explore 页面。
  4. 在右上角的配置项中,配置需要查询指标的 工作区查询时间段 和 数据刷新方式
  5. 使用 PromQL 查询语句查询 VCI 实例指标。
    • 通过虚拟节点查询 VCI 指标:$指标名称{node="$虚拟节点名称"},例如container_cpu_usage_seconds_total{node="vci-node1-cn-beijing-a"}
    • 查询 VCI GPU 指标:$指标名称{pod="$VCI 实例名称"},例如DCGM_FI_DEV_DEC_UTIL{pod="vci-ini2-d75d77bc5-82lch"}
  6. 单击 查询,即可查询相关的指标,并显示指标大盘。