You need to enable JavaScript to run this app.
导航

kube-state-metrics 常见指标

最近更新时间2024.04.23 15:06:40

首次发布时间2023.02.28 17:57:43

kube-state-metrics 通过监听 Kubernetes API 服务器来生成不同资源的状态的 Metrics 数据。用来获取 Kubernetes 集群中各种资源对象的组件,例如 Deployment、Daemonset、Nodes 和 Pods 等。本文为您介绍 kube-state-metrics 常见的指标。

常用查询指标

kube-state-metrics 中的常用监控查询指标,如下表所示。

分类指标名称类型含义
节点kube_node_infoGauge查询集群内所有的节点信息,可以通过 sum() 函数获得集群中的所有节点数目。
kube_node_spec_unschedulableGauge查询节点是否可以调度新的 Pod。可以通过 sum() 函数获得集群中可以调度的 Pod 总数。
kube_node_status_allocatableGauge查询节点可用于调度的资源总数。包括:CPU、内存、Pods 等。允许通过标签筛选,查看节点具体的资源容量。
kube_node_status_capacityGauge查询节点的全部资源总数,包括:CPU、内存、Pods 等。允许通过标签筛选,查看节点具体的资源容量。
kube_node_status_conditionGauge查询节点的状态,可以基于 OutOfDisk、MemoryPressure、DiskPressure 等状态找到状态不正常的节点。
Podkube_pod_infoGauge查询所有的 Pod 信息,可以通过 sum() 函数获得集群中的所有 Pod 数目。

kube_pod_status_phase

Gauge

查询所有的 Pod 启动状态。状态包括:

  • True:启动成功。

  • Failed:启动失败。

  • Unknown:状态未知。

kube_pod_status_ready

Gauge

查询所有处于 Ready 状态的 Pod。可以通过 sum() 函数获得集群中的所有 Pod 数目。

kube_pod_status_scheduledGauge查询所有处于 scheduled 状态的 Pod。可以通过 sum() 函数获得集群中的所有 Pod 数目。
容器kube_pod_container_infoGauge查询所有 Container 的信息。可以通过 sum() 函数获得集群中的所有 Container 数目。
kube_pod_container_status_readyGauge查询所有状态为 Ready 的 Container 信息。可以通过 sum() 函数获得集群中的所有 Container 数目。
kube_pod_container_status_restarts_totalCount查询集群中所有 Container 的重启累计次数。可以通过 irate() 函数获得集群中 Container 的重启率。
kube_pod_container_status_runningGauge查询所有状态为 Running 的 Container 信息。可以通过 sum() 函数获得集群中的所有 Container 数目。
kube_pod_container_status_terminatedGauge查询所有状态为 Terminated 的 Container 信息。可以通过 sum() 函数获得集群中的所有 Container 数目。
kube_pod_container_status_waitingGauge查询所有状态为 Waiting 的 Container 信息。可以通过 sum() 函数获得集群中的所有 Container 数目。
kube_pod_container_resource_requestsGauge查询容器的资源需求量。允许通过标签筛选,查看容器具体的资源需求量。
kube_pod_container_resource_limitsGauge查询容器的资源限制量。允许通过标签筛选,查看容器具体的资源限制量。

说明

其他指标详情,请参见 官网文档