You need to enable JavaScript to run this app.
导航

prometheus-agent

最近更新时间2024.01.19 14:39:13

首次发布时间2023.10.30 15:47:57

说明

托管 Prometheus 服务已在 2023 年 05 月 29 日开始正式收费,如您在集群中安装该组件,将会产生额外费用,详情请参见:计费方式

采集器说明

分布式云原生平台为注册的现有集群提供了 Prometheus-agent 组件作为采集器,当集群中安装 Prometheus-agent 组件时,会同时安装 vm-agent、vmoperator、kube-state-metrics 和 node-exporter 组件。每个组件的名称、类型和作用如下表所示。

组件名称负载类型命名空间说明
vmagent-prometheus-agentStatefulSetkube-system采集器组件,采集集群内 kubelet、kubelet-cadvisor 、kube-state-metrics 、node-exporter、dcgm、ingress-nginx、p2p-accelerator 等暴露的指标。
prometheus-agent-vmoperatorDeploymentkube-systemvm-agent 控制组件。
prometheus-agent-kube-state-metricsStatefulSetkube-system提供 Kubernetes 资源信息指标数据。
prometheus-agent-node-exporterDaemonSetkube-system提供节点资源信息指标数据。

默认采集规则

默认情况下,Prometheus-agent 组件包含了面向 kubelet、kubelet-cadvisor 、kube-state-metrics 、node-exporter、dcgm、mgpu、ingress-nginx、p2p-accelerator、Nydus 的采集规则。

默认规格

Prometheus-agent 组件中的默认实例规格如下表所示。

组件名称CPU 请求值内存请求值CPU 上限值内存上限值
vmagent-prometheus-agent2 Core2 GiB4 Core4 GiB
prometheus-agent-vmoperator0.1 Core256 MiB0.2 Core1 GiB
prometheus-agent-kube-state-metrics0.2 Core512 MiB0.8 Core2 GiB
prometheus-agent-node-exporter0.05 Core128 MiB0.1 Core256 MiB

推荐规格

在集群中安装 prometheus-agent 组件时,组件的分片数和规格与集群规模相关,您可以基于集群规模,配置组件的初始(最小)分片数。

vm-agent 采集器和 kube-state-metrics 组件在不同规模集群中的推荐初始(最小)分片数如下表所示。

集群规模vm-agent 初始(最小)分片数kube-state-metrics 初始(最小)分片数
10 Node,500 Pod11
100 Node,5000 Pod22
200 Node,10000 Pod44
500 Node,25000 Pod1010

参数配置

安装 prometheus-agent 组件时,可按如下说明进行二次配置。

注意

  • promethues-agent 组件与使用脚本安装的 VM Agent 采集器冲突,不能同时使用,安装组件前,请确认您的集群中没有使用脚本安装的 VM Agent 采集器。详情请参见 部署 VM Agent
  • 当 Prometheus-agent 组件为 v2.0.1 及以前 版本时,您还需要配置组件的托管 Prometheus 工作区,并配置工作区的认证用户名和密码。
  • 当您配置组件的工作区时,需要保证配置的工作区与集群绑定的工作区一致。否则将无法在 Prometheus 监控 页面中,查看集群监控的指标和大盘。

alt

配置项说明

Prometheus 工作区

按需选择 Prometheus 工作区,可使用 通过公网采集监控数据 来筛选工作区。

说明

  • 通过公网采集监控数据当前仅支持标准版工作区。

  • 若缺少 Prometheus 工作区,可前往 托管 prometheus 控制台 创建工作区后再进行选择。

认证方式

按照所选工作区实际配置,选择认证方式,并填写参数。

  • Basic Auth:配置用户名和密码,要求与工作区实际配置保持一致。

  • 证书:上传证书和私钥,要求与工作区实际配置保持一致。

说明

若目标工作区未开启期望的认证方式,可前往 托管 prometheus 控制台,对目标工作区的配置进行修改。

alt

配置项说明
部署方式组件的部署方式。当前该参数已固定,不可配置。
vm-agent 资源配置 vm-agent 采集器的默认资源配置,包括:CPU 请求、CPU 上限、内存请求、内存上限。

kube-state-metrics 资源配置

配置 kube-state-metrics 组件的默认资源配置,包括:CPU 请求、CPU 上限、内存请求、内存上限。

说明

由于 kube-state-metrics 组件本身存在的限制(例如:每个组件实例允许采集的 Target 数量有限),在大规模集群中,建议优先使用增加分片数的方式,提升 kube-state-metrics 组件的指标采集能力。

vm-agent 初始分片数配置 vm-agent 采集器的初始分片数。
kube-state-metrics 初始分片数配置 kube-state-metrics 组件的初始分片数。

组件扩缩容

配置是否开启 vm-agent 采集器和 kube-state-metrics 组件的自动扩缩容功能。

  • 不开启:组件的分片数为配置的初始分片数。不会随着资源占用率的提升而自动扩容。
  • 开启:需要配置组件的最大分片数。组件会基于资源占用率自动扩缩容,具体逻辑如下:
    • vm-agent 扩容:任一资源(CPU 或内存)使用率 > 70% 时,自动扩容。
    • vm-agent 缩容:全部资源(CPU 和内存)使用率均 < 30% 时,自动缩容。
    • kube-state-metrics 扩容:任一资源(CPU 或内存)使用率 > 70% 时,自动扩容。
    • kube-state-metrics 缩容:全部资源(CPU 和内存)使用率均 < 70% 时,自动缩容。

注意

  • vm-agent 扩缩容冷却时间为 30 分钟。kube-state-metrics 基于 HPA 进行扩缩容量。
  • 配置组件自动扩缩容功能后,请保证集群资源充足,否则可能由于资源不足,导致组件扩容失败。
  • vm-agent 采集器和 kube-state-metrics 组件扩容时,为保证均衡负载,建议配置 kube-state-metrics 组件的分片数为 vm-agent 采集器分片数的整数倍,例如:kube-state-metrics 组件分片数vm-agent 采集器分片数1:12:1 等。
部署插件配置是否同步安装 node-exporter 插件,默认安装插件。该插件用于采集节点操作系统的各项软硬件指标;如果不安装,则无法监控节点指标。建议您保持默认值。