最近更新时间:2023.08.29 16:55:52
首次发布时间:2023.05.26 15:36:29
当您使用火山引擎容器服务集群时,允许在集群控制台上安装 Prometheus-agent 组件,接入托管 Prometheus 服务。本文为您介绍容器服务接入的流程和步骤。
当您在集群中安装 Prometheus-agent 组件时,会同时安装 vm-agent、vmoperator、kube-state-metrics 和 node-exporter 组件。每个组件的名称、类型和作用如下表所示。
组件名称 | 负载类型 | 命名空间 | 说明 |
---|---|---|---|
vmagent-prometheus-agent | StatefulSet | kube-system | 采集器组件,采集集群内 kubelet、kubelet-cadvisor 、kube-state-metrics 、node-exporter、dcgm、ingress-nginx、p2p-accelerator 等暴露的指标。 |
prometheus-agent-vmoperator | Deployment | kube-system | vm-agent 控制组件。 |
prometheus-agent-kube-state-metrics | StatefulSet | kube-system | 提供 Kubernetes 资源信息指标数据。 |
prometheus-agent-node-exporter | DaemonSet | kube-system | 提供节点资源信息指标数据。 |
Prometheus-agent 组件中的默认实例规格如下表所示。
组件名称 | CPU 请求值 | 内存请求值 | CPU 上限值 | 内存上限值 |
---|---|---|---|---|
vmagent-prometheus-agent | 2 Core | 2 GiB | 4 Core | 4 GiB |
prometheus-agent-vmoperator | 0.1 Core | 256 MiB | 0.2 Core | 1 GiB |
prometheus-agent-kube-state-metrics | 0.2 Core | 512 MiB | 0.8 Core | 2 GiB |
prometheus-agent-node-exporter | 0.05 Core | 128 MiB | 0.1 Core | 256 MiB |
在容器服务集群中安装 prometheus-agent 组件时,组件的分片数和规格与集群规模相关,您可以基于集群规模,配置组件的初始(最小)分片数。
vm-agent 采集器和 kube-state-metrics 组件在不同规模集群中的推荐初始(最小)分片数如下表所示。
集群规模 | vm-agent 初始(最小)分片数 | kube-state-metrics 初始(最小)分片数 |
---|---|---|
10 Node,500 Pod | 1 | 1 |
100 Node,5000 Pod | 2 | 2 |
200 Node,10000 Pod | 4 | 4 |
500 Node,25000 Pod | 10 | 10 |
Prometheus-agent 组件中的 vm-agent 采集器和 kube-state-metrics 组件支持分片数据采集和自动扩缩容,性能和可用性较高。原理如下图所示。
注意
在容器服务集群中安装的 promethues-agent 组件与使用脚本安装的 VM Agent 采集器冲突,不能同时使用。安装组件前,请确认您的集群中没有使用脚本安装的 VM Agent 采集器。详情请参见 部署 VM Agent。
说明
您也可以在创建集群时,绑定托管 Prometheus 工作区,详情请参见 创建集群。
...
> 安装。参数 | 描述 |
---|---|
部署方式 | 组件的部署方式。当前该参数已固定,不可配置。 |
部署形态 | 容器网络模型为 VPC-CNI 的集群显示该参数。部署组件的节点类型,有如下两种方式:
|
vm-agent 资源 | 配置 vm-agent 采集器的默认资源配置,包括:CPU 请求、CPU 上限、内存请求、内存上限。 |
kube-state-metrics 资源配置 | 配置 kube-state-metrics 组件的默认资源配置,包括:CPU 请求、CPU 上限、内存请求、内存上限。 说明 由于 kube-state-metrics 组件本身存在的限制(例如:每个组件实例允许采集的 Target 数量有限),在大规模集群中,建议优先使用增加分片数的方式,提升 kube-state-metrics 组件的指标采集能力。 |
vm-agent 初始分片数 | 配置 vm-agent 采集器的初始分片数。 |
kube-state-metrics 初始分片数 | 配置 kube-state-metrics 组件的初始分片数。 |
组件扩缩容 | 配置是否开启 vm-agent 采集器和 kube-state-metrics 组件的自动扩缩容功能。
注意
|
部署插件 | 配置是否同步安装 node-exporter 插件,默认安装插件。该插件用于采集节点操作系统的各项软硬件指标;如果不安装,则无法监控节点指标。建议您保持默认值。 说明 node-exporter 插件以 Daemonset 方式部署。因此,当您在弹性容器实例 VCI 场景中安装时,该插件会被部署在 ECS 节点上。更多信息,请参见 VCI 使用限制。 |
注意
缺省情况下,prometheus-agent 组件已经包含了面向 kubelet、kubelet-cadvisor 、kube-state-metrics 、node-exporter、dcgm、ingress-nginx、p2p-accelerator、Nydus 的采集规则,安装后无需额外配置,即可采集对应 Target 的指标。
如果您想要采集自定义 Target 的指标,支持通过 ServiceMonitor、PodMonitor 或 Service/Pod annotation 配置服务发现,来满足您采集自定义 Target 的指标需求。详情请参见 服务发现。
您可以使用托管 Prometheus 的 Explore 功能来快速查询和展示指标数据。详情请参见 指标查询。
您可以通过以下方法,查看容器服务集群的指标大盘:
您可以在托管 Prometheus 的告警中心配置集群相关告警。详情请参见 创建告警规则。