最近更新时间:2024.04.02 20:26:12
首次发布时间:2024.02.05 10:52:46
分布式云原生平台为注册节点及其注册节点内的容器和容器组提供监控能力,可通过 VKE 集群获取注册节点相关监控信息发送至托管 Prometheus 服务,本文为您介绍如何将注册节点监控信息对接到托管 Prometheus 服务。
说明
【邀测·申请试用】:DCP 注册节点观测功能目前处于邀测阶段,如需使用,请提交申请。
分布式云原生平台提供的注册节点服务是火山引擎打造的标准、成熟、稳定的全新升级节点形态,主要用于解决大量闲散计算资源无法高效利用和运维的痛点。用户仅需运维本地服务器,本地搭建/运维 Kubernetes 集群由注册节点服务统一运维管控,帮助用户解决分布式基础设施资源环境下的统一的 Kubernetes 管理/运维问题。
如下注册节点服务原理图所示,分布式云原生平台支持对接平台运维的托管 Prometheus 服务,将 DCP 注册节点和注册节点内的容器指标采集并上传到托管 Prometheus 服务进行监控分析。
托管 Prometheus 服务中创建的工作区(Workspace)已经开启公网访问。
前往 VKE 集群安装注册节点监控所必须的组件:prometheus-agent。
...
中的 安装,根据提示引导依次安装 prometheus-agent 组件。组件名称 | 组件说明 | 配置说明 |
---|---|---|
prometheus-agent | VMP 监控组件,用于采集 Kubernetes 集群监控指标数据到托管 Prometheus 服务。 | 单击单 安装 ,并根据提示配置 vm-agent 资源、kube-state-metrics 资源配置、vm-agent 初始分片数、 |
说明
若 VKE 集群已经开启容器服务观测,可跳过此步骤。
DCP 注册节点观测服务启用后将根据已有配置和默认指标配置采集监控信息,若需要更新信息或指标配置,可参考以下方式进行修改。
本场景要求使用已经开启公网访问的工作区,若需要更换工作区,可前往观测配置页面单击右上角操作按钮进行更换。
注意
工作区更新后,需要检查 dcp-node-otel-collector 参数配置中的 Workespace 认证信息并及时更新。否则,可能因为认证失败导致监控信息采集中断。
若 Workspace 认证信息发生变更或 OTel Collector 资源配置不满足需求,可前往观测配置页面编辑 dcp-node-otel-collector 参数配置。
DCP 注册节点提供 DCP node-exporter、DCP kubelet-cadvisor 和 DCP kubelet 指标组件及其相关指标项的监控,可根据实际场景选择需要监控的指标。
监控相关组件和服务配置完成后,DCP 注册节点和注册节点内的容器指标将开始采集并上传到托管 Prometheus 服务。