You need to enable JavaScript to run this app.
导航

通过云原生观测监控注册节点

最近更新时间2024.04.02 20:26:12

首次发布时间2024.02.05 10:52:46

分布式云原生平台为注册节点及其注册节点内的容器和容器组提供监控能力,可通过 VKE 集群获取注册节点相关监控信息发送至托管 Prometheus 服务,本文为您介绍如何将注册节点监控信息对接到托管 Prometheus 服务。

说明

邀测·申请试用】:DCP 注册节点观测功能目前处于邀测阶段,如需使用,请提交申请。

背景信息

分布式云原生平台提供的注册节点服务是火山引擎打造的标准、成熟、稳定的全新升级节点形态,主要用于解决大量闲散计算资源无法高效利用和运维的痛点。用户仅需运维本地服务器,本地搭建/运维 Kubernetes 集群由注册节点服务统一运维管控,帮助用户解决分布式基础设施资源环境下的统一的 Kubernetes 管理/运维问题。

如下注册节点服务原理图所示,分布式云原生平台支持对接平台运维的托管 Prometheus 服务,将 DCP 注册节点和注册节点内的容器指标采集并上传到托管 Prometheus 服务进行监控分析。

alt

前提条件

  • 已经开通 容器服务,并创建 Kubernetes 版本为 v1.20、v1.24 或 v1.26 的 VKE 集群,详细介绍参见:创建集群
  • 已经开通 托管 Prometheus 服务,并创建已经开启公网访问的工作区,详细介绍参见:创建工作区
  • 已经完成注册节点服务的基础环境搭建,包括:注册 VKE 集群、启用注册节点服务、创建注册节点池、添加注册节点,详细介绍参见:快速使用注册节点服务

使用限制

托管 Prometheus 服务中创建的工作区(Workspace)已经开启公网访问。

操作步骤

步骤一:安装监控相关组件

前往 VKE 集群安装注册节点监控所必须的组件:prometheus-agent。

  1. 登录 分布式云原生控制台
  2. 在左侧导航栏选择 容器集群,进入容器集群管理页面。
  3. 单击目标 VKE 集群名称,跳转到 VKE 集群管理页面,在左侧导航栏选择 组件管理
  4. 单击组件页签右上角...中的 安装,根据提示引导依次安装 prometheus-agent 组件。
组件名称组件说明配置说明

prometheus-agent

VMP 监控组件,用于采集 Kubernetes 集群监控指标数据到托管 Prometheus 服务。

单击单 安装 ,并根据提示配置 vm-agent 资源、kube-state-metrics 资源配置、vm-agent 初始分片数、
Kube-state-metrics 初始分片数等信息,详细配置项和配置方法参见:prometheus-agent 组件安装配置

alt

步骤二:开启容器服务观测

说明

若 VKE 集群已经开启容器服务观测,可跳过此步骤。

  1. 登录 分布式云原生控制台
  2. 在左侧导航栏选择 容器集群,进入容器集群管理页面。
  3. 单击目标 VKE 集群名称,跳转到 VKE 集群管理页面,在左侧导航栏选择 云原生观测 > 概览
  4. 根据引导提示,配置 Prometheus 工作区和深度观测选项,完成后单击 开始使用

alt

步骤三:启用 DCP 注册节点观测

  1. 登录 分布式云原生控制台
  2. 在左侧导航栏选择 容器集群,进入容器集群管理页面。
  3. 单击目标 VKE 集群名称,跳转到 VKE 集群管理页面,在左侧导航栏选择 云原生观测 > 观测配置
  4. 单击 DCP 注册节点观测服务标签中的 启用,跳转到 DCP 注册节点观测配置页面。

alt

  1. 根据操作指引配置 Prometheus 工作区和 dcp-node-otel-collector 参数配置,完成后单击 开启

alt

步骤四:(可选) DCP 注册节点观测配置

DCP 注册节点观测服务启用后将根据已有配置和默认指标配置采集监控信息,若需要更新信息或指标配置,可参考以下方式进行修改。

  • 编辑 Prometheus 工作区

本场景要求使用已经开启公网访问的工作区,若需要更换工作区,可前往观测配置页面单击右上角操作按钮进行更换。

注意

工作区更新后,需要检查 dcp-node-otel-collector 参数配置中的 Workespace 认证信息并及时更新。否则,可能因为认证失败导致监控信息采集中断。

alt

  • 编辑 dcp-node-otel-collector 参数配置

若 Workspace 认证信息发生变更或 OTel Collector 资源配置不满足需求,可前往观测配置页面编辑 dcp-node-otel-collector 参数配置。

  1. 登录 分布式云原生控制台
  2. 在左侧导航栏选择 容器集群,进入容器集群管理页面。
  3. 单击目标 VKE 集群名称,跳转到 VKE 集群管理页面,在左侧导航栏选择 云原生观测 > 观测配置
  4. 单击 DCP 注册节点观测卡片中的 编辑配置,跳转到配置修改页面。
  5. 在探针页签单击 配置参数,即可更新 Workspace 认证信息或 OTel Collector 资源配置,完成后单击 确定

alt

  • 编辑指标组件及其指标配置

DCP 注册节点提供 DCP node-exporter、DCP kubelet-cadvisor 和 DCP kubelet 指标组件及其相关指标项的监控,可根据实际场景选择需要监控的指标。

  1. 登录 分布式云原生控制台
  2. 在左侧导航栏选择 容器集群,进入容器集群管理页面。
  3. 单击目标 VKE 集群名称,跳转到 VKE 集群管理页面,在左侧导航栏选择 云原生观测 > 观测配置
  4. 单击 DCP 注册节点观测卡片中的 编辑配置,跳转到配置修改页面。
  5. 在指标页签单击操作列的开关按钮(如图标识 1 位置),可以组件为粒度开关采集指标;也可单击操作列的编辑按钮(如图标识 2 位置),调整单个指标组件中的详细指标和采集间隔。

alt

后续操作

监控相关组件和服务配置完成后,DCP 注册节点和注册节点内的容器指标将开始采集并上传到托管 Prometheus 服务。