You need to enable JavaScript to run this app.
导航

【产品变更】容器服务 Prometheus-agent 组件升级

最近更新时间2024.03.01 11:23:10

首次发布时间2023.05.12 15:58:54

背景

容器服务 prometheus-agent 组件已升级至 v2.0.0 版本。新版本显著提高了生产可用性,允许组件根据资源使用情况,自动进行扩缩容,可支持超大规模集群,建议您升级至最新版本。本文档将为您介绍如何将组件从 v1.x.x 旧版本升级到 v2.0.0 新版本。

不升级的影响

如果您不将组件升级到新版本,会带来以下问题:

  • 无法享受云服务基础指标免费。
  • 组件缺乏生产可用性。
  • 后续版本无法迭代升级。

前提条件

  • 组件升级过程中无法采集指标。正常情况下,升级过程通常持续 2~5 分钟。

说明

若出现异常情况,如卸载异常等,请联系技术支持。

  • VMP 工作区需要采用 Basic Auth 认证方式。

升级步骤

步骤一:(可选)切换 VMP 工作区认证模式

说明

使用 v2.0.0 版本的 prometheus-agent 组件需要使用工作区的 Basic Auth 认证功能,如果您的工作区已经使用了该认证方式,本步骤可跳过。

  1. 登录 VMP 服务控制台
  2. 在顶部导航栏,选择目标地域。
  3. 单击左侧导航栏的 工作区,进入工作区列表页面。
  4. 在工作区列表中,选择需要更新的工作区,单击工作区名称,进入工作区详情页面。
  5. 开启工作区的 Basic Auth 认证方式。
    alt
  6. 配置工作区认证的用户名和密码。
    alt
  7. 单击 确定,完成配置。

步骤二:卸载旧版本

卸载旧版本 prometheus-agent 组件

如果您集群中为旧版本的 prometheus-agent 组件,则需要首先删除旧版本,操作步骤如下:

  1. 登录 容器服务控制台
  2. 在左侧导航栏中选择 集群,在集群列表中选择目标集群。
  3. 在集群管理页面的左侧导航栏中,选择 组件管理
  4. 将鼠标移动到 prometheus-agent 组件上,选择该组件右上角的 ... > 卸载
    alt
  5. 二次确认后,卸载旧版本组件。

卸载脚本安装的 VM Agent 组件

说明

使用脚本安装的 VM Agent 由于暂时不支持自动扩缩容,同时也无法享受 云服务基础指标免费 特性。如果您想要享受上述特性,建议也将集群中的采集器切换为 prometheus-agent。

如果您集群中为脚本安装的 VM Agent,则需要首先删除该组件,操作步骤如下:

  1. 在本地环境中下载脚本,详情请参见 获取脚本
  2. 使用 kubectl 正确连接容器服务(VKE)集群。
  3. 执行以下命令,卸载 VM Agent 采集器。
./install.sh uninstall \
--agent vmagent \
--region cn-beijing
  1. 等待对应的工作负载不存在后,执行以下命令,卸载 vm-operator。
./install.sh uninstall-operator \
--region cn-beijing \
--namespace volcano-metrics

步骤三:升级新版本

旧版本组件卸载成功后,重新安装新版本的组件,操作步骤如下:

  1. 登录 容器服务控制台
  2. 在左侧导航栏中选择 集群,在集群列表中选择目标集群。
  3. 在集群管理页面的左侧导航栏中,选择 组件管理
  4. 将鼠标移动到 prometheus-agent 组件上,选择该组件右上角的 ... > 安装,安装新版本组件。配置详情,请参见 安装 prometheus-agent 组件
    alt