You need to enable JavaScript to run this app.
导航
清理注册节点
最近更新时间:2024.07.01 11:11:53首次发布时间:2024.02.01 17:00:35

移除注册节点时触发强制移除或添加节点失败,将导致节点存在信息残留,此时需要登录节点手动执行清理动作,以保证节点脱离集群之后节点内的环境尽量干净。本文为您详细介绍如何手动清理节点。

背景信息

移除注册节点并非单纯将节点从分布式云原生平台移除,移除过程还将清理存量信息。此操作将依次执行以下几个步骤:

  1. 排空节点内的 Pod(drain),以缩短该操作对业务的影响时间。

说明

排空节点内的 Pod 步骤需要注意以下情况:

  • 若 pod 为 running 或 pending,将暂时保留 pod 不删除,在下一个循环检查 pod 状态,确定是否可以删除。
  • 若两次检查后依然存在 running 或 pending 状态的 Pod 待清理,将跳过并退出排空节点内 Pod 步骤。
  1. 在节点临时启动 Pod,下载清理脚本和预置清理命令。
  2. 移除注册节点。
  3. 注册节点移除后的 2 分钟,通过定时任务方式在节点上执行预置的清理命令,以保证节点脱离集群之后节点内的环境尽量干净。

注意

若上述步骤 1 和 2 执行失败,并在持续 15 分钟内重试失败,将自动发起强制移除注册节点操作。强制移除注册节点情况下,将跳过步骤 4,此时,需要登录节点手动执行清理动作,以保证节点脱离集群之后节点内的环境尽量干净。

前提条件

移除注册节点触发强制移除,或添加节点失败导致信息残留,需要手动清理。

使用限制

执行清理动作时,请确保具有足够的权限(root 权限),并保证节点能够访问到公网。若不确定如何执行清理动作或遇到任何问题,可联系官方技术支持团队获取进一步帮助。

操作步骤

  1. 评估清理风险:节点清理包括以下步骤,请谨慎评估后再执行清理操作。

    1. 关闭和禁用注册节点相关服务。
    2. 清理容器并禁用 containerd 服务。
    3. 清理节点配置目录。
    4. 清理网络设备。
    5. 清理注册节点运行进程。
    6. 清理预置命令和删除清理脚本。
  2. 手动登录节点,以 root 身份 依次执行以下命令,进行清理动作:

BINARY_PATH=xxxx      # xxxx 表示清理脚本的下载地址,需要更换为线上路径,详细介绍如下说明。

mkdir -p /root/.cleanup_job/   # 创建文件夹,用于存放清理脚本。

wget $BINARY_PATH -O /root/.cleanup_job/clean_node.sh --connect-timeout=5 --tries=5 --no-check-certificate  # 下载清理脚本。

chmod u+x /root/.cleanup_job/clean_node.sh    # 为清理脚本添加权限。

bash -x /root/.cleanup_job/clean_node.sh > /tmp/clean_node.log 2>&1    # 运行清理脚本,执行清理动作。

说明

清理脚本下载地址格式为:https://dcp-node-cn-bj.tos-<所属地域>.volces.com/install-kubernetes/scripts/clean.sh,其中<所属地域>需要替换为当前地域的 RegionID。例如:北京地域的清理脚本下载地址为 https://dcp-node-cn-bj.tos-cn-beijing.volces.com/install-kubernetes/scripts/clean.sh

分布式云原生平台支持的地域及其 RegionID 参见:地域和可用区