You need to enable JavaScript to run this app.
导航

管理节点

最近更新时间2024.04.07 19:18:13

首次发布时间2022.03.04 23:10:38

集群中已有节点的前提下,可登录节点管理页面,执行节点相关操作。本文为您介绍管理节点相关的操作场景、操作影响和操作步骤。

单个操作节点

下线节点

集群的日常维护中,为了保证数据安全,部分场景需要下线节点来支持其他业务操作,例如:版本升级、节点扩容、停机维护、节点回收、变更操作等。更多安全下线节点相关最佳实践,请参见 安全下线节点

注意

  • 下线节点会将该节点内 DaemonSet 之外的 Pod 全部驱逐到集群内其他节点上,并将该节点置为不可调度状态(新产生的 Pod 无法被调度到该节点上),可能会影响业务,请在业务低峰期操作。
  • 下线节点将减少该节点所属集群的剩余可用资源配额,若集群本身预留的可用资源不足,将会影响后续正常业务的调度和存量业务的运行。
  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 确保节点状态正常且不影响服务的情况下,单击目标节点右侧...中的 下线
  4. 在弹出的确认下线节点窗口,单击 确定,完成节点下线。

封锁节点

区别于下线节点,封锁节点不会将 Pod 驱逐到集群内其他节点上,而是将节点调整到已封锁且不可调度状态,已经运行在该节点上的 Pod 不受影响。

说明

封锁节点将减少该节点所属集群的剩余可用资源配额,若集群本身预留的可用资源不足,将会影响后续正常业务的调度和存量业务的运行。

  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 单击目标节点右侧...中的 封锁
  4. 在弹出的确认封锁节点窗口,单击 确定,完成节点封锁。

置为可调度

若需要恢复节点调度能力,可将已封锁或下线状态的节点,重新调整到正常且可调度状态,允许被用来调度 Pod。将节点置为可调度后,会增加该节点所属集群的剩余可用资源配额。

  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 单击目标节点右侧...中的 置为可调度
  4. 在弹出的确认窗口,单击 确定,将节点置为可调度。

标签管理

节点打上不同的标签,可定义不同的属性,方便批量筛选等需求。可通过容器服务控制台对节点进行标签管理,包括:添加节点标签、编辑节点标签、删除节点标签。

  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 单击目标节点右侧...中的 标签管理,可跳转到 节点详情页标签 页签,对标签进行管理。

污点管理

节点打上一个或多个污点,能够使节点排斥某些特定的 Pod,避免 Pod 调度到该节点上。可通过容器服务控制台对节点进行污点管理,包括:添加节点污点、编辑节点污点、删除节点污点。

  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 单击目标节点右侧...中的 污点管理,可跳转到 节点详情页污点 页签,对污点进行管理。

ECS Terminal

通过 ECS Terminal 方式,登录到节点控制台,可使用命令行方式对节点进行管理。更多说明,请参见 通过控制台登录 Linux 实例

  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 单击目标节点右侧...中的 ECS Terminal,可通过 ECS Terminal 方式连接到节点控制台,对节点进行管理。

查看监控

容器服务已经对接云监控产品的监控告警能力,不仅能够可视化查看节点相关指标的监控趋势图表,而且能够创建告警策略,根据告警规则推送告警消息,实时监控节点的健康状态。
监控项包括:容器组个数、节点 CPU 使用率、节点内存使用率、节点 CPU 分配率(request)、节点 CPU 分配率(limit)、节点内存分配率(request)、节点内存分配率(limit)。

  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 单击目标节点右侧...中的 查看监控,可跳转到云监控产品的节点监控页面,查看节点相关的监控图表。

移除节点

确保正常业务运行不受影响的情况下,可移除不需要继续工作的节点。

注意

  • 此操作将导致节点上的 Pod 自动迁移至其他节点,建议在业务低峰期进行。
  • 针对按量计费、抢占式实例类型的节点,移除节点支持 同步销毁释放节点;包年包月类型的节点目前仅支持移除节点,若需要释放对应的云服务器(ECS)实例,请参见 云服务器退订说明
  • 若同步销毁释放节点,将同时删除系统盘和数据盘的数据,无法恢复,请谨慎操作。
  • 若节点所在节点池已开启 节点自动绑定公网 IP,在同步销毁释放节点时,已绑定的 EIP 会被同步释放。
  • 若不同步销毁释放节点,将重装该节点对应 ECS 实例的操作系统,同时 ECS 实例系统盘的数据也会被清除。重装 ECS 实例操作系统时,ECS 侧会对弹性裸金属型实例、部分高性能计算 GPU 型实例执行强制关机,更多信息,请参见 StopInstance
  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 节点 页面,在节点列表中选择目标节点,单击右侧...中的 移除
    alt
  4. 在弹出的确认框中,按需选择移除节点时的操作。单击 移除 ,完成节点移除。
    alt
    配置项说明

    同步销毁【按量计费、抢占式实例】类型的节点

    移除节点时,是否同步销毁节点。

    • 勾选:表示移除节点时,会同步销毁按量计费、抢占式实例类型的节点。
    • 不勾选:表示移除节点时,不会同步销毁节点。

    移除节点前驱逐该节点上所有除 DaemonSet 管理之外的 Pod 并将其置为不可调度

    移除节点时,是否首先进行节点排水操作。

    • 勾选:表示移除节点时,会首先进行节点排水,即驱逐节点中所有的 Pod(DaemonSet 除外)并将其置为不可调度。
    • 不勾选:表示移除节点时,不会首先进行节点排水。

批量操作节点

容器服务支持批量操作节点,方便您同时快捷运维和管理多个节点。

说明

虚拟节点(Virtual Node)不支持批量操作。

  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理节点
  3. 节点 页面,选中目标节点前的复选框,单击页面上方的 批量操作,按需选择需要的批量操作。
    alt

具体的批量操作说明,请参见下方内容。

批量运维

ECS 类型节点支持发起批量运维作业。批量作业是火山引擎打造的原生自动化运维工具。您可以通过批量作业以免密码、免登录、无需使用跳板机的形式,在单个或多个执行对象中便捷执行运维命令。详细说明,请参见 批量作业

  1. 批量运维节点前,请在节点上安装批量作业客户端。详细操作,请参见 安装批量作业客户端
  2. 选中目标节点前的复选框,在页面上方选择 批量操作 > 批量运维
  3. 在系统弹出的对话框中确认可操作的节点,并单击 确定,发起批量运维作业。

批量置为可调度

将已封锁或下线状态的节点,批量调整到可调度状态,允许这些节点被 Pod 调度。该操作会增加该节点所属集群的剩余可用资源配额。

  1. 选中目标节点前的复选框,在页面上方选择 批量操作 > 批量置为可调度
  2. 在系统弹出的对话框中确认可操作的节点,并单击 置为可调度,批量将节点置为可调度。

    说明

    仅已封锁或下线状态的节点可以被置为可调度状态。

批量封锁

批量调整节点到已封锁且不可调用状态。已经运行在这些节点上的 Pod 不受影响。

  1. 选中目标节点前的复选框,在页面上方选择 批量操作 > 批量封锁
  2. 在系统弹出的对话框中确认可操作的节点,并单击 封锁,完成节点的批量封锁。

批量下线

批量下线节点,将这些节点置为不可调度状态。批量安全下线节点相关说明和注意事项,请参见本文上方 下线节点

  1. 选中目标节点前的复选框,在页面上方选择 批量操作 > 批量下线
  2. 在系统弹出的对话框中确认可操作的节点,并单击 下线,完成节点的批量下线。

批量移除

批量移除不需要继续工作的节点。批量移除节点相关说明和注意事项,请参见本文上方 移除节点

  1. 选中目标节点前的复选框,在页面上方选择 批量操作 > 批量移除
  2. 在系统弹出的对话框中确认可操作的节点,并单击 移除,完成节点的批量移除。
    alt
    配置项说明

    同步销毁【按量计费、抢占式实例】类型的节点

    移除节点时,是否同步销毁节点。

    • 勾选:表示移除节点时,会同步销毁按量计费、抢占式实例类型的节点。
    • 不勾选:表示移除节点时,不会同步销毁节点。

    移除节点前驱逐该节点上所有除 DaemonSet 管理之外的 Pod 并将其置为不可调度

    移除节点时,是否首先进行节点排水操作。

    • 勾选:表示移除节点时,会首先进行节点排水,即驱逐节点中所有的 Pod(DaemonSet 除外)并将其置为不可调度。
    • 不勾选:表示移除节点时,不会首先进行节点排水。

通过节点池页面管理节点

节点池 页面,也可以对节点池下的节点,进行上下线、移除、封锁等管理操作,也可以对多个节点进行批量操作。

  1. 登录 容器服务控制台,在左侧导航栏中单击 集群
  2. 单击目标集群名称,在集群管理页面的左侧导航栏中单击 节点池
  3. 单击目标节点池名称后,在该节点池的 节点列表 页签,按实际需求单个或批量操作节点。
    alt