集群中创建节点池后,可登录节点池管理页面,执行节点池相关操作。本文为您介绍节点池相关操作的操作场景、操作影响和操作步骤。
编辑节点池
修改节点池相关配置,包括:节点池基础信息、Worker 节点配置、系统配置、安全配置等。
说明
默认节点池vke-default-nodepool
不支持更新 节点池信息、Worker 节点配置、系统配置。
登录 容器服务控制台,在左侧导航栏中单击 集群。
单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理 > 节点池。
单击目标节点池右侧 操作 列下的 编辑,根据如下说明编辑节点池。编辑完成后单击 确认。
配置项 | 说明 |
---|
节点池信息 |
名称 | 根据系统提示的命名规则,修改节点池名称。同一个集群内,节点池名称须唯一。 |
计费方式 | 当前节点池中节点的计费方式。 - 按量计费:该计费类型,不支持更新。
- 包年包月:该计费类型支持修改 购买时长、是否 自动续费。
说明 修改购买时长后(包括自动续费策略),仅对新扩容的节点生效。存量节点如需修改购买时长,请前往 云服务器控制台 手动修改。 - 抢占式实例:该计费类型,不支持更新。
|
弹性伸缩 | 修改节点池启用状态和相关配置。 - 节点数量范围:弹性伸缩时,节点数量动态调整的范围。输入数值范围:0~2000。
若节点需求超过当前集群的节点配额总数,您可 提交工单 申请扩容节点配额。 - 优先级:当弹性扩容算法选择 priority 时生效,对优先级高的节点池进行扩容,数字越大,优先级越高。输入数值范围:0~100。
|
节点池标签 | 自定义的资源标签,用于从不同维度对具有相同特征的节点池进行分类、搜索和聚合,能够灵活管理节点池。 |
Worker 节点配置 |
子网 | 更新节点池的子网,新增如下范围内的一个或多个子网,为节点提供网络支撑: - 如果集群网络模型为 VPC-CNI,则显示集群子网可用区下的所有子网列表。
- 如果集群网络模式为 Flannel,则显示集群所在私有网络(VPC)下所有子网列表。
注意 - 已配置的子网不可更改。可在原有子网基础上增加子网。
- 子网支持通过拖拽方式调整前后顺序。
- 单个节点池最多可关联 8 个子网。
|
多子网调度策略 | 为节点池中的多个子网设置调度优先级,用于在 Worker 节点扩容时按照子网优先级顺序进行调度。有如下两种策略: - 均衡策略:节点扩容时,新增的节点会分散到多个子网,且保证各个子网中的节点数相对均衡。此策略下,子网的前后顺序不发挥作用。
- 优先级策略:顺序越靠前的子网优先级越高。节点扩容时,会按子网优先级在高优先级的子网下新增节点。
|
计算规格 | 当前子网范围内可用的计算规格列表。根据实际需求选择您需要的计算规格。各计算规格的详细说明,请参见 实例规格清单。 注意 - 更新节点池的计算规格后,扩容时将按照更新后的计算规格新增节点。存量的老规格节点不受影响。
- 无法选中的规格,表示该规格对应的云服务器产品已停止售卖。云服务器已停售的规格族,请参见 【停售公告】。
|
ECS 实例标签 | 容器服务为新增的 ECS 实例绑定火山引擎平台标签,用于搜索、管理 ECS 实例。 说明 更新后的 ECS 实例标签,仅对后续节点池扩容后新增的节点生效,存量节点上的 ECS 实例标签不受影响。 |
项目 | 【邀测·申请试用】为节点池指定所属项目,从项目纬度管理节点池资源的运维、授权等操作。默认选择 default(默认项目)。更多项目相关操作和说明,请参见 项目管理。 |
系统配置 |
系统镜像 | 根据实际情况,选择节点使用的系统镜像,包括:公共镜像、自定义镜像、共享镜像。 公共镜像:火山引擎官方提供的正版版权镜像,包含基础操作系统和火山引擎提供的初始化组件,安全稳定性高且所有用户均可使用。 容器服务支持的公共镜像及其关联的规格族参见:容器服务支持的公共镜像。 自定义镜像:【邀测·申请试用】用户自行制作并上传的镜像,除操作系统外,还可以预装公共应用或私有应用,具有更高的定制化性,适用于需要重新部署复杂初始化系统或多次部署同样配置的场景。 容器服务支持自定义镜像作为节点操作系统,更多详细介绍参见:如何打包和使用自定义镜像? 共享镜像:其他火山引擎账户共享的镜像,可使用共享镜像快速部署与其他用户已创建节点相同的软件环境,也可以将自己创建或上传的自定义镜像共享给其他火山引擎账户使用。
|
系统云盘 | 提供操作系统运行、日志存储相关工作需要使用的存储空间。 说明 - 不同地域支持的云盘类型可能不同,请按需使用。目前支持的云盘类型包括:极速型 SSD。云盘类型介绍,请参见 云盘规格。
- 极速型 SSD 提供性能级别选择。不同性能的极速型 SSD 云盘提供的最大 IOPS、最大吞吐量、时延等性能值不同。
|
数据盘 | 提供额外存储空间,可用于日常工作中的数据存储。单个节点最多可挂载 15 块数据盘。 - 不同地域支持的云盘类型可能不同,请按需使用。云盘类型介绍,请参见 云盘规格。
说明 - 极速型 SSD 提供性能级别选择。不同性能的极速型 SSD 云盘提供的最大 IOPS、最大吞吐量、时延等性能值不同。
- 部分计算规格,支持挂载本地盘。具体支持挂载本地盘的计算规格,请参见 实例规格清单。
- 格式化并挂载到容器、镜像存储目录:第一个数据云盘默认支持格式化并挂载给容器、镜像、Kubelet 组件相关的
/var/lib/containerd 和/var/lib/kubelet 目录使用。
若取消勾选,表示将/var/lib/containerd 和/var/lib/kubelet 目录挂载到系统盘操作系统所在分区中,请密切关注系统盘剩余可用容量风险。注意 该功能适用于 v1.20.15-vke.4 及以上 Kubernetes 版本的集群。低版本集群数据盘仅针对/var/lib/containerd 目录进行挂载。 - 文件系统:【邀测·申请试用】选择第一个数据云盘的文件系统,支持 Ext4 和 Xfs。
- 指定挂载目录:默认不勾选,勾选后指定挂载目录,将数据云盘挂载到该目录。
例如,指定挂载目录为/vke ,第一个数据云盘同时格式化并挂载到容器和镜像存储目录时,/var/lib/containerd 和/var/lib/kubelet 目录会被关联绑定(Bind Mount)到/vke/var/lib/containerd 和/vke/var/lib/kubelet 。
|
运维功能设置 |
检查和自愈 | 【邀测·申请试用】配置是否开启节点检查自愈功能。 - 开启:通过配置节点自愈规则,系统会自动检查节点上的 GPU 卡状态,当 GPU 卡故障时及时封锁节点,禁止 Pod 调度到节点上。
- 关闭:(默认)不开启节点检查自愈功能。
|
检查和自愈规则 | 【邀测·申请试用】在下拉菜单中选择节点自愈规则。如果未配置自愈规则,可以单击 新建检查自愈规则,创建新的规则。详细说明,请参见 配置节点池节点检查自愈。 |
安全配置 |
安全组 | 集群默认安全组(命名格式为<集群ID>-common )不支持修改、删除。集群默认安全组相关说明,请参见 安全组设置。
若需要配置或修改自定义安全组,请勿与集群默认安全组规则冲突。自定义安全组访问规则的推荐范围、最小范围相关说明,请参见 集群访问规则。 说明 - 自定义安全组时,单个节点池最多支持关联 4 个安全组。
- 自定义安全组时,无法选中 VPC 的托管安全组。托管安全组相关说明,请参见安全组概述。
|
节点访问配置 | 更新节点池中后续新增节点的登录方式,对存量节点不生效。勾选表示修改后续新增节点的登录方式和对应的密码或 SSH 密钥对。 - 密码:使用 root 用户登录认证,需配置 root 密码并二次确认。
- SSH 密钥对:一种安全的登录认证方式,包括公钥和私钥,仅支持 Linux 实例。若无可用 SSH 密钥对,请单击 创建密钥对 创建。密钥对相关介绍和创建操作,请参见 密钥对。
|
安全加固 | 更新安全加固开关状态: - 开启:(默认)HIDS 主机防护免费提供异常登录等风险告警服务,在保证主机系统镜像兼容性的基础上,为节点(云服务器实例)提供实时监控、文件监控、进程监控、系统动态分析等安全加固功能。
- 关闭:关闭主机安全加固。
说明 变更安全加固开关状态后,仅对后续节点池扩容后新增的节点生效,对存量节点不生效。 |
更多配置 |
节点标签 (Labels) | 增删节点标签。标签能够为节点定义不同的属性,方便批量筛选等需求。 |
节点污点 (Taints) | 增删节点污点。污点(Taints)能够使节点排斥某些特定的 Pod,避免 Pod 调度到该节点上。 |
节点标签及污点自动更新 | 配置节点标签和污点的自动更新功能。 - 勾选(默认):开启节点标签和污点自动更新功能。在节点池中新增或修改标签或污点,会自动更新到新建节点和存量节点。同时,修改存量节点上的标签和污点后,节点上的配置会被节点池的配置刷新。
- 取消勾选:关闭节点标签和污点自动更新功能。在节点池中新增或修改标签或污点 ,仅会同步到新建节点,不会更新到存量节点。同时,修改存量节点上的标签和污点后,存量节点上的配置以修改后的配置为准,不会被节点池的配置刷新。
注意 关闭节点标签和污点自动更新功能,可能导致某些使用固定节点标签的功能异常,请谨慎操作! |
高级配置 |
Kubelet 自定义参数 | 配置节点池中节点的 kubelet 自定义参数,用于调整节点行为。详细操作,请参见 配置节点池 kubelet 自定义参数。 |
节点名称自定义 | 开启后,该节点池中新增扩容的节点将自动使用此处定义的节点名称前缀。 |
节点元数据名称自定义 | 开启后,该节点池中新增扩容的节点将自动使用此处定义的节点元数据名称(metadata.name)前缀。 |
镜像懒加载 | 【邀测·申请试用】默认不开启。开启后,节点池中的节点具备按需使用容器加速镜像的能力。更多说明,请参见 容器镜像懒加载方案。 注意 - 更新节点池的镜像懒加载功能后,仅针对后续新增的节点生效。存量节点不受影响。
- 仅 Containerd 版本为 1.4.13-vke.3 及以上版本的节点才可用该功能。Containerd 版本查看方法,请参见 FAQ。
|
部署执行脚本 | 输入 Shell 格式的脚本,节点部署 Kubernetes 组件后将自动执行该脚本。需要您自行实现脚本命令,并保证脚本的可重入及重试逻辑。脚本及其日志文件可在节点的/usr/local/vke/userscripts 目录下查看。该功能常用于修改 Docker 配置参数等场景。 |
节点自动绑定公网 IP | 是否为集群中的节点自动绑定公网 IP(EIP): - 不开启:(默认)系统不会自动为节点分配 EIP。若后续需要访问公网,请参考 申请公网 IP 并绑定云服务器。
- 开启:系统自动为集群下的节点分配 EIP,此时您还需要自定义 EIP:
- 计费类型:EIP 支持 按量计费-按带宽上限、按量计费-按实际流量 两种计费类型。
- 线路类型:当前仅支持 BGP 类型。
- 带宽上限:自定义设置带宽上限。
说明 - 使用 EIP 将产生费用,资费详情请参见 公网 IP 计费指引。若 EIP 配额不足,请在 EIP 产品侧提交申请,更多说明,请参见 EIP 约束限制。
- 节点被删除或缩容时,已绑定的 EIP 会被同步释放。
|
封锁节点 | 将节点池中的节点调整到已封锁且不可调用状态,新创建的 Pod 无法调度到该节点池中的节点上,已经运行在该节点上的 Pod 不受影响。可手动执行kubectl uncordon 命令取消封锁。封锁节点将减少该节点所属集群的剩余可用资源配额,若集群本身预留的可用资源不足,将会影响后续正常业务的调度和存量业务的运行。 |
添加已有节点
部分满足限定条件的自定义节点池,支持添加已有的 ECS 节点,满足资源利旧、节点预热等业务场景需求。
使用限制
仅满足如下条件的自定义节点池和云服务器(ECS)实例,支持该功能:
- 自定义节点池满足如下条件:
- 节点池未开启 弹性伸缩 开关。
- 当前节点池状态为 运行中。
- 当前节点池计费模式为 按量计费 或 包年包月。
- ECS 实例满足如下条件:
- 属于当前集群相同的私有网络(VPC)。
- 与目标节点池所属的项目(Project)一致。
- 实例未加入任何集群或弹性伸缩(Auto Scaling)服务的伸缩组。
- 实例仅有一张网卡,已绑定多张网卡的 ECS 实例不支持被添加。
- 实例系统盘需满足:
容量
≥ (目标节点池配置的镜像大小
+ 10 GiB
)。 - 实例数据盘必须包含目标节点池指定了挂载的数据盘,且盘类型和大小完全一致。
操作步骤
- 登录 容器服务控制台,在左侧导航栏中选择 集群。
- 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理 > 节点池。
- 单击目标节点池右侧
...
中的 添加已有节点 。
- 在 全部服务器 列表中,勾选需要加入节点池的节点,将其加入 已选服务器 列表中。
参数 | 描述 |
---|
云服务器选择 | 勾选目标云服务器名称,将该云服务器添加到当前自定义节点池中。 |
保留云服务器实例名称 | 已有节点加入节点池时,是否保留原 ECS 实例的名称。 - 勾选:保留原来的 ECS 实例名称。
说明 保留的 ECS 实例名称中若有中文字符,则该节点的cluster.vke.volcengine.com/node-name 系统标签为无效标签。因此在后续该节点的亲和调度中等场景中,请使用其他标签,避免使用cluster.vke.volcengine.com/node-name 标签。 - 不勾选:不保留原 ECS 实例名称,由容器服务根据当前节点池的配置,重新命名该节点。
|
重启安装批量作业 Agent | 默认安装 Agent,不支持修改。使用 Agent 进行节点管理,方便节点的故障监测和自愈。 |
- 单击 确定,完成配置。
克隆节点池
容器服务支持克隆节点池,通过创建相似配置的不同节点池,为多个上层业务提供服务。
- 登录 容器服务控制台,在左侧导航栏中选择 集群。
- 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理 > 节点池。
- 单击目标节点池右侧
...
中的 克隆 。 - 在 克隆节点池 页面设置节点池名称、节点登录密码/SSH 密钥对,其余参数与被克隆的节点池配置相同,请按需更新。参数说明,请参见本文上方 编辑节点池。
- 单击 下一步:确认配置,确认节点池配置信息并勾选 我已阅读并同意 后,单击 确定,完成克隆节点池。
移除节点池
确保正常业务运行不受影响的情况下,可移除不需要继续工作的节点池和相关节点。针对按量计费类型的节点,移除节点支持 同步销毁释放节点;包年包月类型的节点目前仅支持移除节点。
注意
- 此操作将导致节点池内节点上的 Pod 自动迁移至其他节点,建议在业务低峰期进行。
- 若同步销毁释放节点,将同时删除系统盘和数据盘的数据,无法恢复,请谨慎操作。
- 登录 容器服务控制台,在左侧导航栏中选择 集群。
- 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理 > 节点池。
- 单击目标节点池右侧
...
中的 移除 。 - 在弹出的确认移除节点池窗口,按需选择 同步销毁释放节点 并单击弹框右下角 移除 ,完成节点池移除并同步移除节点池内的所有节点。
故障诊断
节点池诊断可以帮助用户发现容器服务集群中节点池可能存在的潜在风险,包括:节点池状态异常、CA 组件状态、节点配额状态、ECS 库存检查等。
- 登录 容器服务控制台,在左侧导航栏中选择 集群。
- 单击目标集群名称,在集群管理页面的左侧导航栏中选择 节点管理 > 节点池。
- 单击目标节点池右侧
...
中的 故障诊断 。 - 跳转至 故障诊断 页面,配置该节点池的故障诊断任务。详情请参见 节点池诊断。