托管版集群的 Master 节点由容器服务 VKE 创建并托管,您只需创建 Worker 节点即可。本文为您详细介绍通过控制台创建托管版集群的步骤和参数配置。
前提条件
- 注册火山引擎平台账号,并完成实名认证、充值账户、授权等准备工作,详情请参考:准备工作。
- 保证账号余额不低于 100 元(含代金券,且除去代金券后余额不为零),以确保能够正常创建按量计费类型的资源。
- 授权容器服务权限,同时获取依赖云服务资源的权限。详情请参考:云服务依赖关系。
- 检查容器服务集群配额限制和依赖云产品配额限制。详情请参考:使用限制。
- 如果需要创建 Linux 操作系统的云服务器并且要绑定 SSH 密钥对时,需要先在目标项目下创建一个密钥对。
- 如果想添加已有的云服务器(ECS)实例到集群中,请确保集群与云服务器实例在同一个私有网络(VPC)下。
费用说明
创建集群时可能会产生负载均衡、NAT 网关、公网 IP、云盘等云基础资源费用。请在创建集群页面下方 配置费用 处,查看实际计费。更多计费说明及云基础资源计费,请参见 产品计费。
操作步骤
- 登录 容器服务控制台。
- 在集群管理页面的左侧导航栏,选择 集群。
- 在集群列表页面,单击左上角 创建集群,配置创建集群所需的参数。
集群配置
- 基础配置
配置项 | 说明 |
---|
名称 | 根据系统提示的命名规则,自定义集群名称。同一地域内不允许重名。 |
Kubernetes 版本 | 选择部署集群的 Kubernetes 版本。容器服务发布的 Kubernetes 版本说明相关内容,请参见 Kubernetes 版本发布记录。 |
描述 | 输入集群相关描述或备注信息,长度限制为 300 个字符。 |
标签 | 自定义的资源标签,用于从不同维度对具有相同特征的集群进行分类、搜索和聚合,能够灵活管理集群。 单击 添加标签,根据界面提示输入 键 和 值。 |
- 网络配置

配置项 | 说明 |
---|
私有网络 | 选择集群所属的私有网络(VPC)。私有网络为集群提供一个隔离的、自主配置和管理的虚拟网络环境。 若无可用私有网络,可参考 创建私有网络 进行创建。 |
容器网络模型 | 配置集群的容器网络(CNI)方案: - Flannel:独立的 Underlay 容器网络模型,配合 VPC 的全局路由能力,实现集群高性能的网络体验。
- VPC-CNI:基于私有网络的弹性网卡 ENI 实现的 Underlay 容器网络模型,具有较高的网络通信性能。
|
IPv6 双栈 | 【邀测·申请试用】容器网络模型选择 VPC-CNI 时可配置,默认关闭,开启后支持通过 IPv6 地址段访问集群资源,IPv4/IPv6 双栈集群相关介绍参见:通过 VKE 搭建 IPv4/IPv6 双栈集群。 |
子网 | 提供给 Kubernetes API Server 创建负载均衡器的网段。 若无可用子网,可单击 创建子网 创建。详细操作说明,请参见 创建子网。 说明 为保证集群高可用,建议选择不同可用区下的多个子网。 |
容器网络 | 自定义配置容器网络。参数配置方法,请参见 容器网络。 说明 集群创建成功后,VPC-CNI 网络模型的集群支持通过集群 基本信息 页面的 网络信息 页签,在原有 Pod 子网基础上增加 Pod 子网。 |
公网访问 | 是否开启集群内节点、应用的公网访问: - 不开启:(默认)集群内节点、应用可以互访,但不能访问公网。
说明 若创建集群时未开启公网访问,则后续使用公网访问功能时,需要为集群中的每个网段节点池分别手动配置公网访问。详细操作,请参见 FAQ。 - 开启:自动为集群专有网络创建 NAT 网关并配置 SNAT 规则,满足集群内节点、应用访问公网的需求。
NAT 网关将产生资源费用。其中,NAT 网关的 EIP 默认配置为:按量计费-按带宽上限、BGP 线路类型、带宽上限 100 Mbps。计费详情,请参见 NAT 网关计费指引。说明 为了避免因误删除等操作影响您的 VKE 集群正常运行,通过 VKE 创建的 NAT 网关实例,在被 VKE 集群使用期间,不允许您自行删除。更多信息,请参见 删除 NAT 网关。
|
API Server 公网访问 | 是否开启 API Server 公网访问: 使用 EIP 将产生费用,资费详情请参见 公网 IP 计费指引。 |
- 运维配置

配置项 | 说明 |
---|
Prometheus 工作区 | 选择容器服务观测指标保存的托管 Prometheus 工作区。 说明 - 该配置仅会将工作区绑定到集群,不会实际采集指标数据。想要实际采集数据,您还需要在集群中安装 Prometheus-agent 组件,详情请参见 组件配置 或 安装组件。
- 如果您没有创建托管 Prometheus 工作区,需要首先创建工作区,详情请参见 创建工作区。
|
控制平面组件指标 | 采集集群控制面组件指标到托管 Prometheus 中。您可以根据监控需求,开启控制面不同组件的指标监控功能。 |
控制平面组件日志 | 采集集群控制面组件日志到日志服务中。开启后会产生日志服务费用,计费详情,请参见 日志服务产品计费。
开启目标控制平面组件后的按钮,设置 日志使用类型、日志项目,采集该组件日志到指定的日志项目。具体操作说明,请参见 控制面组件日志。 |
- 高级配置

配置项 | 说明 |
---|
集群删除保护 | 默认开启,开启后可防止通过控制台或调用 API 误删本集群。若后续要删除该集群,需要在删除集群对话框,根据系统提示二次确认删除已开启删除保护的集群。 |
项目 | 【邀测·申请试用】为集群指定所属项目,从项目纬度管理集群资源的运维、授权等操作。默认选择 default(默认项目)。更多项目相关操作和说明,请参见 项目管理。 |
集群本地域名 | 根据系统提示的输入规则,自定义 Kubernetes 集群的本地域名。自定义集群本地域名可保证集群内 Service 名称全局唯一,支持多集群 DNS 域名解析场景。 若不设置,则默认集群本地域名为cluster.local 。 |
完成 集群配置 后,单击页面右下角 下一步:节点配置。
节点池配置(可选)
- 节点信息
配置项 | 说明 |
---|
Worker 节点 | 选择是否创建节点,建议立即创建,以确保集群可以正常使用。 - 立即创建:创建集群过程中同步添加 Worker 节点到集群中。
- 暂不创建:创建集群过程中不添加节点,后续需要手动创建或添加 Worker 节点到集群中,否则集群无法正常使用。
|
节点来源 | 立即创建节点时需要配置此参数,选择节点的来源。 - 创建节点:创建新的节点,并同步添加到集群中。
创建新的节点时,需要同时配置用于管理该节点的节点池。说明 选择 创建节点 后,参考本文下方 “节点池配置(节点来源 为 创建节点 时)” 中的参数说明,继续配置。 - 使用已有:将已有且与该集群在同一个私有网络下的、未被其他集群使用的云服务器(ECS)实例,添加到该集群中。
容器服务提供默认节点池(名为vke-default-nodepool ),用于纳管已有云服务器实例。若创建集群时添加已有节点,需要自定义vke-default-nodepool 节点池的配置。后续添加到该集群的所有云服务器实例,均被纳管到vke-default-nodepool 节点池。说明 选择 使用已有 后,参考本文下方 “节点池配置(节点来源 为 使用已有 时)” 中的参数说明,继续配置。
|
节点池标签 | 自定义的资源标签,用于从不同维度对具有相同特征的节点池进行分类、搜索和聚合,能够灵活管理节点池。 单击 添加标签,根据界面提示输入 键 和 值。 |
- 节点池配置(节点来源 为 创建节点 时)

配置项 | 说明 |
---|
节点池名称 | 根据系统提示的命名规则,自定义节点池名称。同一个集群内,节点池名称须唯一。 注意 请勿使用vke-default-nodepool 作为节点池名称,该名称为容器服务默认节点池名称,用于纳管已有云服务器(ECS)实例。更多说明,请参见 添加已有节点。 |
计费类型 | 节点对应云服务器(ECS)资源的收费模式:- 按量计费:一种后付费模式,即先使用再付费。计费详情,请参见 产品计费。
- 包年包月:【邀测·申请试用】一种预付费模式,即先付费再使用。
|
可用区 | 可用区是同一地域下电力、网络隔离的物理区域,可用区之间内网互通,不同可用区之间物理隔离。不同地域支持的可用区不同,详情请参见 地域和可用区。 |
子网 | 系统将根据所选可用区筛选可用的子网列表,选择可用区范围内一个或多个子网,为节点提供网络支撑。 说明 - 子网支持通过拖拽方式调整前后顺序。
- 单个节点池最多可关联 8 个子网。
|
多子网调度策略 | 为节点池中的多个子网设置调度优先级,用于在 Worker 节点扩容时按照子网优先级顺序进行调度。有如下两种策略: - 均衡策略:节点扩容时,新增的节点会分散到多个子网,且保证各个子网中的节点数相对均衡。此策略下,子网的前后顺序不发挥作用。
- 优先级策略:顺序越靠前的子网优先级越高。节点扩容时,会按子网优先级在高优先级的子网下新增节点。
|
计算规格 | 系统会根据所选子网筛选可用的计算规格列表,并按照所选计算规格定义节点的计算资源配置。
请按照使用场景,选择合适的类型和规格。规格详细说明,请参见 实例规格清单。 说明 - 部分计算规格对应的云服务器产品已停止售卖。详细说明,请参见 【停售公告】。
- 块存储当前不再支持新建性能型 SSD(PTSSD)云盘。因此请谨慎选择还在售卖且仅支持挂载 PTSSD 云盘的规格族。存量 PTSSD 云盘不受影响。节点与云盘关系说明,请参见 常见问题。
- 在 集群配置 步骤中的 网络配置 中,容器网络模型 选择 VPC-CNI 的集群,此处系统会自动为您校验 Worker 节点支持的 ENI 数量。您可以根据界面提示,选择合适的 计算规格。
- 选择 GPU 计算型 或 高性能计算 GPU 型(ECS 侧的邀测型号)规格族且 GPU 卡 为多张 A100 显卡的机型时,在创建集群后您还需要为节点启动 NVIDIA-Fabric Manager,保证多显卡之间的网络正常连通。详细操作,请参见 FAQ。
|
高性能计算集群 | 计算规格 选择 高性能计算 GPU 型 规格后显示该参数。
选择高性能计算 GPU 型节点所属的高性能计算集群。若无可用的高性能计算集群,请单击 创建高性能计算集群 创新。详细操作,请参见 通过向导购买实例。 注意 - 所选的高性能计算集群若已配置 VPC,则必须和容器集群 VPC 一致;若未配置 VPC,则不影响。
- 高性能计算集群仅支持单可用区。
|
节点数量 | 填写创建节点的数量,创建节点数量与已有节点数量之和不能超过当前集群的节点配额。详细的配额说明,请参见 使用限制。 |
ECS 实例标签 | 容器服务为新增的 ECS 实例绑定火山引擎平台标签,用于搜索、管理 ECS 实例。 单击 添加标签,根据界面提示输入 键 和 值。 说明 后续节点池扩容后新增的节点,将绑定该 ECS 实例标签。 |
- 节点池配置(节点来源 为 使用已有 时)
说明
配置前,请将鼠标指针移动到 了解节点配置规则,阅读并知悉相关规则。

配置项 | 说明 |
---|
全部服务器 | 显示您账号下本地域中,与当前集群在同一个私有网络下的所有云服务器实例。请根据您的需求,勾选目标云服务器实例。 |
已选服务器 | 显示您已选中的云服务器实例。 |
保留云服务器实例名称 | - 勾选表示:将云服务器实例添加到集群后,保留原来的名称。后续您可以在
vke-default-nodepool 默认节点池中,通过保留的名称,识别云服务器实例。说明 保留的云服务器实例名称中若有中文字符,则该节点的cluster.vke.volcengine.com/node-name 系统标签为无效标签。因此在后续该节点的亲和调度中等场景中,请使用其他标签,避免使用cluster.vke.volcengine.com/node-name 标签。 - 不勾选表示:(默认)容器服务将云服务器实例添加到集群后重新命名。命名格式为
node-<随机字符串> 。
|
数据盘挂载 | - 勾选表示:将数据盘格式化并挂载到容器、镜像存储目录
/var/lib/containerd 和/var/lib/kubelet ,同时需要设置 设备名称,指定数据盘设备。您可以自行填写数据盘设备名,如/dev/vdb ;也可自行填写数据盘的分区名,如/dev/vdb1 。 - 不勾选表示:(默认)将
/var/lib/containerd 和/var/lib/kubelet 目录挂载到系统盘操作系统所在分区中。
注意 - 请注意提前备份已有云服务器上的数据。
- 若勾选了已在其他集群中添加过但又被移除了的云服务器实例时,请确保该云服务器实例的数据盘无数据残留,否则创建集群会失败。清理数据盘数据残留的操作,请参见 FAQ。
- 若目标数据盘尚未初始化,则系统自动将其进行格式化分区,并挂载到容器和镜像存储相关目录使用。
- 若目标数据盘已经做了分区或 LVM 分区,则可直接填写分区名或 LVM 名,并挂载到容器和镜像存储相关目录使用。
- 添加已有云服务器实例过程会重置操作系统,因此无法保证数据盘的盘符及分区顺序的强一致性。
|
系统镜像 | 选择节点使用的操作系统。 - 公共镜像:使用火山引擎提供的 veLinux 公共镜像。更多信息,请参见 veLinux 镜像。
VKE 已适配 veLinux 公共镜像和 CentOS 兼容版 veLinux 公共镜像,请按需选择使用镜像。注意 部分计算规格可能不支持 CentOS 兼容版 veLinux 公共镜像,请以实际控制台显示为准。 - 自定义镜像:【邀测·申请试用】容器服务支持自定义镜像作为节点操作系统。功能使用说明,请参见 自定义镜像说明。
|
ECS 实例标签 | 容器服务为 ECS 实例绑定火山引擎平台标签,用于搜索、管理 ECS 实例。 单击 添加标签,根据界面提示输入 键 和 值。 说明 后续vke-default-nodepool 默认节点池中扩容后新添加进来的 ECS 实例,将绑定该 ECS 实例标签。 |
- 系统配置(节点来源 为 创建节点 时)

配置项 | 说明 |
---|
系统镜像 | 选择节点使用的系统镜像。 - 公共镜像:使用火山引擎提供的 veLinux 公共镜像。更多信息,请参见 veLinux 镜像。
VKE 已适配 veLinux 公共镜像和 CentOS 兼容版 veLinux 公共镜像,请按需选择使用镜像。注意 部分计算规格可能不支持 CentOS 兼容版 veLinux 公共镜像,请以实际控制台显示为准。 - 自定义镜像:【邀测·申请试用】容器服务支持自定义镜像作为节点操作系统。功能使用说明,请参见 自定义镜像说明。
|
系统云盘 | 提供操作系统运行、日志存储相关工作需要使用的存储空间。 说明 - 不同地域支持的云盘类型可能不同,请按需使用。云盘类型介绍,请参见 云盘规格。
- 极速型 SSD提供性能级别选择。不同性能的极速型 SSD 云盘提供的最大 IOPS、最大吞吐量、时延等性能值不同。
|
数据盘 | 提供额外存储空间,可用于日常工作中的数据存储。单个节点最多可挂载 15 块数据盘。 - 不同地域支持的云盘类型可能不同,请按需使用。云盘类型介绍,请参见 云盘规格。
说明 - 极速型 SSD 提供性能级别选择。不同性能的极速型 SSD 云盘提供的最大 IOPS、最大吞吐量、时延等性能值不同。
- 【邀测·申请试用】:部分计算规格,支持挂载本地盘。具体支持挂载本地盘的计算规格,请参见 实例规格清单。
- 格式化并挂载到容器、镜像存储目录:第一个数据云盘默认支持格式化并挂载给容器、镜像、Kubelet 组件相关的
/var/lib/containerd 和/var/lib/kubelet 目录使用。
若取消勾选,表示将/var/lib/containerd 和/var/lib/kubelet 目录挂载到系统盘操作系统所在分区中,请密切关注系统盘剩余可用容量风险。 - 指定挂载目录:默认不勾选,勾选后指定挂载目录,将数据云盘挂载到该目录。
例如,指定挂载目录为/vke ,第一个数据云盘同时格式化并挂载到容器和镜像存储目录时,/var/lib/containerd 和/var/lib/kubelet 目录会被关联绑定(Bind Mount)到/vke/var/lib/containerd 和/vke/var/lib/kubelet 。
|
项目 | 【邀测·申请试用】为集群指定所属项目,从项目纬度管理集群资源的运维、授权等操作。默认选择 default(默认项目)。更多项目相关操作和说明,请参见 项目管理。 |
- 安全配置
配置项 | 说明 |
---|
安全组 | 为保证集群和节点本身功能的正常运作,容器服务默认提供一个安全组(命名格式为<集群ID>-common )。
若需要添加自定义安全组规则,请勿与集群默认安全组规则冲突。集群默认安全组相关说明,请参见 集群默认安全组。 说明 自定义安全组时,单个节点池最多支持关联 4 个安全组。 |
登录方式 | 配置节点登录方式,以确保容器服务集群内节点可以免密登录。 - 密码:使用 root 用户登录认证,需配置 root 密码并二次确认。
- SSH 密钥对:一种安全的登录认证方式,包括公钥和私钥,仅支持 Linux 实例。
说明 无论是创建新节点或添加已有节点,在集群创建成功时,节点都具有新的操作系统,因此需要配置节点的登录方式。后续该节点所在节点池中的其他节点,均以此处设置的登录方式,登录节点。 |
安全加固 | 配置主机安全加固: - 开启:(默认)HIDS 主机防护免费提供异常登录等风险告警服务,在保证主机系统镜像兼容性的基础上,为节点(云服务器实例)提供实时监控、文件监控、进程监控、系统动态分析等安全加固功能。
- 关闭:关闭主机安全加固。
|
- 更多配置
配置项 | 说明 |
---|
节点标签 | 对应 Kubernetes 中的 Label,能够为节点定义不同的属性,方便批量筛选等需求,可为节点池中的节点批量添加相同标签。 单击 添加节点标签,根据界面提示输入 键 和 值。 |
Taints | 污点(Taints)能够使节点排斥某些特定的 Pod,避免 Pod 调度到该节点上,可为节点池中的节点批量添加相同污点。
单击 添加 Taints,根据界面提示输入 键、值 和 效果。其中污点 效果 选项说明如下: - NoSchedule:如果节点上存在至少一个该污点,则系统不会将 Pod 分配到该节点。
- NoExecute:任何不能忍受该污点的 Pod 都会被驱逐,任何可以忍受该污点的 Pod 都不会被驱逐。
- PreferNoSchedule:系统会尽量避免将 Pod 调度到存在其不能容忍污点的节点上,但不会强制执行。
|
- 高级配置

配置项 | 说明 |
---|
Kubelet 自定义参数 | 【邀测·申请试用】配置节点池中节点的 kubelet 自定义参数,用于调整节点行为。详细操作,请参见 配置节点池 kubelet 自定义参数。 |
节点名称自定义 | 默认不开启,开启后设置 节点名称前缀,用于在容器服务或云服务器中快速识别节点。后续该节点池中新增扩容的节点将自动使用此处定义的节点名称前缀。 |
节点元数据名称自定义 | 默认不开启,开启后设置 节点元数据名称前缀(metadata.name),用于在监控、告警等外部系统中标识资源。后续该节点池中新增扩容的节点将自动使用此处定义的节点元数据名称前缀。 |
镜像懒加载 | 【邀测·申请试用】默认不开启。开启后,节点池中的节点具备按需使用容器加速镜像的能力。更多说明,请参见 容器镜像懒加载方案。 |
部署执行脚本 | 输入 Shell 格式的脚本,节点部署 Kubernetes 组件后将自动执行该脚本。需要您自行实现脚本命令,并保证脚本的可重入及重试逻辑。 脚本及其日志文件可在节点的/usr/local/vke/userscripts 目录下查看。 该功能常用于修改 Containerd 配置参数等场景。 |
节点自动绑定公网 IP | 【邀测·申请试用】是否为集群中的节点自动绑定公网 IP(EIP): - 不开启:(默认)系统不会自动为节点分配 EIP。若后续需要访问公网,请参考 申请公网 IP 并绑定云服务器。
- 开启:系统自动为集群下的节点分配 EIP,此时您还需要自定义 EIP:
- 计费类型:EIP 支持 按量计费-按带宽上限、按量计费-按实际流量 两种计费类型。
- 线路类型:当前仅支持 BGP 类型。
- 带宽上限:自定义设置带宽上限。
说明 - 使用 EIP 将产生费用,资费详情请参见 公网 IP 计费指引。若 EIP 配额不足,请在 EIP 产品侧提交申请,更多说明,请参见 EIP 约束限制。
- 节点被删除或缩容时,已绑定的 EIP 会被同步释放。
|
封锁节点 | 将节点池中的节点调整到已封锁且不可调用状态,新创建的 Pod 无法调度到该节点池中的节点上,已经运行在该节点上的 Pod 不受影响。可手动执行kubectl uncordon 命令取消封锁。封锁节点将减少该节点所属集群的剩余可用资源配额,若集群本身预留的可用资源不足,将会影响后续正常业务的调度和存量业务的运行。 |
完成 节点池配置(可选) 后,单击页面右下角 下一步:组件配置。
组件配置
组件配置页包含了容器集群支持的所有功能性扩展组件及必要的系统组件,集群部署时默认会安装系统组件,功能性扩展组件可根据业务需求自行勾选。组件相关介绍,请参见 组件管理。
注意
- 系统组件默认安装且不可取消勾选,推荐安装的组件默认勾选,您可根据实际情况调整。
- 当前容器共享 GPU 的调度策略默认使用 spread/binpack 调度策略,若您不想使用默认调度策略配置,请参见 scheduler-plugin 组件 修改调整策略。
容器共享 GPU 调度相关内容,请参见 mGPU 概述。 - 容器网络模型为 VPC-CNI 时,若未在集群中同步创建节点或节点数为 0,则部分组件默认以弹性容器实例(VCI)方式部署。如果您需要以云服务器(ECS)方式部署组件,请手动配置。
完成 组件配置 后,单击页面右下角 下一步:配置确认。
配置确认
- 检查集群配置、节点配置、组件配置相关信息和前置检查通过情况。若需要更新配置,可单击标题后面的修改按钮,跳转到对应页面重新配置。
- 确认配置费用,可单击费用右侧帮助按钮,查看费用明细,包括:收费项、计费方式、数量、原价和折扣价。
- 阅读 《容器服务专用服务条款》 并勾选同意,单击页面右下角 确定 ,开始创建集群。
说明
集群创建预计需要 15~20 分钟,请您耐心等待,您也可以返回集群列表查看状态。
后续操作
集群创建成功后,在 集群 页面单击集群名称,进入集群详情页面,查看集群基本信息、资源用量、网络信息、节点信息、连接信息、运维配置。您也可在集群内部署 工作负载、查看监控、管理集群内资源等。