火山引擎 EMR on VKE 为您提供弹性伸缩功能,支持随业务波峰波谷的需求,自动动态扩缩容集群的计算资源。本文为您介绍如何配置资源的弹性伸缩规则并使用此功能。
当您在使用EMR虚拟集群过程中,如果资源经常出现波峰波谷的情况,那么在计算高峰时,自动扩展一部分临时计算能力,帮助您渡过业务计算高峰;渡过业务高峰后再进行自动缩容,便可以降低您的计算资源使用成本。
EMR 虚拟集群支持节点弹性伸缩,当集群的容量规划不能满足集群调度容量时,会通过添加 ECS(Elastic Compute Service,云服务器),补充集群整体的调度容量。
登录 EMR 控制台 后,从左侧导航栏中,进入资源管理 > on VKE> 虚拟集群详情 > 弹性伸缩 页签,单击页面中的 去配置 ,开始配置集群的弹性伸缩规则。
根据界面提示选择弹性伸缩的伸缩类型,并配置对应类型的规则细节参数。
当前EMR支持两种伸缩类型,节点即时弹性和节点自动伸缩。
配置基本信息。节点即时弹性类型 默认开启自动缩容开关,且不支持关闭。
自动缩容配置。
参数 | 配置说明 |
|---|---|
非GPU节点的缩容阈值 | 当非 GPU 类型节点的 CPU、内存资源使用率( 说明 非 GPU 类型节点的 CPU 或内存资源中任意一个达到缩容阈值,即可触发该规则。 |
GPU节点的缩容阈值 | GPU 类型节点的缩容策略根据其是否使用 mGPU 能力,有不同的缩容策略,默认阈值为 50%:
注意
|
缩容触发延迟 | 当节点资源使用率低于阈值,并持续该时间段后,集群将触发自动缩容。默认 10 分钟。 |
Pod 终止超时时间 | 节点排水时等待 Pod 终止的最大等待时间。整数形式,取值范围为 1~10000,单位为秒。默认为 600 秒。 |
配置基本信息。
参数 | 配置说明 |
|---|---|
扩容算法 | 节点池自动扩容时所采用的扩容算法类型,包括:
|
弹性灵敏度 | 用于判断集群弹性伸缩的时间间隔,支持取值:10s、15s、30s、60s、120s、180s 和 300s。 |
自动缩容 | 是否开启节点的自动缩容:
|
启动污点 | 单击 添加污点,配置启动污点。当节点上存在该污点时,系统认为该节点未完成初始化。 |
(可选)自动缩容配置。当基础信息中打开了“自动缩容”开关后,您还需配置自动缩容配置。
参数 | 配置说明 |
|---|---|
非GPU节点的缩容阈值 | 当非 GPU 类型节点的 CPU、内存资源使用率( 说明 非 GPU 类型节点的 CPU 或内存资源中任意一个达到缩容阈值,即可触发该规则。 |
GPU节点的缩容阈值 | GPU 类型节点的缩容策略根据其是否使用 mGPU 能力,有不同的缩容策略,默认阈值为 50%:
注意
|
缩容触发延迟 | 当节点资源使用率低于阈值,并持续该时间段后,集群将触发自动缩容。默认 1 分钟。 |
扩容后缩容冷却时间 | 节点进行扩容后,能再次执行缩容所需等待的时间间隔。默认 10 分钟。 |
缩容失败冷却时间 | 节点缩容失败后,能再次执行缩容所需等待的时间间隔。默认 3 分钟。 |
最大并发缩容数 | 节点缩容时,允许同时进行缩容的并发数目。默认 5。 |
Pod 终止超时时间 | 节点排水时等待 Pod 终止的最大等待时间。整数形式,取值范围为 1~10000,单位为秒。默认为 600 秒。 |
Pod 最小副本数 | 节点排水时允许存在的最小 Pod 数量。整数形式,取值范围为 1~10000。默认为 0。 |
Daemonset Pod 缩水 | 节点缩容前是否驱逐节点上 DaemonSet 类型的 Pod。
|
不缩容节点 | 勾选不进行缩容的节点。可选项如下:
|
配置完成弹性伸缩规则后,此规模默认“未开启”状态,您可以在弹性伸缩页签中,选择节点池启用或者关闭弹性伸缩。
开启弹性伸缩规则后,您也可根据需要调整弹性伸缩规则。
进入集群的弹性伸缩配置页面后,单击节点池的弹性伸缩规则的操作列的配置按钮,进入配置修改页。
根据界面提示,修改节点数量和优先级。
参数 | 配置说明 |
|---|---|
节点数量范围 | 弹性伸缩期间允许动态调整的节点数量范围,默认为0~10 |
优先级 | 弹性扩容算法为Priority时,对优先级高的节点池进行扩容。数字越大,优先级越高。默认为10。 |