计算组概述--E-MapReduce-火山引擎

文档中心

E-MapReduce

创建与管理计算组

计算组概述

计算组是对队列资源的进一步划分，用于更高效地执行特定任务、优化资源分配并确保资源隔离。所有的查询和任务都需要提交到队列下的一个计算组。

计算组类型与资源分配逻辑

计算组类型

队列创建完成后，会为您自动创建一个Default的通用计算组，同时支持您根据后续作业运行需要自行规划并创建自定义计算组。计算组通过为不同类型的任务提供定制化的资源配置和管理，帮助用户实现更高效的任务执行。计算组可以分为：

通用计算组（默认创建的 Default 通用计算组、自定义创建的自定义通用计算组），适用于广泛的任务类型。
专用计算组（包括：Spark SQL Warehouse、Presto SQL Warehouse、Ray Cluster等）。专用计算组则针对特定任务类型提供优化的资源配置，确保任务能够高效执行。

以下为您介绍各类计算组的细分类型和资源分配方式。

计算组类型	计算组说明	计算组的资源分配方式
通用计算组-Default	队列自动创建好的默认计算组。	Default 通用计算组的计算组资源量为一个动态的资源量，其可用资源量为队列中创建好自定义计算组后，队列剩余的可用资源量。
自定义计算组	支持创建通用计算组、SparkSQL Warehouse、PrestoSQL Warehouse等多种类型的自定义计算组。	自定义计算组中：自定义-通用计算组：计算组的资源为“逻辑分配”的分配方式，即，自定义通用计算组创建完成后，并不会直接将队列中的资源直接隔离分配给对应自定义通用计算组，而是在有作业运行在此计算组时才会进行资源分配。其他类型自定义计算：其他类型的自定义计算组在创建完成后，即会根据计算组的资源分配配置结果，将队列中的资源隔离分配给对应计算组。

计算组类型

计算组说明

计算组的资源分配方式

通用计算组-Default

队列自动创建好的默认计算组。

Default 通用计算组的计算组资源量为一个动态的资源量，其可用资源量为队列中创建好自定义计算组后，队列剩余的可用资源量。

自定义计算组

支持创建通用计算组、SparkSQL Warehouse、PrestoSQL Warehouse等多种类型的自定义计算组。

自定义计算组中：

自定义-通用计算组：计算组的资源为“逻辑分配”的分配方式，即，自定义通用计算组创建完成后，并不会直接将队列中的资源直接隔离分配给对应自定义通用计算组，而是在有作业运行在此计算组时才会进行资源分配。
其他类型自定义计算：其他类型的自定义计算组在创建完成后，即会根据计算组的资源分配配置结果，将队列中的资源隔离分配给对应计算组。

由上可知：

队列中实际可用的资源量即为Default计算组的资源量，如果再次创建新的计算组，则会从Default计算组中再进行资源分配。
在创建计算组的过程中，如果有作业刚好运行在Default计算组中、占用了部分Default计算组资源，可能会出现需要分配给新建计算组的资源被临时占用的情况，此时会根据新建计算组时配置的“资源抢占策略”来处理被运行在Default计算组作业临时占用的资源。

何时使用计算组

计算组特别适用于以下几种情况，尤其是专用计算组：

PrestoSQL 任务的资源需求
PrestoSQL 必须有一个常驻的 coordinator 来启动任务，因此你没有办法在通用计算组（Default 计算组）执行 PrestoSQL 任务。此时，通过创建 Presto SQL Warehouse 计算组，为 PrestoSQL 任务预留常驻资源，可以确保 PrestoSQL 的执行。
对性能有更高要求的任务
对于 SparkSQL 这样的任务，Spark SQL Warehouse 计算组通过预热资源的方式减少了任务执行的延迟，使任务能够在秒级时间内启动，特别适用于需要快速响应的即席查询任务。
需确保独立的资源执行的任务
计算组将队列的资源划分成多个独立的单元，为不同类型的任务提供专门的资源。这种划分能够有效避免资源竞争，确保每个任务根据其资源需求得到合理分配，特别适用于需要确保资源的任务。

通用计算组（Default 计算组）与专用计算组（Spark SQL Warehouse、Presto SQL Warehouse、Ray Cluster）的区别如下。

特点	通用计算组 (Default 计算组)	专用计算组 (Spark SQL Warehouse、Presto SQL Warehouse、Ray Cluster)
适用任务	SparkSQL, SparkJar, PySpark, RayJob, HiveSQL, CustomJob	SparkSQL（Spark SQL Warehouse）、PrestoSQL（Presto SQL Warehouse）、RayJob（Ray Cluster）
资源管理	动态分配资源，多个作业共享资源池，作业级别分配资源。	独立管理自身的资源，支持常驻资源、按需资源等。资源规格固定，资源已经预拉起了，作业级别的资源自定义无效。
任务灵活性	高，支持多种作业类型	仅支持特定类型任务，但能提供更高效的执行性能
延迟优化	较高，资源动态申请可能导致延迟	较低，减少了预拉起时间
优点	灵活性高，支持多种作业类型	提供针对特定任务的资源优化
缺点	资源需要动态申请，有一定耗时（30s左右）	灵活性较低，适用于特定类型的任务，无法支持多种任务类型的运行
适用场景	生产&大型任务	AdHoc 等对时延敏感的查询（Spark SQL Warehouse/Presto SQL Warehouse）；需要资源分割、保障的 Ray 作业（Ray Cluster）

操作指导

队列创建完成后，您可以基于作业规划自行规划并创建计算组，合理分配队列资源；并可在后续作业运行过程中即时查看计算组的资源消耗情况、作业实例的状态等，详情请参见创建与管理计算组。

最近更新时间：2026.01.28 10:11:05

这个页面对您有帮助吗？

有用

无用