资源队列是 EMR Serverless 中用于管理和隔离计算资源的逻辑单元,是计算能力,同时也是计费概念。我们支持用户在Serverless创建公共队列及独占混合异构队列,您可以自由组合 CPU 与 GPU 资源,实现数据预处理(CPU 密集型)与模型推理(GPU 密集型)的无缝串联,大幅提升资源利用率。队列创建完成后可运行Spark、Ray、Presto等多种类型任务。队列计费信息请参考计费概述。
说明
如需配置GPU资源,可通过 提工单 的方式,联系火山引擎技术支持人员申请。
配置项 | 示例 | 说明 | |
|---|---|---|---|
资源信息 | |||
地域 | 华北2(北京) | 选择资源所在的地理区域。不同地域的资源之间内网不互通。 | |
可用区 | 可用区A | 选择资源所在的可用区。您可以选择单个或多个可用区,更配时允许追加,但不允许删减。选择多个可用区表示您接受跨可用区部署,且底层节点资源不一定平均分布在各可用区。当单个可用区资源不足或发生故障时,可以实现故障切换和容灾备份,但业务的访问响应延迟可能会增加。我们建议超过 3000CU 的队列使用多可用区方案,以获得更好的资源供应。 | |
网络连接 | 开启 | 开启后,可以打通Serverless Spark到目标VPC的网络。
| |
付费信息 | |||
队列类型 | 包年包月独占队列 | 选择队列类型。
| |
付费时长 | 1个月 | 选择包年包月的购买时长。 | |
自动续费 | 开启 | 建议开启,以避免因资源到期影响业务。开启后,系统将在资源到期前按月从账户余额中自动扣费,无需手动支付。 | |
资源队列配置 | |||
队列名称 | emr_queue | 自定义队列的名称。可包含字母、数字、下划线,长度不超过99个字符。 | |
CPU资源配置 | 机型 | 标准型 (1:4) | 选择队列机型规格。 |
固定 | 32 | 设置队列的固定资源大小,单位为 CU (Compute Unit)。这部分资源将按包年包月方式计费。 | |
弹性 | 0 | 设置队列可动态扩展的弹性资源上限,单位为 CU。弹性容量在使用时按量计费。队列的弹性部分需小于等于256CU或最大限制(固定 CU 数),且输入值需为 32 CU 倍数。 | |
GPU资源配置 | 规格 | emr.ini2.7xlarge | 选择GPU资源规格。你可以在列表中选择一种或多种资源规格,每一种实例规格对应一定量的 CPU、内存、GPU,例如emr.ini2.7xlarge包含1张GPU-NVIDIA A30、28 vCPU 、234 GiB 内存。 |
数量 | 2 | 配置每种规格的台数,如配置2台emr.ini2.7xlarge,则包含2张GPU-NVIDIA A30、56 vCPU 、468 GiB 内存。 | |
mGPU | 开启 | mGPU 方案通过内核虚拟化技术,实现单张 GPU 显卡的共享,灵活分配算力核心与现存资源并严格隔离。 开启 mGPU 后,队列中的作业可直接指定调用单张 GPU 的部分核心与显存容量,在小模型场景能显著降低使用成本,提升资源利用率。 | |
Runtime | Java | 选择作业的运行时引擎。 | |
元数据配置 | |||
LAS | 开启 | 开通 EMR Serverless 队列时,需同步开通 LAS 作为元数据管理服务,LAS 开通详见:AI 数据湖服务开通。 | |
其他配置 | |||
默认授予使用权限 | 关闭 | 配置队列的默认访问权限。开启后,默认 全部账号 均可直接使用该队列,包括查看队列信息、监控以及向队列提交作业。 | |
标签 | 为资源添加标签,便于分类和管理。您可以选择已有标签,或创建新标签。说明最多可添加20个标签。 | ||