为满足用户通过 Ray 进行多模态数据处理等需求,EMR Serverless 支持用户进行 Ray 作业的提交和执行。开箱即用,无需额外的集群管理。
登录 EMR Serverless 控制台,在左侧导航栏单击 作业中心 > 作业管理,进入作业管理页面后单击右上角的”创建作业“,进入作业创建页面。
您也可以在 Serverless 的队列/计算组页面的右上角单击“创建作业”,跳转至创建作业页面。
在作业创建页面配置作业参数。
配置作业基本信息与资源配置。
配置作业环境。
参数 | 配置说明 |
|---|---|
任务主文件 | 选择已上传至当前 Serverless 队列同区域的 TOS 桶中的主文件。 |
入口命令 | RayJob提交的入口命令,通常为 |
高级配置。
参数 | 配置说明 |
|---|---|
GCS高可用 | 提交 RayJob 时,您可以在页面通过开关选择是否启用 GCS 高可用。 说明
若选择启用,需要填写以下参数:
|
网络连接 | 设置是否开启网络连接,开启后,需设置对应的VPC、子网、安全组。 |
自定义参数 | 根据作业实际情况添加作业自定义参数。 |
存储挂载路径 | 设置当前作业可能需要挂载的存储路径,详情请参见存储挂载概述。 |
完成作业编辑后,单击右下角的 创建并运行 按钮,提交作业。
您也可以仅创建,后续在作业列表页面再手动触发任务运行。
详细操作请参考:Serverless Ray 使用指南。
作业创建完成后,您可以在作业列表页面查看所有已创建的作业,并可手动触发作业运行,或者对作业进行编辑修改、删除的操作。
在作业提交后,您也可以在 作业中心 > 作业实例 页面查看所有已提交的作业运行实例详情,包括运行状态、作业类型、资源详情、提交人等。
分类 | 参数名 | 默认值 | 描述 | 配置示例/格式 |
|---|---|---|---|---|
镜像与启动 | serverless.ray.entrypoint.cmd | 无 | 启动 Ray 作业的命令。 |
|
镜像与启动 | serverless.ray.entrypoint.bundle.path | 无 | 作业代码或依赖包的TOS地址。 |
|
镜像与启动 | serverless.customized.image.enabled | false | 是否启用自定义镜像。
| true |
镜像与启动 | serverless.ray.image | 无 | 使用的镜像地址 |
|
基础配置 | serverless.ray.cluster.name | 无 | Ray 集群名称 | |
基础配置 | serverless.ray.runtime.env.json | 无 | 运行时环境变量,JSON 格式 |
|
基础配置 | serverless.ray.head.pod.env | 无 | Head Pod 的环境变量配置。 |
|
基础配置 | serverless.ray.worker.pod.env | 无 | Worker Pod 的环境变量配置。 |
|
调度与部署 | serverless.ray.autoscaler.options.idle.timeout.seconds | 60 | Worker 空闲自动释放时间(秒) | 无 |
调度与部署 | serverless.ray.enable.autoscaling | false | 是否启用 Worker 的自动伸缩 | 无 |
调度与部署 | serverless.ray.autoscaler.options.cpu | 500m | 自动伸缩中每个 Worker 的 CPU 配置,需配置为大于0的整数 | 无 |
调度与部署 | serverless.ray.autoscaler.options.memory | 512Mi | 自动伸缩中每个 Worker 的内存配置,需配置为大于0的整数 | 无 |
网络与访问 | serverless.cross.vpc.access.enabled | 无 | 是否启用跨 VPC 访问 | 无 |
网络与访问 | serverless.cross.vpc.accountId | 无 | 跨 VPC 的目标账号 ID | 无 |
网络与访问 | serverless.cross.vpc.vpc.id | 无 | 跨 VPC 的目标 VPC ID | 无 |
网络与访问 | serverless.cross.vpc.subnet.ids | 无 | 跨 VPC 的目标子网 ID | 无 |
网络与访问 | serverless.cross.vpc.security.group.id | 无 | 跨 VPC 的安全组 ID | 无 |
网络与访问 | serverless.cross.vpc.dns.resolve.enabled | false | 是否启用跨 VPC 的 DNS 解析 | 无 |
资源配置 | serverless.ray.head.cpu | 1 | Head 节点的 CPU 配额,需配置为大于0的整数 | 无 |
资源配置 | serverless.ray.head.memory | 2Gi | Head 节点的内存配额,需配置为大于0的整数,配置参数取值时需包含单位 | 无 |
资源配置 | serverless.ray.head.gpu.amount | 0 | Head 节点的 GPU 数量,需配置为大于0的整数 | 无 |
资源配置 | serverless.ray.head.gpu.vendor | nvidia.com | Head 节点的 GPU 厂商(如 NVIDIA) | 无 |
资源配置 | serverless.ray.worker.cpu | 1 | Worker 节点的 CPU 配额,需配置为大于0的整数 | 无 |
资源配置 | serverless.ray.worker.memory | 2Gi | Worker 节点的内存配额,需配置为大于0的整数,配置参数取值时需包含单位 | 无 |
资源配置 | serverless.ray.worker.gpu.amount | 0 | Worker 节点的 GPU 数量,需配置为大于0的整数 | 无 |
资源配置 | serverless.ray.worker.gpu.vendor | nvidia.com | Worker 节点的 GPU 厂商 | 无 |
资源配置 | serverless.ray.worker.replicas | 1 | 固定模式下 Worker 副本数量 | 无 |
资源配置 | serverless.ray.worker.min.replicas | 无 | 自动伸缩的最小 Worker 副本数,需配置为大于0的整数 | 无 |
资源配置 | serverless.ray.worker.max.replicas | 无 | 自动伸缩的最大 Worker 副本数,需配置为大于0的整数 | 无 |
资源配置 | serverless.ray.start.params.head.num.cpus | 无 | 启动 Head 节点时预留 CPU 核数 | 无 |