注意
NAS仅缓存型实例支持FSX协议,创建NAS实例时请选择缓存型。
说明
文件系统接入点 VPC 的配置请参考创建接入点。
EMR Serverless 通过 FSX 协议挂载 vePFS/NAS 接入点,首先需要在 vePFS/NAS 控制台创建好接入点以便后续挂载和访问。
说明
若您需要通过 EMR 控制台管理进行挂载权限配置则可以跳过此步骤,EMR 控制台创建路径权限时会自动创建接入点。
操作路径:vePFS 控制台 > 文件系统 > 文件系统列表 > 文件系统名称 > 协议服务 > 接入点管理 > 创建接入点。
说明
操作路径:NAS 控制台 > 文件系统 > 文件系统列表 > 文件系统名称 > 接入点 > 创建接入点。
说明
vePFS/NAS 接入点默认对本账号下所有子用户开放读写,如果您对子用户的读写权限有管控需求,可以通过以下两种方式管理权限:
打开 IAM 权限(以 vePFS 为例)。
说明
IAM 策略开启后,默认所有子用户无访问权限。特定子用户需接入点读写权限,可参考 权限策略。
说明
您须拥有队列 Admin 权限和 vePFS/NAS 文件系统修改权限。
注意
目前 EMR Serverless 产品可支持在下列引擎类型的作业中挂载 vePFS/NAS:
在作业原参数设置的基础上,您可以通过增加serverless.fsx.volumes参数来指定您需要在作业中挂载的 vePFS/NAS 文件系统路径及对应在 Pod 中的路径。同时,由于 fsx 访问协议服务接入点需要跨 VPC,因此提交任务时需开启跨 VPC 设置。
-- 开启跨VPC网络配置 set serverless.cross.vpc.access.enabled = true; -- 设置vePFS/NAS挂载参数 set serverless.fsx.volumes=[{"type": "vepfs", "fileSystemId": "vepfs-cnxxx", "volumePath": "/abc/", "mountPath": "/data/def", "capacity": "100Gi", "readOnly": false}]; select 1;
说明
在 Spark 作业中挂载 NAS 文件系统时,需要增加set spark.files.useFetchCache=false;配置。
参数名 | 是否必填 | 默认值 | 说明 |
|---|---|---|---|
type | 是 | 无 | 文件系统类型,此处可选值为:
|
fileSystemId | 是 | 无 | 文件系统 ID |
volumePath | 是 | 无 | 文件系统待挂载的路径(vePFS/NAS 中的原路径),需满足:
|
mountPath | 是 | 无 | 挂载到 Pod 中的路径 |
capacity | 否 | 100Gi | 容量 |
readOnly | 否 | false | 是否为只读,false 为读写,true 为只读 |
注意
配置了存储挂载的作业暂无法使用独占队列的弹性资源,仅能在固定资源中执行。若固定资源被占满,这类作业会排队等待,直至固定资源释放后再调度执行