E-MapReduce
本文为您介绍挂载vePFS的操作全流程。
当前支持通过 FSX 和 S3FS 两种挂载方式方式挂载 TOS。
注意事项 | 说明 |
|---|---|
挂载要点 | 您需要获取有访问 TOS 权限的访问秘钥 AK、SK,通过 AK、SK来实现挂载加密认证。 |
网络/地域要求 | 您需要保障 TOS bucket 的地域与 EMR/存储网络 VPC 在同一个地域。 |
您可以在创建计算组时选择配置共享文件存储,也可修改计算组配置时配置。
参数 | 配置说明 |
|---|---|
AK / SK | 填写已准备好的AK、SK信息,单击”联通性测试“,完成联通性测试后继续后续参数的配置。 |
源地址 | 选择待挂载的 TOS bucket路径。 |
挂载路径 | 设置当前存储在 EMR 队列中挂载的路径。 |
只读开关 | 设置挂载存储后,是否设置为”只读“。打开开关后,后续仅支持从挂载的存储路径中读取数据,不支持写入数据。 |
目前 EMR Serverless 产品可支持在下列引擎类型的作业中挂载存储。
当前支持在界面上进行设置,也支持在任务提交代码中设置。
serverless.fsx.volumes参数来指定您需要在作业中挂载的文件系统路径及对应在 Pod 中的路径。配置示例
-- 开启跨VPC网络配置 set serverless.cross.vpc.access.enabled = true; -- 设置存储挂载参数 set serverless.fsx.volumes=[{"type": "vepfs", "fileSystemId": "vepfs-cnxxx", "volumePath": "/abc/", "mountPath": "/data/def", "capacity": "100Gi", "readOnly": false}]; select 1;
说明
在 Spark 作业中挂载 NAS 文件系统时,需要增加set spark.files.useFetchCache=false;配置。
参数说明
参数名 | 是否必填 | 默认值 | 说明 |
|---|---|---|---|
type | 是 | 无 | 文件系统类型,此处可选值为:
|
fileSystemId | 是 | 无 | 文件系统 ID |
volumePath | 是 | 无 | 文件系统待挂载的路径(vePFS/NAS 中的原路径),需满足:
|
mountPath | 是 | 无 | 挂载到 Pod 中的路径 |
capacity | 否 | 100Gi | 容量 |
readOnly | 否 | false | 是否为只读,false 为读写,true 为只读 |
注意
配置了存储挂载的作业暂无法使用独占队列的弹性资源,仅能在固定资源中执行。若固定资源被占满,这类作业会排队等待,直至固定资源释放后再调度执行