本文为您介绍挂载NAS的操作全流程。
当前支持通过 FSX 方式挂载 NAS。
注意事项 | 说明 |
|---|---|
存储类型 | NAS 需选择缓存型。 |
挂载要点 | 您需要自行创建 FSX 接入点。 |
网络要求 | 需要保障好接入点的 VPC 与 EMR 存储网络 VPC 为同一个 VPC。 |
EMR Serverless 通过 FSX 协议挂载 NAS 时,您还需要在 NAS 中创建好接入点,以便后续挂载和访问。
关键配置参数说明如下,详细操作指导请参见:创建接入点。
关键参数 | 配置说明 |
|---|---|
私有网络 | 需保障和EMR Serverless 存储网络配置的保持一致。 |
权限组 | 选择默认权限组即可。 |
接入点根目录 | 填写"/"即可(若您需要限制访问特定目录下的文件,可填特定目录)。 |
您可以在创建计算组时选择配置共享文件存储,也可修改计算组配置时配置。
参数 | 配置说明 |
|---|---|
文件系统名称 | 在下拉框中选择待挂载的文件系统。 |
文件系统接入点 | 在下拉框中选择已创建的接入点。 |
文件系统路径 | 查看需要挂载的 NAS 的文件系统路径。此处会展示接入点的文件路径配置结果,无需再次配置。 |
挂载路径 | 设置当前存储在 EMR 队列中挂载的路径。 |
只读开关 | 设置挂载存储后,是否设置为”只读“。打开开关后,后续仅支持从挂载的存储路径中读取数据,不支持写入数据。 |
目前 EMR Serverless 产品可支持在下列引擎类型的作业中挂载存储。
当前支持在界面上进行设置,也支持在任务提交代码中设置。
serverless.fsx.volumes参数来指定您需要在作业中挂载的文件系统路径及对应在 Pod 中的路径。配置示例
-- 开启跨VPC网络配置 set serverless.cross.vpc.access.enabled = true; -- 设置存储挂载参数 set serverless.fsx.volumes=[{"type": "vepfs", "fileSystemId": "vepfs-cnxxx", "volumePath": "/abc/", "mountPath": "/data/def", "capacity": "100Gi", "readOnly": false}]; select 1;
说明
在 Spark 作业中挂载 NAS 文件系统时,需要增加set spark.files.useFetchCache=false;配置。
参数说明
参数名 | 是否必填 | 默认值 | 说明 |
|---|---|---|---|
type | 是 | 无 | 文件系统类型,此处可选值为:
|
fileSystemId | 是 | 无 | 文件系统 ID |
volumePath | 是 | 无 | 文件系统待挂载的路径(vePFS/NAS 中的原路径),需满足:
|
mountPath | 是 | 无 | 挂载到 Pod 中的路径 |
capacity | 否 | 100Gi | 容量 |
readOnly | 否 | false | 是否为只读,false 为读写,true 为只读 |
注意
配置了存储挂载的作业暂无法使用独占队列的弹性资源,仅能在固定资源中执行。若固定资源被占满,这类作业会排队等待,直至固定资源释放后再调度执行
NAS 接入点默认对本账号下所有子用户开放读写,如果您对子用户的读写权限有管控需求,可以通过以下方式管理权限。
说明
IAM 策略开启后,默认所有子用户无访问权限。特定子用户需接入点读写权限,可参考 权限策略。