本文将为您介绍如何通过火山引擎 LAS 湖仓一体分析平台,在已创建的集群上创建并执行作业。
下文将通过三种作业提交方式,来创建并运行作业:
说明
Hue 已默认接入了 LDAP 鉴权,所以您可以通过查看 LDAP slapd.conf 配置信息,来获取登录所需的用户名和密码:
说明
Spark Jar 资源,在不同集群版本中,镜像路径会不一致,其余集群版本可根据实际情况进行替换。更多版本操作详见 Spark-快速开始。
以下提交命令,以 3.X 集群版本为例。
sudo su emr source ~/.profile spark-submit --class org.apache.spark.examples.SparkPi --master yarn --num-executors 3 --driver-memory 512m --executor-memory 512m --executor-cores 1 /usr/lib/emr/current/spark/examples/jars/spark-examples_2.12-3.2.1-bd1-SNAPSHOT.jar
部分重要任务参数说明如下:
参数 | 样例 | 备注 |
---|---|---|
driver-memory | 512m | driver 程序使用的内容,最大不可超过该节点的总内存资源 |
num-executors | 3 | 并行 executor 个数 |
executor-memory | 512m | 单个 executor 使用的内存大小,最大不可超过该节点的总内存资源 |
executor-cores | 1 | 单个 executor 的并行数 |
class | org.apache.spark.examples.SparkPi | 程序入口类 |
master | yarn | 程序执行模式,可选 yarn,yarn-client |