最近更新时间:2023.11.02 11:20:56
首次发布时间:2022.11.11 18:00:44
您可以自行编写业务应用程序并构建 JAR 包,将业务 JAR 包上传后即可创建 Spark JAR 任务,流程简单。本文通过一个简单示例,介绍如何开发 JAR 任务。
本文将 Spark JAR 任务开发流程总体分为了三个阶段,分别是开发阶段和运维阶段,每个阶段对应的成员及主要工作均不相同。
Spark 控制台提供了 JAR 包资源统一管理的功能,您在体验开发 JAR 任务前,需要提前将 JAR 包上传到控制台。
在顶部菜单栏选择目标地域。
在左侧导航栏选择项目管理,在搜索框中根据项目名称进行模糊搜索,然后单击项目区块进入项目。
在项目左侧导航栏选择任务开发 > Jupyter lab,单击资源库栏目,然后单击添加按钮。
在创建资源对话框,设置资源名称,上传 JAR 包,然后单击确定。
配置 | 说明 |
---|---|
资源名称 | 自定义设置 JAR 包资源名称,注意末尾需要携带 |
资源上传 | 上传本地的业务 JAR 包。 |
资源描述 | 填写所上传的 JAR 包的描述语言,一般为功能描述。 |
在顶部菜单栏选择目标地域。
在左侧导航栏选择项目管理,在搜索框中根据项目名称进行模糊搜索,然后单击项目区块进入项目。
在项目左侧导航栏选择任务开发 > Jupyter lab,然后单击加号按钮创建任务,也可以单击 Launcher 页签下的 Spark Jar 区块。
在创建任务对话框,设置关键参数,然后单击确定。
配置 | 说明 |
---|---|
任务名称 | 自定义设置任务的名称。 |
任务类型 | 选择 Spark 任务 > Jar。 |
所在文件夹 | 从下拉列表中选择目标文件夹。 |
引擎版本 | 目前支持 Spark 3.0.1-volcano 和 Spark 3.2.2-volcano 两个引擎版本。 |
在任务配置区域,设置关键参数。
配置 | 说明 |
---|---|
任务名称 | 创建任务时设置的名称,此处可修改名称。 |
Jar URI | 从下拉列表中选择已上传的 JAR 包。 |
Entrypoint Class | 业务 JAR 包程序的主类。 |
Entrypoint main args | 业务程序 main 函数的 |
任务开发和配置完成后,单击保存。
说明
如果您对 Driver 和 Executor 有特殊要求,或者任务需要依赖文件,请配置 Spark 启动参数。相关文档,请参见配置Spark启动参数。
开发与生产隔离,当任务开发者完成任务开发后,可以将任务上线到生产环境。
在任务配置区域上方,单击上线。
在任务上线设置对话框,选择运行资源池、设置任务优先级和调度策略,然后单击确定。
系统会提示任务上线成功,可以前往任务管理页面查看。
配置 | 说明 |
---|---|
资源池 | 从下拉列表中选择 Spark 资源池。 |
任务优先级 | 系统默认预置的优先级为 L3,您可以按需设置任务优先级,数字越小优先级越高。 |
调度策略 | 根据需求配置任务调度策略:
|
调度时长 | 设置为 GANG 调度策略时,需要设置调度时长。 |
开发与生产隔离,任务开发者将任务上线到生产环境后,由运维人员启动任务。
任务在生产环境上正常运行后,您可以在 Spark UI 上查看任务的运行情况。