You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件(私有化)

大数据研发治理套件(私有化)

复制全文
Greenplum引擎
Greenplum SQL任务
复制全文
Greenplum SQL任务

Greenplum数据库是MPP架构的大数据分析引擎,它基于PostgreSQL构建,具有强大的大规模数据分析任务处理能力。
DataLeap数据开发已接入Greenplum数据库引擎能力,支持您在数据开发任务中,通过创建Greenplum SQL任务类型,来实现对Greenplum数据库表的周期性调度操作或手动执行运维等能力,提高作业的执行效率。
下文将为您介绍如何创建Greenplum SQL任务类型节点进行数据开发。

使用前提

新建DataLeap项目时,已在引擎服务绑定设置中,勾选Greenplum数据库引擎。操作详见“新建项目”。

新建任务

  1. 登录DataLeap控制台。
  2. 选择数据开发 > 任务开发,进入任务开发页面。
  3. 单击新建任务 > 数据开发 > Greenplum引擎类型按钮。
  4. 选择离线数据Greenplum SQL任务。
  5. 填写任务基本信息:
    1. 任务名称:输入任务的名称,只允许字符.、字母、数字、下划线、连字符、[]、【】、()、()以及中文字符,且需要在127个字符以内。
    2. 保存至: 选择任务存放的目标文件夹目录。
      Image
  6. 单击确定按钮,完成任务创建。

任务配置

任务创建完成后,您便可进入Greenplum SQL任务编辑界面,进行以下操作:

  1. Greenplum SQL语句编辑
    您可在编辑框中,开始编辑相应的Greenplum SQL语句,也支持时间参数 ${date}、${hour} 等,您可根据实际场景进行对Greenplum数据库的访问操作。
    参考示例如下:

    CREATE TABLE people_x (
        id SMALLINT PRIMARY KEY,
        name VARCHAR(25),
        age BIGINT)
    ;
    INSERT INTO people_x VALUES (1, 'test', 18);
    SELECT * FROM people_x;
    
  2. 界面说明:
    Image

    序号

    功能

    说明

    1

    运行

    代码编辑完成并解析成功后,您可单击运行按钮,即可执行查询。

    2

    格式化

    对当前节点中输入的SQL代码进行格式化排列,常用于单行代码过长的情况。

    3

    解析

    解析检查书写的Greenplum SQL代码的语法和语义正确性,运行前检查语法错误信息,防止运行出错。

    4

    参数说明

    代码中可使用时间变量说明,如 ${DATE}、${hour}等。详见“调度参数说明”。

    5

    结果页

    代码执行成功后,在下方展现调试记录、查询结果、查询日志等信息。

    6

    结果页操作

    运行成功后,查询结果会以Excel形式展现,无需跑多段代码,您便可在此对查询数据结果进行操作和分析。更多结果页功能说明,详见“运行任务-查询结果功能说明”。

  3. 调度设置
    单击右侧侧边栏的调度设置,配置调度设置相关参数,便可进行Greenplum SQL任务周期性调度。调度设置说明详见“调度设置”。

调试运行并提交

任务配置完成后,您可单击操作栏中的保存调试按钮,进行任务调试。
调试结果无误后,单击提交上线按钮,在提交上线对话框中,选择回溯数据、监控设置、提交设置等参数,最后单击确认按钮,完成作业提交。 提交上线说明详见:提交上线

注意

  • 调试操作,直接使用线上数据进行调试,需谨慎操作。
  • 如果租户项目管理员在项目控制台>流水线管理中启用了流水线流程校验,则您需要确保提交的任务符合流水线扩展程序的校验规则,才能成功提交。详见4 流水线管理

后续任务运维操作详见:离线任务运维

最近更新时间:2025.07.02 17:59:02
这个页面对您有帮助吗?
有用
有用
无用
无用