任务产出数据登记,用于记录任务、数据血缘信息,并不会对代码逻辑造成影响。您可在调度设置 > 任务产出数据登记一栏中,设置产出登记相关信息。
使用限制
- ByteHouse CE SQL、Doris SQL、Oracle SQL、SQLServer SQL 任务类型,暂不支持自动登记操作,后续敬请期待。您可先通过手动登记的方式进行产出数据登记。
- Shell、Spark、Python、Perl 任务类型,任务产出数据登记操作不在调度设置中,您需在任务配置时进行填写操作,入口如下所示:

数据登记操作
Apache Hadoop/MiniBase Hadoop HSQL、StarRocks SQL、GBase 8A SQL、GaussDB SQL、LAS SQL、Greenplumn SQL 任务类型,支持自动和手动方式登记其任务产出数据。如果任务含有对应引擎库表数据的产出时,强烈建议填写,以便后续维护任务数据血缘关系。

在任务编辑界面,单击右侧调度设置按钮,进行以下任务产出数据登记操作:
- 自动登记:
任务产出数据使用“自动登记”模式,则任务每次上线时,系统将根据代码解析结果自动进行更新。您可单击查看“线上版本”的产出数据、查看“草稿版本”的产出数据按钮,查看当前任务不同版本下的产出数据自动登记结果。说明
ByteHouse CE SQL、Doris SQL、Oracle SQL、SQLServer SQL、Shell、Spark、Python、Perl 任务类型,暂不支持自动登记操作。
- 手动登记:
当任务类型中,不支持自动登记,或一个 SQL 任务中有其他更多数据表产出时,您可通过手动登记的方式进行填写。
您手动填写的内容即为任务产出,支持填写多个。其他任务依赖时,您可在其调度设置界面,通过依赖推荐或手动添加的方式,依据此处任务产出的库表名信息来搜索添加依赖。说明
若刚通过 SQL 方式创建的库表,手动登记选择不到库表时,您可先前往数据地图 > 元数据采集界面,手动执行元数据采集后,便可继续进行手动登记选择库表操作。手动执行采集操作详见元数据采集。
具体登记内容包括以下内容,以 MiniBase Hadoop 引擎下 HSQL 任务为例:
- 数据类型选 Hive:当任务逻辑会将数据写入到 Hive 表,需填写 Hive 的数据库名、表名、分区名,分区内容可以使用变量,如 ${date}、${hour} 形式。
- 数据类型选其他:该任务逻辑不写数据到 Hive 表。