最近更新时间:2024.04.11 10:47:39
首次发布时间:2021.09.14 11:21:01
DataSail 全域数据集成提供离线集成数据同步能力,支持丰富的异构数据源之间,进行高速稳定的数据同步操作,将源端数据库中的数据,通过离线的方式,同步至目标数据库中,实现目标库和源库的数据保持对应。
本文将为您介绍离线数据同步的操作说明。
数据集成使用的数据源,需要先在项目控制台下注册。离线数据同步支持的数据源类型,请参见:支持的数据源。
数据源需要在连通网络的前提下进行数据同步,相关说明请参见:配置网络连通 。
数据源的具体配置参数信息,请参见:配置数据源 。
创建离线数据集成任务的步骤如下:
新建离线集成任务完成后,需要配置相关任务信息,离线集成任务支持可视化和脚本模式配置,具体操作步骤如下:
选择数据源。
说明
配置来源端和目标端字段的映射关系。
字段映射支持选择基础模式和转换模式配置映射:
说明
基础模式和转换模式不支持互相切换,模式切换后,将清空现有字段映射中所有配置信息,一旦切换无法撤销,需谨慎操作。
转换模式:
字段映射支持数据转换,您可根据实际业务需求进行配置,将源端采集的数据,事先通过数据转换后,以指定格式输入到目标端数据库中。在转换模式中,你可依次配置:来源节点、数据转换、目标节点信息:
配置节点 | 说明 |
---|---|
来源节点 | 配置数据来源 Source 节点信息:
配置完成后,单击确认按钮,完成来源节点配置。 |
数据转换 | 单击数据转换右侧添加按钮,选择 SQL 转换方式,配置转换信息和规则:
配置完成后,单击确认按钮,完成数据转换节点配置。 |
目标节点 | 配置目标节点 Sink 信息:
配置完成后,单击确认按钮,完成目标节点配置。 |
基础模式:
说明
同名映射能力,仅部分数据源支持,如 FTP/SFTP 数据源。
注意
请注意列与列之间映射的字段类型是否数据兼容。
设置以下任务运行参数:
参数 | 说明 |
---|---|
期望最大并发数 | 数据同步任务内,可以从源并行读取或并行写入数据存储端的最大线程数。 |
脏数据设置 | 任务中字段映射没有匹配到的数据,如格式非法,或源端数据进入目标端时发生了异常。例如:源端是 String 类型的数据写到 INT 类型的目标字段中,因为类型转换不合理而无法写入的数据。 |
自定义参数设置 |
各数据源常见高级参数使用详见高级参数。 |
注意
切换脚本模式将清空现有可视化界面配置,一旦切换无法撤销。
注意
导入新的脚本模版将清空现有内容,一旦导入无法撤销。
任务代码逻辑和参数配置完成后,您可在编辑器上方,单击操作栏中的保存和调试按钮,进行任务调试。
注意
调试操作,直接使用线上数据进行调试,需谨慎操作。
调试任务开始运行后,可在下方查看调试记录,单击调试记录按钮,可以查看以下详情内容:
任务调试成功且结果确认无误后,单击上方操作栏中的保存和提交上线按钮,在提交上线对话框中,选择回溯数据、监控设置、提交设置等参数,最后单击确认按钮,完成作业提交。 提交上线说明详见:数据开发概述---离线任务提交。
后续任务运维操作详见:离线任务运维。