前置操作
数据源连接配置
实时整库同步来源端和目标端涉及的数据源配置,均可在数据开发 > 数据源管理中进行配置,相关操作可参见“注册数据源”。
GaussDB CDC 源端要求
当解决方案中源端数据库为GaussDB时,应确保DataLeap连接GaussDB的数据库账号具备如下条件:
- 此账号具备GaussDB中的gs_role_replication角色。
KingBase CDC 源端要求
当解决方案中源端数据库为Kingbase时,应具备如下条件:
- 源库KES的License需要启用逻辑复制功能,即License中的“逻辑复制”状态为“启用”;
- kingbase.conf中的wal_level配置需要设置为logical级别。
- DataLeap连接Kingbase的数据库账号,应具备replication角色以获得对应的权限。
Dameng CDC 源端要求
当解决方案中源端数据库为Dameng时,目前仅支持读取以下数据类型:
说明
除以下列表中的数据类型外,暂时不支持对其他数据类型的读取,若任务读取的字段中包含其他数据类型,任务将执行异常。
使用限制
- 整库实时同步解决方案目前支持选择的表数量上限为2000张,但建议先以 100 张以下表数量来试用。
- 目标端数据库需要提前先创建好,暂不支持在解决方案中自动创建目标库。
- 目标端为 LAS、ByteHouse企业版、StarRocks 时,实时整库解决方案支持自动建表能力,其余目标端数据源不支持自动建表。
- 实时整库同步解决方案目前暂不支持对视图的读取。如源端为 MySQL、Oracle、SQLServer、PostgreSQL 等数据库,该解决方案无法读取源端库中的视图相关数据。
- 源端为 GaussDB、Oracle、TiDB、Dameng 数据源类型,必须通过 Kafka 数据缓存方式进行配置,暂不支持直连模式。使用缓存方式时,您需先在 Kafka 数据源中创建好 Topic 信息,方便在解决方案配置数据缓存时使用。
- 当解决方案源端为 Oracle 数据源时,需添加以下两项配置:
- 您需通过配置高级参数:
job.reader.database_include_list = orcl,在解决方案执行期间指定 Oracle 数据库的连接方式,即 jdbc 连接串最后的 serviceName 或者 sid 信息(值可指定为 orcl),以确保能够正常实时读取 Oracle 数据。

- 您需在库表映射规则处,额外添加映射规则,“源库名:Oracle 连接方式的 serviceName 或 sid 信息 > 目标库名:目标数据库名称”,如 ORCL > dts,其中 Oracle 的 serviceName 或 sid 信息需注意区分大小写。

注意事项
- 实时整库解决方案写入目标数据表时,已创建的目标端数据表中,必须要有主键字段。
- 目前表建立方式为选用已有表时,需要保证目标表schema和源表schema的表名称、字段名称和字段数量保持一致。
- 实时解决方案当前可支持的源端 insert、update、delete 语句类型,示例如下:
INSERT INTO database.table_name values (1, '12345'),(5, 'fs'),(7, 'fdg'),(8, 'gfsd');
update table database.table_name set col1 = 'xxxx' where col2 = 'xxxx';
Delete from database.table_name where col1 = 'xxxx';