在映射配置界面中,完成数据来源设置与库表映射规则匹配策略。
其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。
配置项 | 说明 |
|---|---|
数据源设置 | |
*数据源 | 下拉选择数据源管理中创建成功的数据源。若此前仍未创建相应数据源,您可单击右侧数据源管理按钮,前往数据源管理界面,进行数据源的创建。 |
*数据表 | 在左侧您可选择来源数据库表信息:
|
离线整库同步解决方案,支持添加自定义 SQL 转换规则。它支持将源端采集的数据,对其进行各种数据转换操作,以满足各类业务场景需求。
数据转换可以应用于各种轻量级数据处理场景,例如:
单击配置详情按钮,展开数据转换配置界面。在数据转换配置界面,您可进行以下配置操作:
来源库表选择完成后,您便可进行后续的映射规则配置。
支持设置写入 LAS、Hive 分区表或非分区表,分区字段,其中分区字段,您可单击编辑按钮,进行自定义编辑名称,支持多级分区字段配置。
LAS 为目标表写入时,需选择目标表的类型,您可按需选择目标表类型为内表或 托管Hive 表。
展开高级配置按钮,进行使用已有表、高级参数等相关配置,其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。
配置项 | 说明 |
|---|---|
使用已有表配置 | 当目标表已存在,即下方“表建立方式”为“使用已有表”时,若此时源表与目标表中已有字段列不一致时,可通过列匹配规则,根据实际场景进行列映射规则设置,目前支持自动映射、同名取交映射两种匹配规则配置:
|
源表和目标表刷新配置 | 整库离线方案配置的源表和目标表数量较多时,您可设置单次拉取表数量,来分批进行表映射配置,默认单次拉取数量为 100 张表,您可根据实际情况进行调整,填写范围 1~2000。 |
高级参数配置 | 您可为同步解决方案配置全局的高级参数,以 key-value 的形式输入。 |
单击库/表名映射配置按钮,在弹窗中配置库表匹配策略,支持选择与来源库表同名和自定义方式匹配:
说明
目前暂不支持自动创建同名数据库,您需先在目标端创建好同名的数据库。
在离线整库解决方案中,通常会遇到较多来源端新增表、新增列等 DDL 操作场景。
目前离线整库 SQLServer2Hive 通道,可根据实际业务场景,对来源端不同的 DDL 消息,在配置解决方案同步到目标端数据源时,可进行预设不同的处理策略。不同处理策略说明如下:
目前不同 DDL 消息处理策略支持情况如下:
DDL 消息 | 自动处理 | 忽略变更 | 日志告警 | 任务出错 |
|---|---|---|---|---|
新建表 | ✅ | |||
删除表 | ✅ | |||
重命名表 | ✅ | |||
新增列 | ✅ | ✅ | ✅ | ✅ |
删除列 | ✅ | |||
重命名列 | ✅ | |||
修改列类型 | ✅ | ✅ | ✅ | ✅ |
清空表 | ✅ |
注意
具体操作步骤如下:
支持通过引用参数变量的方式来自定义配置解决方案生成的任务名称,便于您后期可依据自定义的任务名称快速查找任务进行维护。
任务名称配置框中支持选择以下两种配置类型:
全局配置:
默认显示系统自动生成的以变量参数形式命名的任务名称,您可通过引用以下变量,来自定义配置任务名称。系统变量参数说明见下表。
自定义配置:
通过添加任务名称映射规则,配置源库名到任务名称的映射关系。
变量表达式 | 说明 |
|---|---|
${src_db_name} | 对应源库名 |
${src_table_name} | 对应源表名 |
${src_schema_name} | 对应源模式名,对应 SQLServer、PostgreSQL 这类“库-Schema-表”三层结构的数据源,自动获取 Schema 信息。 |
${dest_db_name} | 对应目标库名 |
${dest_table_name} | 对应目标表名 |
${dest_schema_name} | 对应目标模式名,对应 SQLServer、PostgreSQL 这类“库-Schema-表”三层结构的数据源,自动获取 Schema 信息。 |
${solution_name} | 对应解决方案名称 |
${solution_id} | 对应解决方案ID |
${task_identifier} | 对应唯一标识 ID |
配置项 | |
|---|---|
筛选库表 | 单击漏斗按钮,您可输入源端与目标端的库表信息,进行筛选搜索。 |
同步主键 | 默认设置为源表中设置的主键字段信息,您可下拉进行选择源表中其余字段作为目标表的主键字段。 说明 写入 Hive 目标数据库表时,同步主键信息可为空,非必填。其余目标端数据源,已创建的目标端数据表中,必须要有主键字段。 |
全量同步 | 按钮开启时,同步解决方案将创建全量离线任务和实时增量任务,进行历史全量表数据和增量表数据的同步。 |
表建立方式 | 表建立方式分为使用已有表、自动建表和数据表不存在三种方式:
|
查看字段信息 | 可以查看来源表、目标表的字段名和其对应的字段类型等信息。 |
移除 | 可将当前源表和目标表映射删除。 |
配置 | 为当前解决方案配置映射高级参数,以key-value形式输入。 |
数据目标配置完成后,单击右下角下一步按钮,进行方案的同步规则配置。