PostgreSQL是一种常用的关系型数据库,数据集成离线同步任务为您提供读取和写入PostgreSQL数据源的双向通道能力,实现与不同数据源的数据互通能力。
下文为您介绍PostgreSQL数据同步的能力支持情况。
您可在数据开发 > 数据源管理中进行配置注册,相关操作可参见“注册数据源”。
任务新建完成后,进入任务配置页面,您可根据实际场景,配置PostgreSQL离线读或PostgreSQL离线写等通道任务。
选择数据源
PostgreSQL离线读
数据来源选择PostgreSQL,并完成以下相关参数配置:
其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。
参数 | 说明 |
|---|---|
*数据源类型 | 数据来源类型选择为PostgreSQL,您可下拉选择或输入关键词PostgreSQL进行搜索。 |
*数据源名称 | 已在数据源管理中注册成功的PostgreSQL数据源,下拉可选。 |
*Schema目录 | 数据库下已有的Schema目录信息,下拉可选。 |
*数据表 | 选择需要采集的数据表信息,支持选择 PostgreSQL 分区表,分区字段可在下方字段映射中作为源端字段进行映射。 |
数据过滤 | 支持您将需要同步的数据进行筛选条件设置,只同步符合过滤条件的数据,可直接填写关键词 where 后的过滤 SQL 语句,例如:create_time > '${date}',不需要填写 where 关键字。 |
切分建 | 根据源端数据中某一列作为切分键,进行数据分片,建议使用主键或有索引的列作为切分键:
说明
|
PostgreSQL离线写
数据目标端选择PostgreSQL,并完成以下相关参数配置:
其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。
参数 | 说明 |
|---|---|
*数据源类型 | 数据去向目标类型,您可下拉选择或输入关键词PostgreSQL进行搜索。 |
*数据源名称 | 已在数据源管理界面注册的PostgreSQL数据源,下拉可选。 |
*Schema目录 | 数据库下已有的Schema目录信息,下拉可选。 |
*数据表 | 数据源下所属需数据写入的表或视图名,下拉可选。 |
写入前准备语句 | 在执行该数据集成任务前,需要率先执行的SQL语句,通常是为了使任务重跑时支持幂等。 说明 只允许执行一条写入前准备语句。 |
写入后准备语句 | 执行数据同步任务之后执行的 SQL 语句。例如写入完成后插入某条特殊的数据,标志导入任务执行结束。 说明 只允许执行一条写入后准备语句。 |
*数据写入方式 | 下拉选择数据写入 PostgreSQL 的方式,目前支持 insert into、insert(with ttl)、on duplicate key update 写入方式:
|
设置字段映射信息
字段为一一映射关系,即将源表字段信息,同步到同一行的目标字段信息中。数据源在选择好来源和目标数据源信息后,您可通过转换模式和基础模式方式来配置字段映射关系。
基础模式操作如下:
说明
来源端字段信息支持输入数据库函数配置,单击手动添加按钮,在源表字段中输入需添加的值,并选择函数或常量类型,例如:
函数:支持您输入 now()、current_timestamp()、unix_timestamp() 等 Oracle 数据库支持的函数。
高级参数
您可选择是否开启高级参数设置,参数说明详见“高级参数设置”。
调度设置
单击右侧侧边栏的调度设置,配置相关调度设置参数。调度设置说明详见“调度设置”。
任务调试
参数配置完成后,可单击调试按钮 ,在弹出的窗口中,选择业务日期进行调试,调试结果/日志可在页面查看。
单击保存图标,完成草稿保存。