TOS数据源为您提供读取TOS的单向通道数据集成能力,实现从TOS读取数据并转为数据集成协议,写入不同目标数据源,进行数据传输。
下文为您介绍TOS数据同步的能力支持情况。
您可在数据开发 > 数据源管理中进行配置注册,相关操作可参见“注册数据源”。
任务新建完成后,进入任务配置页面,您可根据实际场景,配置TOS离线读通道任务。
选择数据源
TOS离线读
数据来源选择TOS,并完成以下相关参数配置:
其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。
参数 | 说明 |
|---|---|
*数据源类型 | 您可下拉选择或输入关键词进行搜索TOS数据源类型。 |
*数据源名称 | 已在数据源管理中注册成功的TOS数据源,下拉可选。 |
*文件路径 | TOS对象存储桶中,需采集文件的存储路径,可在TOS中查看。 |
*示例文件 | 输入一个具体文件路径,用于自动添加Schema。 说明 示例文件第一行需要为Title行,其中txt类型文件的字段信息,生成的字段类型均为string。 |
*数据类型---parquet | 无需填写其他配置项。 |
*数据类型---CSV/TXT | |
*分隔符 | 支持逗号(,)、Tab键、分号(;)、空格等多种分隔符,下拉可选。 |
*原始字符集 | 选择TOS中的字符集,支持GBK、UTF-8两种字符集。 |
*导入起始行 | 选择起始行从哪一行开始导入,从1行开始,代表CSV表头不导入。 |
*数据类型---json | |
示例数据 | 需要以json字符串形式描述schema,必须填写完整的数据,否则schema不准确,您需手动添加Schema字段映射配置。 |
*数据类型---pb | |
*Pb类定义 | 一次只支持一个Pb类的定义,例如:
|
*PB Class | PB Class需填写为message名称,例如上方定义的Pb类,对应PB Class为AbaseTest。 |
设置字段映射信息
字段为一一映射关系,即将源表字段信息,同步到同一行的目标字段信息中。数据源在选择好来源和目标数据源信息后,您可通过转换模式和基础模式方式来配置字段映射关系。
高级参数
您可选择是否开启高级参数设置,参数说明详见“高级参数设置”。
调度设置
单击右侧侧边栏的调度设置,配置相关调度设置参数。调度设置说明详见“调度设置”。
任务调试
参数配置完成后,可单击调试按钮 ,在弹出的窗口中,选择业务日期进行调试,调试结果/日志可在页面查看。
单击保存图标,完成草稿保存。