Local File 数据源为您提供读取和写入 Local File 数据的数据集成通道能力,该通道支持读取通过 NAS 挂载到 Hadoop 节点的数据,实现 Local File 与不同数据源之间进行数据传输。
下文为您介绍 Local File 数据同步的能力支持情况。
说明
Local File 仅支持在运行 DTS 作业的计算节点上挂载共享存储时使用。
Local File 数据源,可直接读取或写入环境部署时 DTS 作业实际执行集群上的文件,因此无需额外的数据源注册即可直接使用。
任务新建完成后,进入任务配置页面,您可根据实际场景,配置 Local File 离线读或 Local File 离线写等通道任务。
选择数据源
LocalFile 离线读
数据来源选择 LocalFile,并完成以下相关参数配置:
其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。
参数 | 说明 |
|---|---|
*数据源类型 | 下拉选择LocalFile数据源 |
*文件路径 | 输入需要读取的文件名称或者路径,具体路径由环境部署时指定:
|
*数据类型 | 下拉选择需读取的文件类型,支持CSV和JSON格式 |
*分隔符 | 数据类型为CSV时,需选择读取文件每一行内容的分隔符,下拉进行选择,也可进行自定义。 |
*原始字符集 | 数据类型为CSV时,需选读取文件的字符集,支持GBK和UTF-8。 |
*导入起始行 | 数据类型为CSV时,需设置导入起始行,即读取文件从第几行开始读取,一般文件带有表头时填1,不带表头填0。 |
示例数据 | 数据类型选择JSON时,需以json字符串形式描述schema信息,需填写完整的数据。例如json:{"uid":123, "ut":12, "user_name": "xxx"}。 |
*Success标签检测 | 开启检测Success标签后,success_file_path必须有_success文件存在才会执行任务,若_success文件不存在会抛runtime异常,终止执行程序,支持自定义文件路径、文件名及扩展名。 |
*Success标签路径 | 开启标签检测后进行填写,填写检测的“Success”标签文件所在路径,即填写该文件在集群上的路径信息。支持自定义标签文件路径。如:/data00/nfs_share/test001/_success.csv |
*重试次数 | 检测success标签重试次数,开启标签检测后填写,默认60次,每次间隔1分钟。 |
LocalFile 离线写
数据目标选择 LocalFile,并完成以下相关参数配置:
其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。
参数 | 说明 |
|---|---|
*数据源类型 | 下拉选择LocalFile数据源 |
*文件路径 | 输入需要写入的文件路径,具体路径由环境部署时指定。 |
*文件名前缀 | 输入需要要写入的文件名称前缀信息。 |
*文本类型 | 下拉选择需要写入的文件类型,支持TXT、CSV类型选择。 |
*是否配置表头 | 根据实际情况,选择写入的文件是否添加表头。 |
*分隔符 | 选择写入文件内容的分隔符,支持自定义。 说明 若分隔符不可见,请填写Unicode编码,比如\u001b、\u007c。 |
*编码 | 选择文件写入编码信息,支持UTF-8、GBK、GB2312类型。 |
*null值 | 选择数据写入时,若遇到字段对null值的处理方式:
|
标记变成文件 | 输入任务结束后在指定路径下写入_success文件标签,此处配置的路径与数据源基础路径拼接为完整文件路径。 |
设置字段映射信息
字段为一一映射关系,即将源表字段信息,同步到同一行的目标字段信息中。数据源在选择好来源和目标数据源信息后,您可通过转换模式和基础模式方式来配置
基础模式操作如下:
高级参数
您可选择是否开启高级参数设置,参数说明详见“高级参数设置”。
调度设置
单击右侧侧边栏的调度设置,配置相关调度设置参数。调度设置说明详见“调度设置”。
任务调试
参数配置完成后,可单击调试按钮 ,在弹出的窗口中,选择业务日期进行调试,调试结果/日志可在页面查看。
单击保存图标,完成草稿保存。