You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件(私有化)

大数据研发治理套件(私有化)

复制全文
离线数据集成
TOS任务配置
复制全文
TOS任务配置

TOS数据源为您提供读取TOS的单向通道数据集成能力,实现从TOS读取数据并转为数据集成协议,写入不同目标数据源,进行数据传输。
下文为您介绍TOS数据同步的能力支持情况。

TOS数据源注册

您可在数据开发 > 数据源管理中进行配置注册,相关操作可参见“注册数据源”。

任务配置

任务新建完成后,进入任务配置页面,您可根据实际场景,配置TOS离线读通道任务。

  1. 选择数据源

    • TOS离线读
      数据来源选择TOS,并完成以下相关参数配置:
      其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。

      参数

      说明

      *数据源类型

      您可下拉选择或输入关键词进行搜索TOS数据源类型。

      *数据源名称

      已在数据源管理中注册成功的TOS数据源,下拉可选。
      若还未建立相应数据源,可单击数据源管理按钮,前往创建TOS数据源。

      *文件路径

      TOS对象存储桶中,需采集文件的存储路径,可在TOS中查看。

      *示例文件

      输入一个具体文件路径,用于自动添加Schema。

      说明

      示例文件第一行需要为Title行,其中txt类型文件的字段信息,生成的字段类型均为string。

      *数据类型---parquet

      无需填写其他配置项。

      *数据类型---CSV/TXT

      *分隔符

      支持逗号(,)、Tab键、分号(;)、空格等多种分隔符,下拉可选。

      *原始字符集

      选择TOS中的字符集,支持GBK、UTF-8两种字符集。

      *导入起始行

      选择起始行从哪一行开始导入,从1行开始,代表CSV表头不导入。

      *数据类型---json

      示例数据

      需要以json字符串形式描述schema,必须填写完整的数据,否则schema不准确,您需手动添加Schema字段映射配置。

      *数据类型---pb

      *Pb类定义

      一次只支持一个Pb类的定义,例如:

      syntax = "proto2";
      package abase_test;
      message AbaseTest {
      required int64 first_id = 1;
      required int64 latest_id = 2;
      }
      

      *PB Class

      PB Class需填写为message名称,例如上方定义的Pb类,对应PB Class为AbaseTest。

  2. 设置字段映射信息
    字段为一一映射关系,即将源表字段信息,同步到同一行的目标字段信息中。数据源在选择好来源和目标数据源信息后,您可通过转换模式和基础模式方式来配置字段映射关系。

    • 基础操作如下:
      • 单击同名映射按钮,您可在配置完目标端字段信息后,源端字段信息,可通过同名映射的方式进行添加。
      • 单击自动添加按钮,可以自动填充来源的字段信息。
      • 单击手动添加按钮,可以手动编辑来源的字段信息。
      • 可以根据需要移动字段顺序或删除字段。
    • 转换模式操作操作详见“转换模式”。
  3. 高级参数
    您可选择是否开启高级参数设置,参数说明详见“高级参数设置”。

  4. 调度设置
    单击右侧侧边栏的调度设置,配置相关调度设置参数。调度设置说明详见“调度设置”。

  5. 任务调试
    参数配置完成后,可单击调试按钮 ,在弹出的窗口中,选择业务日期进行调试,调试结果/日志可在页面查看。

  6. 单击保存图标,完成草稿保存。

最近更新时间:2024.12.19 17:02:10
这个页面对您有帮助吗?
有用
有用
无用
无用