You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件(私有化)

大数据研发治理套件(私有化)

复制全文
离线数据集成
LAS任务配置
复制全文
LAS任务配置

湖仓一体分析服务(LAS)数据源为您提供读取和写入LAS的双向通道数据集成能力,实现不同数据源与LAS之间进行数据传输。
下文为您介绍LAS数据同步的能力支持情况。

LAS数据源注册

您可在数据开发 > 数据源管理中进行配置注册,相关操作可参见“注册数据源”。

任务配置

任务新建完成后,进入任务配置页面,您可根据实际场景,配置LAS离线读LAS离线写等通道任务。

  1. 选择数据源

    • LAS离线读
      数据来源选择LAS,并完成以下相关参数配置:
      其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。

      参数

      说明

      *数据源类型

      您可下拉选择或输入关键词进行搜索LAS数据源类型。

      *数据源名称

      已在数据源管理中注册成功的LAS数据源,下拉可选。
      若还未建立相应数据源,可单击数据源管理按钮,前往创建LAS数据源。

      *数据表

      选择对应数据源 Schema 下所需要采集的数据表信息,下拉可选。

      说明

      支持读取写入 LAS Tencent COS 归属库表类型,该库表类型,您需前往 LAS 控制台中进行单独创建后方可后续配置使用,暂不支持在数据地图中进行创建该类型库表。

      *分区设置

      • 分区字段从LAS表自动获取。
      • 分区内容可设置具体时间分区粒度,可以用表达式:${date}、${hour}等参数变量表示。
    • LAS离线写
      数据目标端类型选择LAS,并完成以下相关参数配置:
      其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。

      参数

      说明

      *数据源类型

      您可下拉选择或输入关键词进行搜索LAS数据源类型。

      *数据源名称

      已在数据源管理中注册成功的LAS数据源,下拉可选。
      若还未建立相应数据源,可单击数据源管理按钮,前往创建LAS数据源。

      *数据表

      选择对应数据源配置下,需要写入数据的数据表信息,下拉可选。

      • 一键建表:当源端为 MySQL、Oracle、SQLServer、PostgreSQL、GaussDB、StarRocks 时,若目标 LAS 表还未创建,且源端已选定需要采集的表和字段时,可通过单击“一键建表”按钮,依据对源端采集的字段信息,快速进行目标表的创建。

        说明

        • 一键建表默认会将源端中大写的字段信息,在目标表中自动转换成为小写字段名称;
        • 在离线场景中一键建表默认会以分区表形式,且指定为 Parquet 格式进行创建,您可根据实际情况,在一键建表窗口中进行建表语句修改,如修改表名、字段名/类型、是否为分区表等;
      • 修改数据表:若源端采集的字段存在更新情况时,您可单击修改数据表按钮,及时对目标表字段进行快速修改。

      *分区设置

      • 分区字段从LAS表自动获取。
      • 分区内容可设置具体时间分区粒度,可以用表达式:${date}、${hour}等参数变量表示。
  2. 设置字段映射信息
    字段为一一映射关系,即将源表字段信息,同步到同一行的目标字段信息中。LAS数据源在选择好来源和目标数据源信息后,您可通过转换模式和基础模式方式来配置字段映射关系,操作详见“字段映射配置”。
    LAS数据源在字段转换模式中,您可通过书写SQL脚本方式,实现特殊业务场景需求,如:

    • 您可将LAS源端中一个字段拆分为两个字段,分别写入目标端不同的字段中;
    • 亦或是您也可在SQL脚本中,设置where过滤条件,实现源端过滤数据后同步到目标端。
      以上两个示例,实现的SQL示例如下:
    SELECT
        column1,
        SPLIT_INDEX(column2, 'ti', 0) AS str1,
        SPLIT_INDEX(column2, 'ti', 1) AS str2,
    c    olumn3
    FROM Source
    WHERE column1 > 0
    
  3. 高级参数
    您可选择是否开启高级参数设置,参数说明详见“高级参数设置”。
    在普通通道任务里,若源端为 MySQL、PostgreSQL、SQL Server 或者 Oracle,以下两个场景中,可添加以下高级参数来实现:

    • 源端数据表中的字段类型是 Varchar,当 Varchar 字段的精度发生改变时,写入 LAS 目标端的 Varchar 字段数据可能会出现被截断的场景,在此场景下,添加以下高级参数后:
      • 当源端字段长度 > 目标端字段长度时,目标端的 Varchar 字段长度自动更新为源端字段长度,数据正常写入,从而避免源端数据因长度过长而被截断的情况;
      • 当源端字段长度 < 目标端字段长度时,目标端的 Varchar 字段长度不变,数据正常写入。
        当以下指定范围内的数据库及字段类型发生长度加长时,且目标端的 LAS 表使用 varchar 字段类型,可自动为 LAS 表的 varchar 类型的长度自动增加:
      • MySQL:char、varchar
      • Oracle:char、nchar、nvarchar2、varchar、varchar2
      • PostgreSQL:character、char、varchar、character varying、bit varying
      • SQLServer:char、varchar、nchar、nvarchar

      说明

      • 以下高级参数仅能处理上述场景。当发生varchar长度缩短、字段类型变更(例如int转varchar)时无法处理。
      • 以下高级参数仅在普通通道任务中生效,解决方案中以下参数暂不生效。
    • 源端表增加字段,添加以下高级参数后,目标端 LAS 表中将同时增加相同的字段信息。
    --添加以下高级参数:
    job.writer.table_operations={"createTable":"IGNORE","addTableColumn":"EXECUTE","renameTable":"IGNORE","truncateTable":"IGNORE","updateTableColumn":"EXECUTE","renameTableColumn":"IGNORE","dropTable":"IGNORE","dropTableColumn":"IGNORE"}
    
    job.common.interceptor_name=batch_catalog_v2
    

    Image

  4. 调度设置
    单击右侧侧边栏的调度设置,配置相关调度设置参数。调度设置说明详见“调度设置”。

  5. 任务调试
    参数配置完成后,可单击调试按钮 ,在弹出的窗口中,选择业务日期进行调试,调试结果/日志可在页面查看。

  6. 单击保存图标,完成草稿保存。

最近更新时间:2025.05.28 11:36:10
这个页面对您有帮助吗?
有用
有用
无用
无用