You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件(私有化)

大数据研发治理套件(私有化)

复制全文
离线数据集成
Elasticsearch任务配置
复制全文
Elasticsearch任务配置

Elasticsearch数据源为您提供读取和写入Elasticsearch的双向通道数据集成能力,实现不同数据源与Elasticsearch之间进行数据传输。
下文为您介绍Elasticsearch数据同步的能力支持情况。

Elasticsearch数据源注册

您可在数据开发 > 数据源管理中进行配置注册,相关操作可参见“注册数据源”。

任务配置

任务新建完成后,进入任务配置页面,您可根据实际场景,配置Elasticsearch离线写通道任务。

  1. 选择数据源

    • Elasticsearch离线读
      数据来源端选择Elasticsearch,并完成以下相关参数配置:
      其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。

      参数

      说明

      *数据源类型

      您可下拉选择或输入关键词进行搜索Elasticsearch数据源类型。

      *数据源名称

      已在数据源管理界面注册的Elasticsearch数据源,下拉可选。
      若还未建立相应数据源,可单击数据源管理按钮,前往创建Elasticsearch数据源。

      *索引名称

      下拉展现已创建成功的索引名称信息,选择需要读取数据的索引信息。

      *索引类型

      输入ES中索引的类型,不同ES版本,索引类型不同,其中:

      • ES7.X版本,索引类型默认为_doc 。
      • ES6.X版本,可根据设定的索引类型进行选择,或者直接输入需要创建的索引,支持时间变量方式。

      数据过滤

      支持您将需要同步的数据进行筛选条件设置,只同步符合过滤条件的数据,根据ES语法,筛选数据,如:{"match": {"int_info": 1}}
      语句填写完成后,您可单击右侧的校验按钮,进行过滤语句校验。

      说明

      该过滤语句通常用作增量同步,其输入的过滤语法需要符合Elasticsearch语法。

      分页大小

      决定了每次请求ES获取到的文档的数量。

      游标时间

      每次游标查询的过期时间,该时间内能获取单页数据即可。单位秒。

    • Elasticsearch离线写
      数据目标端选择Elasticsearch,并完成以下相关参数配置:
      其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。

      参数

      说明

      *目标类型

      数据去向目标类型,您可下拉选择或输入关键词Elasticsearch进行搜索。

      *数据源名称

      已在数据源管理界面注册的Elasticsearch数据源,下拉可选。 若还未建立相应数据源,可单击数据源管理按钮,前往创建Elasticsearch数据源。

      *索引名称

      下拉展现已创建成功的索引名称信息,选择需要写入数据的索引信息。

      *索引类型

      输入ES中索引的类型,不同ES版本,索引类型不同,其中:

      • ES7.X版本,索引类型默认为_doc 。
      • ES6.X版本,可根据设定的索引类型进行选择,或者直接输入需要创建的索引,支持时间变量方式。

      *清理原索引数据

      选择写入时是否清理原索引中的数据:

      • 是:导入数据前删除原来的索引并重建同名索引,此操作会删除该索引下的数据。
      • 否:导入数据前保留索引中已存在的数据。

      *写入类型

      选择数据写入方式:

      • 插入:所有数据直接插入;
      • 更新:存在相同主键时更新数据,否则插入。

      *自动 mappings

      在文档中发现未存在的字段时,集成任务是否通过Elasticsearch动态映射机制为字段添加映射。

      *主键取值方式

      • 源表主键:document 的 id使用源表的字段,支持多字段拼接。
      • 无主键:系统自动生成_id值。

      *主键字段

      主键取值方式为“源表主键”时,必须填写主键字段,您可通过下拉方式选择。

      主键分隔符

      有多个主键字段时,需填写将主键字段值拼接在一起的主键分隔符,默认分隔符是空字符串。

      批量提交大小

      一次性批量提交的Document条数。

      settings

      创建index时的settings,与Elasticsearch官方一致,以JSON格式输入。

  2. 设置字段映射信息
    字段为一一映射关系,即将源表字段信息,同步到同一行的目标字段信息中。数据源在选择好来源和目标数据源信息后,您可通过转换模式和基础模式方式来配置字段映射关系,操作详见“字段映射配置”。

  3. 高级参数
    您可选择是否开启高级参数设置,参数说明详见“高级参数设置”。

  4. 调度设置
    单击右侧侧边栏的调度设置,配置相关调度设置参数。调度设置说明详见“调度设置”。

  5. 任务调试
    参数配置完成后,可单击调试按钮 ,在弹出的窗口中,选择业务日期进行调试,调试结果/日志可在页面查看。

  6. 单击保存图标,完成草稿保存。

最近更新时间:2024.12.19 17:02:10
这个页面对您有帮助吗?
有用
有用
无用
无用