最近更新时间:2023.07.18 20:14:14
首次发布时间:2021.10.13 19:43:33
在使用数据地图的任何功能前,都需要接入元数据。DataLeap 支持接入的元数据类型包括 LAS、EMR Hive、ByteHouse CDW、EMR Doris 等。
本功能采用统一的模板接入各数据源,通过采集与同步操作,完成各类型集群元数据的接入工作。下面将为您介绍如何采集与同步元数据。
租户主账号具备所有采集器的全部操作权限。租户子账号仅对自己创建的采集器具备全部操作权限,对他人创建的采集器仅具备查看、执行同步的操作权限。
登录 DataLeap 控制台。
选择概览 > 数据地图 > 元数据采集,进入元数据采集页面。
单击左侧导航栏的元数据类型,进入相应的数据类型采集页面。
单击新建采集器按钮,弹出新建采集器窗口。
根据页面提示操作,设置采集信息并依次单击下一步按钮,设置完成后,单击完成按钮,完成采集器创建。
新建采集器相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。
参数 | 说明 |
---|---|
*采集类型 | 支持 EMR Hive、ByteHouse CDW、EMR Doris 和 EMR StarRocks 四种类型选项。 说明 开通 DataLeap 服务后,数据地图会自动创建 LAS 采集器,无需手动创建。 |
采集对象 | |
*采集器名称 | 数据采集器的名称,自行设定。 |
采集器描述 | 对采集器的描述信息,长度不超过500个字符。 |
采集类型 | 显示当前选择的类型,不可编辑。 |
*采集方式 | 仅支持直接连接。 |
*集群 | 连接数据源的集群信息。
|
授权管理 | |
授权检查 | 勾选授权信息,授权数据地图使用所选集群的元数据。
|
采集配置 | |
表过滤规则 | 通过输入正则表达式,设置数据表过滤规则。 |
库过滤规则 | 通过输入正则表达式,设置数据库过滤规则。设置规则后,采集元数据时将不会采集符合过滤规则的目标数据。 |
调度配置 | |
*执行方式 | 同步元数据的方式。
|
*调度频率 | 调度执行元数据同步的频率,支持每天执行和每小时执行两个选项。 |
*执行时间 | 调度执行元数据同步的时间。 |
说明
ByteHouse CDW 仅可添加一个采集器。
登录 DataLeap 控制台。
选择概览 > 数据地图 > 元数据采集,进入元数据采集页面。
单击元数据类型,进入相应的数据类型采集页面。
单击列表中要同步信息操作列的执行按钮,弹出执行窗口。
设置执行范围后,单击确定按钮,可以将元数据手工同步至 DataLeap。
全量:把目标源中的所有元信息同步更新一次。
指定库表:同步指定库表的元数据。选择该选项后,需输入要同步的数据表名称。
说明
EMR Hive、LAS 或 ByteHouse CDW 采集器创建后,需手动执行一次全量采集同步历史元数据。首次获取成功后,采集器会自动实时更新元数据。
若当前已有任务在执行中,则该操作按钮灰显不可用。
若出现同步失败的情况,可通过执行功能,将获取失败的元数据信息手工同步到数据地图。
登录DataLeap控制台。
选择概览 > 数据地图 > 元数据采集,进入元数据采集页面。
单击元数据类型,进入相应的数据类型采集页面。
单击列表中要查看信息操作列的执行历史按钮,在弹出的侧拉窗口中,可以查看同步元数据的所有执行历史记录,并可执行以下操作:
设置搜索信息,查看不同时间段内不同执行状态下符合条件的记录。
单击某条记录操作列的执行日志按钮,可以查看该信息的执行日志。
登录DataLeap控制台。
选择概览 > 数据地图 > 元数据采集,进入元数据采集页面。
单击元数据类型,进入相应的数据类型采集页面。
设置搜索信息,可查看符合条件的采集器列表。
登录DataLeap控制台。
选择概览 > 数据地图 > 元数据采集,进入元数据采集页面。
单击元数据类型,进入相应的数据类型采集页面。
单击列表中要编辑信息操作列的编辑按钮,在弹出的采集器详情侧拉窗口中,可以修改该采集器的信息。
说明
若您没有操作权限或当前已有任务在执行中,则该操作按钮灰显不可用。
登录DataLeap控制台。
选择概览 > 数据地图 > 元数据采集,进入元数据采集页面。
单击元数据类型,进入相应的数据类型采集页面。
单击列表中要删除信息操作列的删除按钮,在弹出的确认删除窗口中,可执行以下删除操作:
单击确定按钮,可以删除采集器并清空已采集元数据。删除后,对应历史元数据将会被同时清空,不可恢复。
勾选仅删除采集器,单击确定按钮,则保留已采集元数据,仅删除采集器。
说明
登录DataLeap控制台。
选择概览 > 数据地图 > 元数据采集,进入元数据采集页面。
单击元数据类型,进入相应的数据类型采集页面。
单击列表中要停用/启用信息操作列的停用/启用复合按钮,可以停用/启用该采集器。
说明
创建采集器后,默认处于启用状态。启用后,将按原定调度频率执行采集;停用后,将不可再执行采集操作。