You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件(私有化)

大数据研发治理套件(私有化)

复制全文
数据检索
查看 Apache Hive 表
复制全文
查看 Apache Hive 表

本文为您介绍如何查看并管理 Apache Hive 表的数据详情。

前提条件

在搜索前,需要在数据地图 > 元数据采集页面新建采集器,将集群的元数据采集到数据地图。相关操作说明可参见元数据采集

查看数据详情

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据地图 > 数据检索,进入数据检索页面。
  3. 搜索数据表后,进入数据表详情页面。
    Image
  4. 可以查看数据详情,并进行数据管理。
    • 位于页面顶部的各摘要信息
      • 可以查看表名、元数据完善度等信息。其中,完善度计算方式为:负责人20%、表描述20%、字段描述30%(按字段填充比率折算)、管理业务线15%、数据层级15%。
      • 可以查看点赞数、收藏人数,并单击相应图标点赞或收藏该表。
      • 单击 SQL 查询按钮,在弹出的窗口中,输入查询语句,查询指定信息。
      • 单击复制建表图标按钮,可以复制该表信息后打开建表页面,按需创建新的数据表。建表操作的相关说明可参见管理 Apache Hive 表
      • 可快速查看登录账号是否有该表的操作权限。若没有,则页面会提示无权限,可单击申请按钮申请权限,申请权限的相关操作请参见申请权限
        Image
    • 表结构信息详情,包括表的明细信息、预览探查、使用说明、血缘关系、评论问答等功能信息。
    • 右侧信息栏的数据表基本信息,包括基础信息、业务信息、安全信息和技术信息。

管理表结构信息

明细信息

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据地图 > 数据检索,进入数据检索页面。
  3. 搜索数据表后,进入数据表详情页面。
  4. 单击明细信息页签,进入表的明细信息页面。
  5. 可以查看该表的字段信息、分区信息和变更记录,并执行以下操作:
    • 字段信息
      • 在搜索框中,输入字段名称或描述的关键字,单击搜索框右侧的搜索图标,可以查看符合条件的信息。

      • 单击编辑按钮,修改字段信息,单击保存按钮,在弹出的确认窗口中,勾选提示信息后,单击确定按钮完成修改。
        编辑字段相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。

        参数

        说明

        主键

        即主关键字,是表中的一个或多个字段,它的值用于唯一的标识表中的某一条记录。可选择是否设置某字段为主键。
        若为复合主键,请选择多个字段。 仅 int、bigint、double、string 类型支持设置为主键。

        *英文名称

        字段的英文名称,仅支持小写英文字母、数字、下划线。

        *字段类型

        根据实际情况填写,支持多种类型选项,下拉可选。

        *字段描述

        字段的说明信息,以便后续管理。

        安全标签

        数据安全平台推荐的标签,下拉可选已创建的安全标签,支持选择多个。若字段编辑前已有安全标签,则仅可增减不可清空。
        管理安全标签的相关操作说明,请参见分类分级管理

        引用代码

        字段要关联的数据标准代码。通过添加按钮,可绑定多个标准代码,详细操作可参见管理 Apache Hive 表引用代码说明。

        说明

        编辑表时,仅支持修改标准代码绑定关系,不支持引用数据标准。

        自定义标签

        为字段设定的标签,支持以下两种设置方式:

        • 下拉可选已有标签,支持通过搜索标签关键词快速选择。
        • 自行设置标签:手动输入标签后,在下拉列表中选择该标签。

        确认窗口信息

        是否通知

        可选择是否发送表修改(删/改字段)通知给其他表负责人和下游表负责人。

        *通知方式

        支持邮件和飞书两种通知方式,可多选。

        • 邮件:通过邮件把通知信息发送给目标用户,用户账号信息中需登记邮箱信息。
        • 飞书:通过飞书消息通知。

        说明

        • 仅当选择通知时,需设置该参数。
        • 满足以下两个条件,才可接收飞书通知。
          • 已配置相应的飞书消息通知机器人信息,相关配置操作请参见报警接收渠道配置
          • 目标用户为通过飞书账号登录后创建的用户。

        说明

        • 支持增减非分区字段、修改已有字段的描述信息或调整字段排序,不可变更字段名称和类型。
        • 存量字段不可删除,且仅支持修改字段描述。
        • 可新增字段,并需注意:
          • 修改字段名称、类型前先通过血缘关系查看下游影响任务,并通知相关任务责任人进行相应修改,以防出现由修改造成的生成任务和下游依赖报错。
          • 修改字段名称、类型后,可重新上线任务。
      • 单击查看DDL按钮,可以看到该表的定义SQL语句。

      • 单击列表中某个字段评论问答列的评论问答按钮,在对应的备注问答页面中,可以填写备注信息或提出问题,单击提交按钮完成发布。页面中会展示发布的信息,您可以编辑或删除已发布的信息。

      • 单击列表中任一字段安全标签列的配置按钮,可以跳转到数据安全 > 安全标签 > 识别结果路径下该表的详情页面,编辑字段的当前标签。配置标签后,字段信息页面会显示该字段的安全标签。配置安全标签的详细说明,请参见识别结果管理
        Image

      • 若某字段关联了数据标准,则可单击关联的标准代码名称,预览枚举值。关联数据标准/标准代码的操作请参见配置标准映射配置标准映射
        Image

        说明

        当字段关联了多个数据标准或标准代码时,在引用代码后面会提示绑定数字,且预览信息时可以查看所有已关联标准/代码的枚举信息。

    • 分区信息
      • 在搜索框中,输入分区字段关键字,单击搜索框右侧的搜索图标,可以查看符合条件的分区信息。
      • 选择分区创建时间,可以查看对应时间段内的分区信息。
      • 分区信息列表中,部分参数可进行升降序查看。
    • 变更记录
      • 在搜索框中,输入关键字,单击搜索框右侧的搜索图标,可以查看符合条件的变更记录。
      • 单击列表中某条信息变更内容列的查看变更前后内容按钮,在弹出的窗口中,可以看到变更前后的详情对比。

预览探查

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据地图 > 数据检索,进入数据检索页面。
  3. 搜索数据表后,进入数据表详情页面。
  4. 单击预览探查页签,进入预览探查页面。
    Image
  5. 可以查看该表的若干条样例数据,并执行以下操作:
    • 单击隐藏列,可以隐藏/展示字段列表。当勾选某字段时,工作表中显示该字段;当取消勾选时,工作表中隐藏该字段。
    • 单击搜索,在出现的搜索框中,输入信息关键字,按回车键,可以搜索对应信息。

说明

  • 具备该表权限的用户才可查看,否则打开该页签时,会提示“暂无本表读取权限,请单击右上角申请权限”。
  • 触发动态脱敏规则的字段内容会进行脱敏展示,如下图所示。动态脱敏配置操作请参见动态脱敏
    Image

使用说明

本功能用于撰写数据表的使用说明文档,一般由表负责人撰写。相关操作步骤如下:

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据地图 > 数据检索,进入数据检索页面。
  3. 搜索数据表后,进入数据表详情页面。
  4. 单击使用说明页签,进入添加使用说明页面。
  5. 单击编辑按钮,提示可以新增卡片页,单击页面左上角显示的加号 +,弹出新增标签窗口。
  6. 输入标签名后,单击确定按钮,增加相应的标签页。
  7. 从下拉列表中选择编辑工具,输入说明内容后,单击保存按钮,完成添加。
  8. 还可编辑和删除已添加的内容。
    1. 单击编辑按钮,标签页进入编辑状态。
    2. 可执行以下操作:
      • 单击标签名称旁的编辑图标,可以修改标签名称。
      • 单击标签名称旁的删除图标,二次确认后,删除标签页。
      • 编辑说明内容。
    3. 单击保存按钮,完成编辑。

血缘关系

用于查看该表的数据都由哪些表计算得到,即该表的上游血缘,以及该表的数据又用于计算生成了哪些表格,即该表的下游血缘,并进行相应的管理。血缘有表格视图、可视化图表两种展示方式。
下面以表格视图为例进行介绍,可视化图表的操作说明可参见血缘应用

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据地图 > 数据检索,进入数据检索页面。
  3. 搜索数据表后,进入数据表详情页面。
  4. 选择血缘关系 > 表格视图页签,进入血缘关系的表格视图页面。
    Image
  5. 可执行以下操作:
    • 设置查看条件,查看符合条件的数据,包括数据资产节点、字段、血缘层级、节点负责人、任务名称、任务负责人等信息。还可单击任务链接打开新窗口查看任务详情。
      • 筛选粒度:包含表、字段。
      • 查看范围:包含查看全部、仅为上游、仅为下游。
      • 层级:1~5层。
      • 搜索:可输入节点名、任务名等,查到具体对象。

      说明

      • 血缘的更新频率为实时,即新的依赖关系会实时更新到血缘关系中。
      • 若血缘无法自动解析或解析不准确,可通过在数据开发 > 任务开发 > 调度设置页面手动登记的方式进行补充。
    • 单击右侧的下载信息按钮,将列表中的节点数据保存成csv格式本地浏览使用。

      注意

      csv文件的编码格式为utf-8,在mac系统中可正常打开,在windows系统中使用文本编辑器或wps也可以正常打开,但在windows系统中使用Excel打开会出现乱码问题,建议可以使用文本编辑器另存为utf-8-BOM编码后,再使用Excel打开即可正常编辑。

评论问答

本功能支持查看该表的评论问答信息,也支持发布评论、提问信息。

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据地图 > 数据检索,进入数据检索页面。
  3. 搜索数据表后,进入数据表详情页面。
  4. 单击评论问答页签,进入评论问答页面。
  5. 可执行以下操作:
    • 在搜索框中,搜索评论问答对象,并单击要查看的对象,可以分类查看该表的评论问答信息。
    • 单击评论按钮,可以填写评论信息。
    • 单击我要提问按钮,可以向负责人提出问题。

管理表基本信息

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据地图 > 数据检索,进入数据检索页面。
  3. 搜索数据表后,进入数据表详情页面。
  4. 可以查看元数据的基础信息、业务信息等信息,并执行以下管理操作:
    • 将鼠标悬停在某参数上,单击显示的编辑图标,修改参数信息后,单击确定图标,完成修改。
    • 单击是否隐藏的开启/关闭图标按钮,可以决定是否隐藏表的安全信息。

说明

  • 鼠标悬停时,只有能显示编辑图标的参数,才可编辑。
  • 平台管理员或者具备某 Apache Hive 表读写权限的普通用户账号,才可编辑对应表的信息。没有权限的账号可通过页面右上方显示的权限申请按钮申请权限,申请权限的相关操作请参见申请权限

元数据信息相关参数说明如下表所示。

参数

说明

页面顶部的摘要信息

数据类型

显示该数据的类型。

数据分类

显示该表所属业务线分类。“资产目录”中,指定业务线下的文件目录名称,用于资产门户构建。

资产专辑

显示该表所属的资产专辑。

业务线标签

显示该表的业务线标签。鼠标悬停在标签上,可查看标签的详细信息,包括标签所属的业务线、标签组等。

基础信息

中文名

数据表的中文名称,可编辑。

描述

元数据的描述信息,可编辑。

负责人

该元数据的负责人,可编辑。

管理业务线

该元数据所属的业务线,可编辑,下拉可选已创建的业务线。

数据层级

数据表所在的层级,可编辑,支持以下选项,下拉可选。支持通过搜索层级名称关键词快速选择。

  • 贴源层 [sdata]
  • 历史层 [shdata]
  • 明细层 [pdata]
  • 通用汇总层 [cdata]
  • 维度层 [dim]
  • 集市层 [dm]

建模规范类目

显示该元数据使用的建模规范类目,可编辑,下拉可选业务线下已创建的模型规范类目类型的分类。

存储策略

元数据的存储策略,支持以下选项,下拉可选。

  • 小时增量(hi)
  • 日增量(di)
  • 周增量(wi)
  • 月增量(mi)
  • 小时全量(hf)
  • 日全量(df)
  • 周全量(wf)
  • 月全量(mf)
  • 最新全量快照(nf)

项目

数据表所属的项目,可编辑,下拉可选已创建的项目。

业务信息

是否核心

显示该表是否为核心,可编辑。

生命状态

显示该表当前的生命状态,可编辑。

自定义标签

为表设定的标签,可编辑,支持以下两种设置方式:

  • 下拉可选已有标签,支持通过搜索标签关键词快速选择。
  • 自行设置标签:手动输入标签后,在下拉列表中选择该标签。

业务术语

元数据所关联的业务术语,可编辑,下拉可选已创建的业务术语。支持通过搜索业务术语名称关键词快速选择。

安全信息(仅安全模式Apache Hive 元数据包含该信息。)

保密级别

表的保密级别,可编辑,由低到高有L1、L2、L3和L4四个选项可选。不同保密级别对应不同的审批流程。

说明

表的密级不能高于所在库的密级。

权限负责人

表的数据安全权限负责人,可编辑,支持设置多个。
该权限负责人仅展示表权限负责人,行/列权限负责人可前往数据安全 > 权限管理 > 权限设置进行查看、变更等操作。

库权限负责人

该表所属数据库的权限负责人,不可编辑。

我的权限

当前登录账号对该表可执行的操作权限,不可编辑。

是否隐藏

表示该表是否隐藏,可编辑。
数据表隐藏后,若您不是该表的库管或表负责人,且没有该表的读写权限,则无法在数据检索页面查看其详情信息。

技术信息(仅可查看,不支持编辑)

集群ID

该表所属数据库所在集群的ID。

集群

该表所属数据库所在的集群。

访问模式

显示该表的访问模式。

库名

该表所属数据库的名称。

主键

即主关键字,是表中的一个或多个字段,它的值用于唯一的标识表中的某一条记录。

说明

该字段创建表时配置,此处也可编辑。

是否分区

显示数据表是否设置分区。

表类型

显示该表所属的类型,如内部表。

存储格式

显示该表采用的存储格式。

存储路径

显示该表的默认存储路径。

创建时间

显示表的创建时间。

更新时间

显示表最近的更新时间。编辑数据源其他信息后该字段会自动更新。

最近更新时间:2026.03.05 15:16:49
这个页面对您有帮助吗?
有用
有用
无用
无用