库表管理提供对元数据的创建、编辑、鉴权归属的统一管理。本文为您介绍如何管理 Apache Hive 表。
页面最多展示 9999 条表数据。
已创建 Apache Hive 数据库。相关操作说明可参见管理 Apache Hive 库。
说明
Apache Hive视图是由从Apache Hive表中选取出来的数据组成的逻辑表。它可以定义为多个表的连接、只有部分列可见,或者部分行可见。
注意
仅当查看范围选择我是库管时,搜索负责人才会生效。
说明
管理 Apache Hive 表相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。
参数 | 说明 |
|---|---|
DDL信息 | |
*DDL语句 | 撰写DDL语句并解析后,配置字段。建表示例如下:
注意
|
基础信息 | |
*集群 | 所属集群的名称,下拉可选已创建的 Apache Hadoop 集群。 |
*Apache Hive库名 | 数据表所属数据库的名称,下拉可选已创建的 Apache Hive 数据库。 说明 仅选择可视化建表时,需设置该参数。 |
管理业务线 | 数据表所属的业务线,下拉可选已创建的业务线。 说明
|
数据层级 | 元数据所在的层级,支持以下选项,下拉可选。支持通过搜索层级名称关键词快速选择。
说明 若选择管理业务线,则仅显示该业务线所包含的数据层级选项。 |
规范建模类目 | 业务线下的模型规范类目分类,下拉可选已创建的模型规范类目的数据分类。创建模型规范类目数据分类的相关操作说明请参见类目管理。 说明 选择管理业务线以及已关联的数据层级后,才可设置该参数。 |
存储策略 | 元数据的存储策略,支持以下选项,下拉可选。
|
*Apache Hive表名 | 创建在所选数据库下的数据表名称。 说明 仅选择可视化建表时,需设置该参数。 |
中文名 | 数据表的中文名称。 |
*存储格式 | 数据的存储格式,支持 parquet、text 和 orc 三个选项,下拉可选。 |
压缩格式 | 数据的压缩格式,支持选项zstd、snappy、gzip、lzo、brotli、lz4,下拉可选。 |
*分区类型 | 数据表是否设置分区,支持分区表和非分区表两个选项。 说明
|
描述信息 | 对数据表的描述说明,以便后续管理。 |
*负责人 | 该表的负责人,默认为当前用户,可输入账号关键词下拉选择其他用户。 |
字段信息 | |
填写方式 | 可选择按表单或Excel方式填写。 |
主键 | 即主关键字,是表中的一个或多个字段,它的值用于唯一的标识表中的某一条记录。 |
*英文名称 | 字段的英文名称。仅可由小写英文字母、数字、下划线组成。 说明 若引用数据标准,本参数会自动填充标准的英文名,具体可参见下面的引用代码说明。 |
*字段类型 | 根据实际情况填写,支持多种类型,下拉可选。 说明 若引用数据标准,本参数会自动填充标准的数据类型,具体可参见下面的引用代码说明。 |
*字段描述 | 字段的说明信息,以便后续管理,必填项。 说明 若引用数据标准,本参数会自动填充标准的中文名,具体可参见下面的引用代码说明。 |
安全标签 | 数据安全平台推荐的标签,下拉可选已创建的安全标签,支持选择多个。 |
引用代码 | 字段要关联的数据标准代码。通过添加按钮,可引用数据标准,绑定多个标准代码。
说明
|
自定义标签 | 为字段设定的标签,支持以下两种设置方式:
|
高级设置 | |
其他参数 | 可选择是否开启其他参数配置,默认关闭。 |
管理信息 | |
*生命周期类型 | 数据表生命周期的类型。仅支持按分区名称选项,表示按分区名称自动删除N天前的分区。 |
*生命周期天数 | 数据的保留天数,下拉可选。当选择自定义时,可输入数值大于等于0的任意整数,其中0表示永久。 说明 每天下午2点定时清理数据,清理时间5小时以上,超过保留期的数据将自动删除。 |
*生命周期分区字段 | 表的生命周期分区字段,下拉可选在字段信息处填写的分区字段。 |
*生命周期日期格式 | 表的生命周期日期格式,支持yyyyMMdd、yyyy-MM-dd、yyyy.MM.dd三个选项,下拉可选。 |
安全信息 | |
*保密级别 | 表的安全等级,由低到高有L1、L2、L3和L4四个选项可选。 说明 表的密级不能高于所在库的密级。 |
*表权限负责人 | 表的数据安全权限负责人,默认为当前用户,可输入账号关键词下拉选择其他用户,支持设置多个。 |
开发信息 | |
数据研发项目 | 已加入的项目,下拉可选已创建的项目。 |
业务信息 | |
门户业务线 | 数据表所属的资产门户业务线,下拉可选已创建的业务线,支持多选。 说明 门户业务线主要面向业务视角提供数据分类与管理,一个资产可以归属到多个门户业务线和多个数据分类。 |
数据分类 | 数据表所属的业务分类,下拉可选已创建的综合类、自定义两种类型的数据分类,支持多选。 说明 选择门户业务线后,才可设置该参数。 |
生命状态 | 表当前的生命状态,支持以下选项,下拉可选。
说明 目前生命状态的选项内容仅做标签使用,不会产生相应的作用。 |
是否核心 | 可选择是否将表设置为核心。 |
自定义标签 | 为表设定的标签,支持以下两种设置方式:
|
业务线标签 | 为表设定的业务线标签,下拉可选已创建的标签,可设置多个。 说明 选择门户业务线后,才可选择对应业务线下已创建的标签。 |
业务术语 | 表所关联的业务术语,下拉可选已创建的业务术语。 |