You need to enable JavaScript to run this app.
导航
管理 ByteHouse CE 表
最近更新时间:2025.11.17 11:37:27首次发布时间:2024.03.15 18:42:00
复制全文
我的收藏
有用
有用
无用
无用

库表管理提供对元数据的创建、编辑、鉴权归属的统一管理。本文为您介绍如何管理 ByteHouse CE 表。

1 约束限制

仅主账号或具备 ByteHouseCEStandardAccess 权限的子账号,才可正确创建、编辑数据表。子账号授权激活需执行以下操作,相关说明可参见Bytehouse企业版说明文档

  1. 主账号在访问控制台给子账号授予 ByteHouseCEStandardAccess 权限。
  2. 该子账号登录一次 ByteHouse CE 控制台

2 前提条件

已创建 ByteHouse CDW 数据库。相关操作说明可参见管理 ByteHouse CE 库

3 操作步骤

  1. 登录 DataLeap 控制台。
  2. 选择概览 > 数据地图 > 我的库表 > Table管理,进入 Table管理页面。
  3. 单击 ByteHouse CE 页签,进入 ByteHouse CE 管理页面。
    Image
  4. 可执行以下操作:
    • 新建 ByteHouse CE 表
      单击新建ByteHouse CE表按钮,进入建表页面,填写表信息并单击建表检查按钮检查是否符合建表规范,待确认无误后,单击提交按钮完成 ByteHouse CE 表创建。关于建表规范的相关操作说明请参见数仓建表规范
      新建 ByteHouse CE 表相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。

      参数

      说明

      基础信息

      *集群

      ByteHouse CE 集群名称,下拉可选已创建的集群。

      *库名

      ByteHouse CE 数据库名称,下拉可选已创建的数据库。

      管理业务线

      数据表所属的业务线,下拉可选已创建的业务线。

      说明

      建议各业务线建立规范建模体系,保障建表的命名规范性,相关操作说明请参见创建业务线

      数据层级

      数据表所在的层级,支持以下选项,下拉可选。支持通过搜索层级名称关键词快速选择。

      • 基础数据层(ods)
      • 数据整合层(dwi)
      • 基础维度层(dim)
      • 明细数据层(dwd)
      • 中间数据层(dwm)
      • 数据服务层(dws)
      • 数仓应用层(dwa)
      • 数据集市层(dm)
      • 应用服务层(ads)
      • 应用层(app)
      • 技术预处理逻辑层(mid)
      • 临时层(tmp)

      说明

      若选择管理业务线,则仅显示该业务线所包含的数据层级选项。

      规范建模类目

      业务线下的模型规范类目分类,下拉可选已创建的模型规范类目的数据分类。创建模型规范类目数据分类的相关操作说明请参见类目管理

      说明

      选择业务线以及已关联的数据层级后,才可设置该参数。

      *表名

      创建在所选数据库下的数据表名称,一旦设定不可更改。
      仅支持数字、小写英文字母、下划线。

      说明

      选择数据层级、规范建模类目等信息后,会自动填充相应的表名前后缀,请注意勿重复添加。

      中文名

      数据表的中文名称。

      描述信息

      对数据表的描述说明,以便后续管理。

      字段信息(数据表创建后,除字段描述外其他参数无法被更改,请谨慎设置。)

      填写方式

      可选择按表单或Excel方式填写。

      主键

      即主关键字,是表中的一个或多个字段,它的值用于唯一的标识表中的某一条记录。
      若为复合主键,需选择多个字段。

      *英文名称

      字段的英文名称,仅支持以字母、下划线开头,字母、数字、下划线的组合。

      *字段类型

      根据实际情况填写,支持多种类型,下拉可选。

      是否可为空

      可选择是否设置该字段可以为空。

      *字段描述

      字段的说明信息,以便后续管理,必填项。

      *排序键

      用于确定数据在数据库中的物理存储顺序。
      下拉可选已填写且不为空的字段,最多可设置5个排序键且不可重复。

      分区键

      用于确定每个数据表行所属的数据分区,以将大型数据表分割为多个较小部分。
      下拉可选已填写且不为空的字段,最多可设置5个。

      说明

      Date 或者 Datetime 类型的字段才可按照 daymonth 进行分区。

      TTL

      表中数据的生命周期,过期数据将被自动删除。
      下拉选择字段后,设置数据的生命周期,时间单位自动填充为分区键设置的单位。例如 TTL 设置为 date 10 day,则数据将在 10 天后被自动删除。

      说明

      仅设置 Date 或者 Datetime 类型的分区键后,才可设置该参数。

      分片键

      分片字段用以确保一列数据均匀分布在集群各节点下,可最大化利用集群性能进行查询,一般选择取经常出现在Group by中的字段。

      说明

      分片字段只能是 String/Int/UInt 类型,并且不可为空,下拉可选已填写的字段。

      主键

      用于组织数据文件,对数据表中每条记录的唯一标识进行约束。
      主键下拉可选,选项内容与排序键的顺序关联。

      采样键

      通过定义采样键获取某些部分的采样数据。
      字段类型UInt排序键主键中选择,下拉可选。

      *表引擎

      支持 HaMergeTreeHaUniqueMergeTree 两个引擎选项。
      选择 HaUniqueMergeTree 时,可以选择唯一键及其生效范围。

      *唯一键

      用来保证对应字段中的数据的唯一性。唯一键可提供 UPSERT 函数,以确保用户可以查询唯一键的最新值。
      下拉可选已填写且不为空的字段,最多可设置10个。支持两个用于确定唯一值粒度的级别选项,分区范围数据表范围
      表引擎选择 HaUniqueMergeTree 时,需设置该参数。

      唯一键版本字段

      确保唯一键相同的数据仅在当前值≥已有值时进行更新。
      下拉可选,仅支持UIntDateDateTime 类型且不可为空的字段。

      安全信息

      *保密级别

      表的安全等级,级别由低到高依次有L1、L2、L3 和 L4 四个选项可选。

      说明

      表的密级不能高于所在库的密级。

      *表权限负责人

      表的数据安全权限负责人,自动填充,可编辑,支持多个。

      门户信息

      门户业务线

      数据表所属的资产门户业务线,下拉可选已创建的业务线,支持多选。

      说明

      门户业务线主要面向业务视角提供数据分类与管理,一个资产可以归属到多个门户业务线和多个数据分类。

      业务分类

      数据表所属的业务分类,下拉可选已创建的综合类、自定义两种类型的数据分类。
      该分类是“资产目录”中,指定业务线下的文件目录名称,用于资产门户构建。
      选择门户业务线后,才可设置该参数。

      专题

      数据表所属专题,下拉可选已创建的自定义目录固定目录专题。
      可快速添加至自己管理的专题中。

      生命状态

      表当前的生命状态,支持以下选项,下拉可选。

      • 测试:测试调试的表,不用于实际生产开发。
      • 临时:测试或开发临时保存一些数据时使用,会定期清理。
      • 在线:用户生产开发的有效表。
      • 废弃:已废弃不再用于生产或测试的表。
      • 待下线:即将下线的表,不再用于生产开发。

      说明

      目前生命状态的选项内容仅做标签使用,不会产生相应的作用。

      是否核心

      可选择是否将表设置为核心。

      自定义标签

      为表设定的标签,支持以下两种设置方式:

      • 下拉可选已有标签,支持通过搜索标签关键词快速选择。
      • 自行设置标签:手动输入标签后,在下拉列表中选择该标签。

      业务线标签

      为表设定的业务线标签,下拉可选已创建的标签,可设置多个。

      说明

      选择门户业务线后,才可选择对应业务线下已创建的标签。

      业务术语

      表所关联的业务术语,下拉可选已创建的业务术语。
      支持通过搜索业务术语名称关键词快速选择。

      业务域

      表所属的业务域,下拉可选已创建的业务域。支持通过搜索业务域名称关键词快速选择。

      说明

      该元数据标签即将下线,推荐使用自定义标签或业务线标签进行替代。

      产品线

      表所属的产品线,下拉可选已创建的产品线。支持通过搜索产品线名称关键词快速选择。

      说明

      该元数据标签即将下线,推荐使用自定义标签或业务线标签进行替代。

      主题

      表所属的主题,下拉可选已创建的主题。支持通过搜索主题名称关键词快速选择。

      说明

      该元数据标签即将下线,推荐使用自定义标签或业务线标签进行替代。

    • 设置搜索信息,搜索符合条件的信息列表。
      当设置多个搜索条件时,会取各个条件的交集,进行查询。

    • 单击列表中某条数据表信息的表名,可以打开该表详情页面,查看并管理该表的信息,详细说明请参见查看 ByteHouse CE 表

    • 单击列表中某条数据表信息操作列的管理按钮,可以修改该表的元数据标签信息。

    • 单击列表中某条数据表信息操作列的编辑按钮,可以修改表信息。

      注意

      ByteHouse CE 表已通过 DataLeap 数据开发模块的 SQL 作业修改了表结构,但还没有在数据地图中进行元数据采集,则修改表信息会出现异常。此场景下,您需先手动采集元数据,将表结构同步到数据地图后,再修改表信息。

    • 单击列表中某条数据表信息操作列的 ... > 移交按钮,可以变更表的负责人,并同时移交权限负责人。

    • 单击列表中某条数据表信息操作列的 ... > 复制建表按钮,可以复制该表信息后打开建表页面,按需创建新的数据表。

    • 单击列表中某条数据表信息操作列的 ... > 权限设置按钮,可以前往权限管理 > 权限设置进行审批流程设置。

    • 单击列表中某条数据表信息操作列的 ... > 删除按钮,在弹出的确认删除对话框中,单击确定按钮,可以删除该表。

    • 勾选一条或多条数据表信息后,进行批量移交、批量删除、批量管理操作。