You need to enable JavaScript to run this app.
导航
管理 ByteHouse CDW 表
最近更新时间:2025.11.17 11:37:27首次发布时间:2024.03.15 18:42:00
复制全文
我的收藏
有用
有用
无用
无用

库表管理提供对元数据的创建、编辑、鉴权归属的统一管理。本文为您介绍如何管理 ByteHouse CDW 表。

1 约束限制

  • 数据表创建后,除 TTL 外的其他高级参数均无法被更改,请谨慎设置。
  • 存量表不支持编辑 TTL,仅在数据地图创建并设置了分区键的新数据表才可在表详情页编辑 TTL 生命周期,具体编辑操作请参见查看 ByteHouse CDW 表的基本信息管理部分。

2 前提条件

已创建 ByteHouse CDW 数据库。相关操作说明可参见管理 ByteHouse CDW 库

3 操作步骤

  1. 登录 DataLeap 控制台。
  2. 选择概览 > 数据地图 > 我的库表 > Table管理,进入 Table管理页面。
  3. 单击 ByteHouse CDW 页签,进入 ByteHouse CDW 管理页面。
    Image
  4. 可执行以下操作:
    • 新建 ByteHouse CDW 表
      单击新建ByteHouse CDW表按钮,进入建表页面,填写表信息后,单击提交按钮完成 ByteHouse CDW 表创建。
      新建 ByteHouse CDW 表相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。

      参数

      说明

      DDL信息

      *DDL语句

      撰写DDL建表语句。
      仅选择 DDL建表时,需设置该参数。

      基础信息

      *集群

      要建表的数据库所在的集群,下拉可选已创建采集器的集群。创建采集器相关操作可参见元数据采集

      *ByteHouse CDW库名

      ByteHouse CDW 数据库名称,下拉可选已创建的数据库。
      库名一旦设定不可更改。

      管理业务线

      数据表所属的业务线,下拉可选已创建的业务线。

      说明

      建议各业务线建立规范建模体系,保障建表的命名规范性,相关操作说明请参见创建业务线

      数据层级

      数据表所在的层级,支持以下选项,下拉可选。支持通过搜索层级名称关键词快速选择。

      • 基础数据层(ods)
      • 数据整合层(dwi)
      • 基础维度层(dim)
      • 明细数据层(dwd)
      • 中间数据层(dwm)
      • 数据服务层(dws)
      • 数仓应用层(dwa)
      • 数据集市层(dm)
      • 应用服务层(ads)
      • 应用层(app)
      • 技术预处理逻辑层(mid)
      • 临时层(tmp)

      说明

      若选择管理业务线,则仅显示该业务线所包含的数据层级选项。

      规范建模类目

      业务线下的模型规范类目分类,下拉可选已创建的模型规范类目的数据分类。创建模型规范类目数据分类的相关操作说明请参见类目管理

      说明

      选择业务线以及已关联的数据层级后,才可设置该参数。

      *ByteHouse CDW表名

      创建在所选数据库下的数据表名称,一旦设定不可更改。
      仅支持数字、小写英文字母、下划线。

      说明

      选择数据层级、规范建模类目等信息后,会自动填充相应的表名前后缀,请注意勿重复添加。

      中文名

      数据表的中文名称。

      描述信息

      对数据表的描述说明,以便后续管理。

      字段信息

      填写方式

      可选择按表单或Excel方式填写。

      *英文名称

      字段的英文名称,仅支持以字母、下划线开头,字母、数字、下划线的组合。

      *字段类型

      根据实际情况填写,支持多种类型,下拉可选。

      字段描述

      字段的说明信息,以便后续管理,必填项。

      默认值

      字段的默认值,自行设定。
      默认值可以为表达式或者常量,对于 String 或者 Time 类型的常量值,请在输入值时使用单引号,例如 'Hello Word' 和 '1970-01-01'。

      是否可为空

      可选择是否设置该字段可以为空。

      高级设置(数据表创建后,排序键、分区键等无法被更改,请谨慎选择。)

      *排序键

      用于确定数据在数据库中的物理存储顺序。
      下拉可选已填写且不为空的字段,最多可设置5个排序键且不可重复。

      分区键

      用于确定每个数据表行所属的数据分区,以将大型数据表分割为多个较小部分。
      下拉可选已填写且不为空的字段,最多可设置5个。

      说明

      • 当所选字段为 DateDatetime 或者 Datetime64 类型时,可直接按照 day、month 或 year 进行分区。
      • 当所选字段为其他类型时,则需先设置该字段是以何种形态设置为分区,选项为 DateDatetimeDatetime64,再按照 day、month 或 year 进行分区。

      TTL

      表中数据的生命周期,过期数据将被自动删除。
      下拉选择字段后,设置数据的生命周期,支持 dayweekmonthquarter 四个时间单位选项。例如 TTL 设置为 date 10 day,则数据将在 10 天后被自动删除。

      说明

      仅设置 Date 或者 DatetimeDatetime64 类型的分区键后,才可设置该参数。

      唯一键

      用来保证对应字段中的数据的唯一性。下拉可选已设置为分区键的字段,最多可设置10个。
      支持两个用于确定唯一值粒度的级别选项,分区范围数据表范围
      唯一键可提供 Upsert (Update and Insert) 能力,以确保数据在分区级别去重,并始终查询对应唯一键的最新值。

      分桶键

      对于每一个表或分区,通过指定 Cluster Key 进一步细分成桶,对列中的数据进行哈希,进行更细粒度的划分,从而提高查询和采样效率。

      主键

      用于组织数据文件,对数据表中每条记录的唯一标识进行约束。
      主键下拉可选,选项内容与排序键的顺序关联。

      采样键

      通过定义采样键获取某些部分的采样数据。
      字段类型UInt排序键主键中选择,下拉可选。

      安全信息

      *保密级别

      表的安全等级,级别由低到高依次有L1、L2、L3 和 L4 四个选项可选。

      说明

      表的密级不能高于所在库的密级。

      *表权限负责人

      表的数据安全权限负责人,自动填充,可编辑,支持多个。

      门户信息

      门户业务线

      数据表所属的资产门户业务线,下拉可选已创建的业务线,支持多选。

      说明

      门户业务线主要面向业务视角提供数据分类与管理,一个资产可以归属到多个门户业务线和多个数据分类。

      业务分类

      数据表所属的业务分类,下拉可选已创建的综合类、自定义两种类型的数据分类。
      该分类是“资产目录”中,指定业务线下的文件目录名称,用于资产门户构建。
      选择门户业务线后,才可设置该参数。

      是否核心

      可选择是否将表设置为核心。

      自定义标签

      为表设定的标签,支持以下两种设置方式:

      • 下拉可选已有标签,支持通过搜索标签关键词快速选择。
      • 自行设置标签:手动输入标签后,在下拉列表中选择该标签。

      业务线标签

      为表设定的业务线标签,下拉可选已创建的标签,可设置多个。

      说明

      选择门户业务线后,才可选择对应业务线下已创建的标签。

      业务术语

      表所关联的业务术语,下拉可选已创建的业务术语。
      支持通过搜索业务术语名称关键词快速选择。

      业务域

      表所属的业务域,下拉可选已创建的业务域。支持通过搜索业务域名称关键词快速选择。

      说明

      该元数据标签即将下线,推荐使用自定义标签或业务线标签进行替代。

      产品线

      表所属的产品线,下拉可选已创建的产品线。支持通过搜索产品线名称关键词快速选择。

      说明

      该元数据标签即将下线,推荐使用自定义标签或业务线标签进行替代。

      主题

      表所属的主题,下拉可选已创建的主题。支持通过搜索主题名称关键词快速选择。

      说明

      该元数据标签即将下线,推荐使用自定义标签或业务线标签进行替代。

    • 设置搜索信息,搜索符合条件的信息列表。
      当设置多个搜索条件时,会取各个条件的交集,进行查询。

    • 单击列表中某条数据表信息的表名,可以打开该表详情页面,查看并管理该表的信息,详细说明请参见查看 ByteHouse CDW 表

    • 单击列表中某条数据表信息操作列的管理按钮,可以修改该表的元数据标签信息。

    • 单击列表中某条数据表信息操作列的编辑按钮,可以修改表信息。

    • 单击列表中某条数据表信息操作列的 ... > 移交按钮,可以变更表的负责人,并同时移交权限负责人。

    • 单击列表中某条数据表信息操作列的 ... > 复制建表按钮,可以复制该表信息后打开建表页面,按需创建新的数据表。

    • 单击列表中某条数据表信息操作列的 ... > 权限设置按钮,可以前往权限管理 > 权限设置进行审批流程设置。

    • 单击列表中某条数据表信息操作列的 ... > 删除按钮,在弹出的确认删除对话框中,单击确定按钮,可以删除该表。

    • 勾选一条或多条数据表信息后,进行批量移交、批量删除、批量管理操作。