You need to enable JavaScript to run this app.
导航
修改数据集
最近更新时间:2025.06.09 18:25:53首次发布时间:2025.06.09 18:25:53
我的收藏
有用
有用
无用
无用

1. 概述

数据集模块支持修改数据集相关配置。上游表可以新增字段、修改原字段数据类型、删除字段;在数据预览界面,可对模型字段进行快速修改;支持修改模型。

2. 功能介绍

2.1 上游表新增/修改/删除字段

若未开启「自动刷新字段」,则需手动添加,具体方式见下:
如:MySQL 表新增一个字段 xx。预览页面点击“编辑”进入修改模型,点击“模型配置”处的胶囊,模型列表处将新增一个灰色的未被勾选的该字段,选择保留则新增该字段。
如:MySQL 表修改原字段数据类型。预览页面点击“编辑”进入修改模型,确认该数据类型变更后保存即可。原字段类型对应的历史数据将删除。
修改后不变更之前已经同步好的数据内容,若需变更,请重新同步。
Image

2.2 修改字段

在数据预览界面,可对模型字段进行快速修改。
Image

2.3 修改模型

点击“编辑”按钮,进入全局修改界面,在这里可以进行模型的调整。
Image
模型修改中,支持替换底层数据表,不支持修改主键、分片、分区、抽样字段。如果需要修改上述项目,请新建一个数据集。

模型配置替换底表

产品支持编辑数据集,在模型配置页面替换底表,目前暂不支持直连数据集替换底表。
右键数据表卡片,点击“替换”按钮,从左侧拖拽数据表至卡片上即可完成替换。
Image
使用此功能需注意以下几点:

  • 新表和原表中字段名称一样的字段直接替换模型字段,不影响数据集字段,保存后不影响可视化查询;
  • 新表有、原表没有的字段,可选择添加入模型字段,默认新增到数据集字段;
  • 新表没有、原表有的字段,请在字段配置页面删除相应字段,若保存时保留仅原表内有的字段,则系统会提示用户找不到相应字段,若确认替换,则原数据集相应字段会被彻底删除。
  • 替换数据表后,不影响历史数据。如需将替换后的数据表导入系统内,需重新同步历史日期数据。

2.4 自定义 SQL 修改

SQL 例行的图表支持修改。
点击“编辑”进入修改界面,点击界面中的“编辑”按钮即可修改 SQL。
Image

2.5 调整生命周期

点击同步状态,可查看当前数据集的生命周期。生命周期:数据集同步的数据的保留时限。假如生命周期为 3 天,那么 1月25日 生成的分区数据 1月28日 将被清除。如果数据为每日同步,则在查询时只能查询到近3天同步的数据。
点击笔状编辑按钮并更改确定。
Image

2.6 类目管理

数据集类目
Image
项目级类目
统一管控项目内数据集字段类目,可选择不允许创建数据集类目
Image

2.7 同步类型和 SLA 更改

点击同步状态,可查看当前数据集的同步类型。同步类型:自动同步-每日在系统低谷时间自动同步,尽量保证 SLA 前完成同步;定时同步-包括小时/天/周/月粒度的同步;暂停同步-数据集不再自动同步
点击笔状编辑按钮并更改确定。如果数据集所用数据源为 hive 表,编辑者还需同时有 hive 表的查看权限,才能成功进行编辑。
Image