数据集模块支持修改数据集相关配置。上游表可以新增字段、修改原字段数据类型、删除字段;在数据预览界面,可对模型字段进行快速修改;支持修改模型。
若未开启「自动刷新字段」,则需手动添加,具体方式见下:
如:MySQL 表新增一个字段 xx。预览页面点击“编辑”进入修改模型,点击“模型配置”处的胶囊,模型列表处将新增一个灰色的未被勾选的该字段,选择保留则新增该字段。
如:MySQL 表修改原字段数据类型。预览页面点击“编辑”进入修改模型,确认该数据类型变更后保存即可。原字段类型对应的历史数据将删除。
修改后不变更之前已经同步好的数据内容,若需变更,请重新同步。
在数据预览界面,可对模型字段进行快速修改。
点击“编辑”按钮,进入全局修改界面,在这里可以进行模型的调整。
模型修改中,支持替换底层数据表,不支持修改主键、分片、分区、抽样字段。如果需要修改上述项目,请新建一个数据集。
产品支持编辑数据集,在模型配置页面替换底表,目前暂不支持直连数据集替换底表。
右键数据表卡片,点击“替换”按钮,从左侧拖拽数据表至卡片上即可完成替换。
使用此功能需注意以下几点:
SQL 例行的图表支持修改。
点击“编辑”进入修改界面,点击界面中的“编辑”按钮即可修改 SQL。
点击同步状态,可查看当前数据集的生命周期。生命周期:数据集同步的数据的保留时限。假如生命周期为 3 天,那么 1月25日 生成的分区数据 1月28日 将被清除。如果数据为每日同步,则在查询时只能查询到近3天同步的数据。
点击笔状编辑按钮并更改确定。
数据集类目
项目级类目
统一管控项目内数据集字段类目,可选择不允许创建数据集类目
点击同步状态,可查看当前数据集的同步类型。同步类型:自动同步-每日在系统低谷时间自动同步,尽量保证 SLA 前完成同步;定时同步-包括小时/天/周/月粒度的同步;暂停同步-数据集不再自动同步
点击笔状编辑按钮并更改确定。如果数据集所用数据源为 hive 表,编辑者还需同时有 hive 表的查看权限,才能成功进行编辑。