最近更新时间:2023.07.12 20:47:48
首次发布时间:2023.07.10 16:54:49
通过健康分,可以直观地看到各个团队的治理程度,了解团队的资源使用情况、评估是否还有优化空间。
通过健康分子项规则的口径定义和权重设定,可以帮助和引导团队更快判断治理的优先级。
已购买分布式数据自治服务。详细操作说明请参见 DataLeap 服务信息。
登录 DataLeap 控制台。
选择数据治理 > 治理全景 > 治理评估 > 存储健康分,进入存储健康分页面。
可以设置搜索条件,查看符合条件的以下信息,并进行相应的管理。
存储健康分
展示近两个月的存储健康分趋势以及与上个双月末的比较。
支持查看健康分下每个规则下扣分值、问题表数量,上个双月末的比较以及分数趋势。
单击添加治理方案按钮,创建治理方案推动治理。
说明
仅查询条件选择团队时,才可设置此信息。
仅有关联资产的数据团队才能创建治理方案。
本双月治理成效
支持查看本双月的治理表数量、节约物理存储量和无效资产减少量。
明细分析
单击健康分情况页签,可以查看筛选范围下包含的资产的健康分情况,并进行以下操作:
单击某条信息操作列的催办按钮,确认催办信息后,可以对维度负责人发送催办通知。
单击某条信息相应的蓝色指标数值,可以下钻查看数据存储详情。
说明
未分类的资产不能催办。
单击分布情况页签,可以查看筛选范围下包含的资产的分布情况,并支持进行催办和下钻查看数据存储详情。
单击治理方案页签,可以查看筛选范围下进行中的治理方案。
说明
当查询条件选择团队时,可以从子团队、子方向、库、项目、个人五个维度进行明细分析。其中,子团队和子方向需要在数据团队配置中进行相应的配置后此处才会显示。
当查询条件选择全部时,支持按团队进行明细分析。
存储健康分相关参数说明如下表所示。
参数 | 说明 |
---|---|
数据类型 | 仅支持 EMR Hive 类型的数据。 |
筛选维度 | 支持全局和团队两个筛选维度。
当选择团队时,需选择相应的数据团队。数据团队配置说明请参见系统配置。 |
存储健康分 | |
存储健康分达标口径 | 总分高于90且单个子项扣分小于4分。 |
双月90分达成天数 | 本双月中,健康分在90天以上的天数。 |
问题指标 | 问题指标包括文件大小异常、存储格式不合理、近30天无查询、TTL设置不合理四个规则,每个规则对应的信息如下:
详细的健康分口径及计算细则说明请参见下方的健康分口径说明。 |
添加治理方案 | 创建治理方案推动治理,可查看方案进展及效果,适用于多人协作治理。创建治理方案的相关参数说明请参见规划方案。 |
本双月治理成效 | |
治理表数量 | 在平台做治理操作(删除、TTL)的表。 |
节约物理存储量 | 在平台治理操作(删除、TTL)的收益。 |
无效资产减少量 |
|
明细分析-健康分情况 | |
排名 | 默认按照健康分从高到低排名,可选择按升序或降序排名显示。 |
存储健康分 | 筛选范围下,每个维度的存储健康分。 |
扣分占比 | 筛选范围下,每个维度的扣分在总扣分的占比。 |
各个子规则 | 展示子规则的扣分情况,支持下钻调整。 |
明细分析-分布情况 | |
存储健康分 | 筛选范围下,每个维度的存储健康分。 |
表数量 | 筛选范围下,包含的表数量。 |
物理存储量 | 筛选范围下,包含的表物理存储量。 |
存储占比 | 筛选范围下,每个维度的存储量在总物理存储量的占比。 |
近一周优化表数量 | 近一周,在平台做治理操作(删除、TTL)的表。 |
近一周节约存储量 | 近一周,在平台治理操作(删除、TTL)的收益。 |
明细分析-治理方案 | |
相关参数 | 展示筛选范围下,进行中的治理方案,详细说明可参见规划方案。 |
存储健康分支持您从全局或团队视角出发,在不同维度下进行健康分的查看,健康分计分体系则由治理项分数与健康分两部分组成,其中:
存储健康分由各个存储治理项分数复合而成,详见下方计算细则。
存储治理项分数因所在维度不同,计算规则不同。
从表维度,会基于一定的治理项规则给各个治理项打分,详见下方具体规则及权重说明。
在上层维度,如:团队、项目等,会基于该维度下各个表的治理项得分复合得到,以表的存储来作为权重。
具体治理项规则、口径、得分及相关治理操作,参考如下:
治理项 | 权重占比 | 详细口径 | 表粒度治理项得分口径 |
---|---|---|---|
Hive 表无查询 | 1/4 |
| 命中则为0分,否则100分。 |
TTL 设置不合理 | 1/4 |
| 未设置 TTL,扣减100分。 |
文件大小异常 | 1/4 |
|
|
存储格式不合理 | 1/4 |
| 命中则为0分,否则100。 |
存储健康分 = sum(治理项分数 * 权重)
说明
表粒度每个治理项规则中,分数满分为100,当前每个治理项的权重为1/4。
团队、部门、项目等粒度治理项得分 = sum( 表粒度的治理项得分*权重 )