You need to enable JavaScript to run this app.
导航

数据脱敏

最近更新时间2024.02.05 10:40:21

首次发布时间2022.04.08 15:18:27

1. 概述

数据脱敏,是指能够对包含敏感信息的字段通过配置脱敏规则进行数据掩码处理。使用该功能后,对应的字段会根据所设定的规则对敏感数据进行脱敏、变形、模糊化,从而实现在办公环境对敏感数据的隐私保护,实现公司的合规要求。

本功能为增值模块,若需体验可联系火山引擎商务团队

2. 产品优势

2.1 产品价值

信息时代我们对数据信息的安全要求越来越严格,无论是政府出台的相关的法律法规,还是各个行业的规范指南,都对个人信息等各类敏感数据提出了安全要求,数据脱敏可以帮助我们降低敏感数据泄漏的风险,为隐私数据加一层保护屏障。通过增加数据脱敏功能,能够大大降低传统业务场景中手动数据脱敏的实践,提高数据的交付效率和需求方的满意程度。同时,也让数据处理者、分析者、查看者可以在企业规定的信息安全要求下使用数据,进一步也促成了企业信息安全化建设。

2.2 产品优势

  • 脱敏规则灵活配置:用户可根据数据敏感与否,进行具体的字段脱敏配置,支持全脱敏、姓名脱敏、邮箱脱敏、联系方式脱敏等多种脱敏规则。

  • 脱敏生效范围自由可控:用户可根据业务具体需要,针对性设置数据脱敏的生效范围,对于敏感用户范围进行配置,更有业务适配性。

3. 快速入门

3.1 功能概览

产品功能功能介绍使用角色

涉敏定级

在新增数据集保存或存量数据集编辑时,系统会强制要求对数据集进行涉敏定级,包括「涉敏」、「不涉敏」两类,由数据集创建人主动进行判断。

管理员、数据集创建者

脱敏规则配置

当数据集被定义为“涉敏”后,需对数据集进行脱敏规则配置。由数据集创建人添加全部涉敏字段,并在“脱敏规则”下拉框中,选择相对应的脱敏规则。

管理员、数据集创建者

脱敏数据集应用

当数据集被定义为“涉敏”后,数据集在可视化查询、仪表盘、可视化建模等模块使用过程中,会出现相应的脱敏效果与操作细节脱敏限制。

数据集创建者
对数据集有权限的使用者与查看者

脱敏展示当数据集进行了脱敏规则配置与应用后,数据集在展示过程中,会进行脱敏展示,经过脱敏配置的字段将会呈现出变形、模糊化等。对基于数据集制作的图表与仪表盘有查看权限的所有查看者

3.2 操作路径概览

在新增数据集进行保存时或存量数据集编辑时,可进行数据脱敏规则配置。
(1)对数据集进行保存时,需要对「涉密等级」选项进行选择,对数据集是否涉敏的判定,当数据集中存在涉敏字段时需定级为“涉敏”,反之则为“不涉敏”

  • 涉敏:选择涉敏选项后,需要及时在数据集的详情界面中「数据脱敏」页签中对敏感字段增加脱敏规则,否则会出现下图所示异常提醒


(2)在数据集的详情界面中,「数据脱敏」页签中添加脱敏字段,选择需要脱敏的字段,点击「确定」

(3)给需要脱敏的字段添加相应的脱敏规则,系统针对全部涉敏字段均预置了相匹配的规则项供选择,支持全脱敏、姓名脱敏、邮箱脱敏、联系方式脱敏等多种脱敏规则,支持按照预设规则脱敏或按照自定义规则脱敏

(4)设置数据脱敏的生效范围,添加用户或用户组,并设置生效范围的规则,支持以下两种配置方式:

  • 适用成员受规则控制,成员以外的用户不受规则控制

  • 适用成员不受规则控制,成员以外的用户受规则控制


(5)可添加多个脱敏字段,添加完成后点击「确定」,保存后可至「数据预览」页签中查看脱敏结果

(6)进行脱敏后的数据展示如下

  • 不涉敏:选择不涉敏选项则无需做进一步设置,所有数据字段不进行脱敏操作,所展示的字段值为原始值。
4. 功能说明

4.1 数据集状态

(1)「未定级」状态:当脱敏完成部署后,全部存量数据集的状态均为「未定级」状态,需数据集创建人对自己名下数据集逐一完成定级操作。数据集在「未定级」状态下,会在左侧目录列表、详情页标题后增加相应图标进行标注,同时页面提示异常提醒,及时完成定级操作。

(2)「涉敏未脱敏」状态:当在涉敏定级环节标注成“涉敏”数据集后。数据集会定义为「涉敏未脱敏」状态,需数据集创建人对数据集完成涉敏字段的选择和脱敏规则的配置。数据集在「涉敏未脱敏」状态下,会在左侧目录列表、详情页标题后增加相应图标进行标注,同时页面提示异常提醒,及时完成定级操作。

(3)「涉敏已脱敏」状态:当数据集创建人对数据集完成涉敏字段的选择和脱敏规则的配置后,会标记为「涉敏已脱敏」状态。数据集在「涉敏已脱敏」状态下,会在左侧目录列表、详情页标题后增加相应图标进行标注。

(4)「不涉敏」状态:当在涉敏定级环节标注成“不涉敏”后,数据集即为「不涉敏」数据集。

4.2 关联数据集


(1)当子数据集中有不少于1个脱敏数据集时,逻辑数据集均是继承为“涉敏已脱敏”状态;
(2)逻辑数据集的脱敏字段为全部子数据集的脱敏字段的合集;
(3)子数据集对数据脱敏规则的全部调整会同步到逻辑数据集中。

4.3 脱敏规则

预设脱敏规则

脱敏规则规则说明规则明细
姓名脱敏适用于姓名字段脱敏。保持前1位不脱敏,其余部分 * 脱敏
邮箱脱敏适用于邮箱字段脱敏。保留邮箱@后真实信息,前面部分 * 脱敏(特殊字符);没有@则全脱敏
联系方式脱敏适用于手机号、固定电话字段脱敏。保持前3位不脱敏,其余部分 * 脱敏
中国证件号码通用规则适用于组织机构号、银行卡、营业执照号、工商注册号等多种证件号类型字段脱敏。保持前3位不脱敏,其余部分 * 脱敏
中国公民身份证脱敏适用于大陆及港澳台地区身份证字段脱敏。保持前3位不脱敏,其余部分 * 脱敏
全脱敏将字段中全部信息进行脱敏。将字段中全部信息进行脱敏

自定义脱敏规则

脱敏规则规则明细
脱敏中间字符保留前 M 位,后 N 位,其余字符替换成 *
脱敏头尾字符保留从 M 位至 N 位,其余字符替换成 *

特殊字符前脱敏

特殊字符 X 之前字符替换成 *
特殊字符包括:" ¥ $ ' & ( ) + - ‘ / . ; : = ? @ % [ ] \ _ { }

特殊字符后脱敏

特殊字符 X 之后字符替换成 *
特殊字符包括:" ¥ $ ' & ( ) + - ‘ / . ; : = ? @ % [ ] \ _ { }

脱敏规则配置示意图:
alt

4.4 数据脱敏应用效果:可视化查询

4.4.1 脱敏状态说明

当数据集涉敏时,以下截图为不同状态下的标记显示。

4.4.2 脱敏数据集功能差异

涉敏字段支持作为维度、指标和筛选项;支持全部的图表、分析功能正常使用;不支持的具体功能点差异参见以下内容。
(1)在绘制表格和图表时,涉敏字段的数据均做掩码处理。



(2)涉敏字段为维度字段时,不支持「字段值别名」「地理角色」「创建组」等功能。

(3)涉敏字段为指标字段时,不支持「创建组」功能

(4)涉敏字段作为图表指标时,仅「支持计数」、「计数不同(快速)」、「计数不同」、「最大值」、「最小值」的聚合方式,同时不支持「设置数据格式」功能

(5)涉敏字段作为筛选时,只支持「精确筛选」,字段的维度值同时做脱敏处理

(6)计算字段:字段表达式中包含涉敏字段时,继承脱敏字段的规则

  • 当表达式完全不做加工,则按数据源字段规则执行

  • 当表达式有进行加工处理,则按全脱敏字段规则执行

4.5 数据脱敏应用效果:仪表盘

(1)全局筛选器中包含涉敏字段时,涉敏维度值进行脱敏处理

(2)数据下载、仪表盘导出功能,涉敏字段的数据均进行脱敏处理。下图左侧为下载数据、右侧为仪表盘

(3)仪表盘订阅、监控及嵌出功能,均以脱敏后的结果进行展示。



4.6 数据脱敏应用效果:可视化建模

从可视化建模输出的数据集不继承输入数据集的脱敏字段控制,输出成新数据集后,定级状态为“未定级”,需创建用户重新进行脱敏字段配置。配置操作与本文前面所述的内容一致。