You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件(私有化)

大数据研发治理套件(私有化)

复制全文
数据保护
数据脱敏
复制全文
数据脱敏

通过数据脱敏处理,原始数据的真实信息会被隐藏或篡改,从而防止未经授权的用户获取敏感信息的真实值,实现对敏感数据的保护。本功能支持可视化配置,您可按需创建脱敏任务并对其进行相应管理。

操作步骤

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据安全 > 数据保护 > 数据脱敏,进入数据脱敏页面。
    Image
  3. 可执行以下操作:
    • 新建脱敏任务
      单击新建脱敏任务按钮,进入新建脱敏任务页面,根据页面提示,设置相关信息并依次单击下一步按钮,设置完成后,单击提交按钮完成脱敏任务创建。
      新建脱敏任务相关参数说明如下表所示。

      参数

      说明

      基础信息

      *任务名称

      脱敏任务的名称,自行设定。
      任务名称不可仅由数字、符号组成,且首字符不能是符号。

      *负责人

      任务的负责人,自动填充为当前用户,不可编辑。
      该参数可在编辑任务时进行修改。

      描述

      任务的描述信息,长度不超过200个字符。

      *数据源

      支持的数据源类型,已支持LAS、Apache Hive、EMR StarRocks。

      说明

      • 该功能支持 LAS3,但暂不支持 LAS3 集群下的 hudi 表。LAS3 以 Apache Hive(CDH-3.2.2 版本) 方式接。
      • EMR StarRocks 仅 3.x 版本支持该功能。

      *集群

      创建任务的数据库所在的集群名称,下拉可选已创建的集群。

      说明

      仅可选择安全模式且已创建对应采集器的集群。若已绑定集群从快捷模式切换为安全模式,则数据安全侧第二天才能看到该元数据。

      *数据库

      创建任务的数据表所在库,下拉可选已创建的数据库。
      选择自己有权限的数据表所在库。

      *数据表

      创建脱敏任务的数据表,下拉可选自己有读写或只读权限的数据表。

      说明

      仅支持选择含有分区字段的源数据表,否则不能进入下一步。

      脱敏策略

      *字段名称

      要脱敏字段的名称。可通过以下两种方式添加字段设置项:

      • 添加单个字段
        1. 通过添加字段按钮,添加单个字段设置项。
        2. 字段名称下拉框中选择已有表字段,不可重复选择。选择字段名称后,该字段的类型、描述、保密级别、安全标签、是否敏感列等其他信息会自动填充显示。
      • 批量添加字段
        1. 通过清空并添加全部字段按钮, 清空原有输入的字段,并添加整张表的全部字段。
        2. 每个字段的加密算法均自动填充为原始值,不脱敏,可手动对需要脱敏的字段做调整。

      说明

      Apache Hive 类型的数据支持清空并添加全部字段。

      *脱敏算法

      采用的脱敏算法,支持 Hash字符遮盖原始值,不脱敏三类选项,下拉可选。

      • Hash:支持SHA-256和SM3算法选项,下拉可选。
      • 字符遮盖:下拉可选已创建的脱敏规则算法。创建规则的相关说明请参见规则管理
      • 原始值,不脱敏:指该列数据选择不脱敏,下拉可选。

      说明

      EMR StarRocks 数据源仅支持 Hash 脱敏算法。

      目标数据表

      *处理方式

      采用的处理方式,支持写入新目标表方式,即选择一张目标表,在该表新增列并写入加密数据。

      *目标表类型

      目标数据表的类型,仅支持新建表并写入

      *数据库

      新建表所属的数据库,下拉可选已创建的数据库。

      说明

      仅当您具备该数据库的建表权限时,才可创建表。若无建表权限,可进行权限申请,请参见申请权限

      *数据表

      数据表的名称,自行设定。
      数据表名称仅可由数字、小写字母或下划线组成。

      说明

      数据表创建成功后,当前用户将默认成为该表的表负责人和表权限负责人。

      *保密级别

      数据表的保密级别,支持L1、L2、L3、L4四个选项,下拉可选。

      说明

      库下新增表的密级不能高于该库的密级。若表密级设置过高,系统会提示更改。

      列名

      字段配置脱敏策略后新增的列名,自动填充,可编辑。
      列名自动填充为“源列名_masked”,保密级别和安全标签默认采用对应字段的信息。

      任务调度

      *调度类型

      任务调度类型,支持手动执行周期执行两个选项。

      • 手动执行:由用户在任务列表的操作列单击执行按钮触发执行计划。
      • 周期执行:指任务可基于配置的调度参数定时自动执行。

      *分区字段

      将分区表指定字段作为日期分区。设置内容包括分区字段和分区字段值两部分:

      1. 分区字段:选项为已有的分区字段,下拉可选其中一个字段。
      2. 分区字段值:选择分区字段后,需填写分区的值。可填写固定值,或开发平台可支持的时间变量,例如 ${date}、${DATE}。

      说明

      • 调度类型选择周期执行时,需设置该参数。
      • 若此表没有分区,则不显示该参数。
      • 当存在多个分区字段时,应选择天级分区字段。

      *调度生效日期

      调度的生效时间范围。超出调度生效时间,任务会自动关闭。

      • 开始时间默认填写为“当下日期和时刻”,结束时间默认填写为“一个月后的同一日期和时刻”。
      • 开始时间:只能选“当下日期和时刻”之后的时间。
      • 结束时间:距离开始时间不超过1年,不能在开始时间之前。

      说明

      调度类型选择周期执行时,需设置该参数。

      *执行频率

      调度执行频率,支持每天每周每月三个选项。

      • 每天:执行日期需要设置每天的几点来执行。
      • 每周:执行日期需要设置每周几来执行,支持多选。
      • 每月:执行日期需要设置每月几号执行,支持多选。

      说明

      调度类型选择周期执行时,需设置该参数。

      *执行日期

      调度执行的日期,采用“日期”或“时刻”的配置方式。

      • 执行频率选择每天时,执行日期选项为具体的时刻。
      • 执行频率选择每周时,执行日期选项为周一 ~ 周日,可多选。
      • 执行频率选择每月时,执行日期选项为1~31,可多选。

      说明

      调度类型选择周期执行时,需设置该参数。

      *资源队列

      任务调度时使用的资源队列,下拉可选已创建的资源队列。创建资源队列的操作请参见资源管理

      说明

      数据源选择 Apache HiveLAS 时,需设置该参数。

      上游依赖

      当前任务的上游依赖,内容包括任务名称、表名、分区信息,显示为列表形式。
      系统根据任务详情会推荐显示所有任务依赖,仅勾选的任务才会作为当前任务的实际上游依赖。

      说明

      • 调度类型选择周期执行时,可设置该参数。
      • 当系统检测到源表有任务依赖时,会显示该参数并返回相关任务信息。
        • 若检测到无任务依赖,则建议选择手动执行
        • 若选择了上游依赖任务,则建议将调度时间设置为所选任务之后。
    • 管理脱敏任务
      创建脱敏任务后,在相应任务的列表展示页面,可以进行查询、执行、修改负责人等管理操作,相关说明请参见管理数据加密任务

后续操作

执行脱敏任务后,您可前往数据开发页面,通过调试数据开发任务、临时查询等操作,查看脱敏后的数据。

最近更新时间:2025.12.04 17:51:11
这个页面对您有帮助吗?
有用
有用
无用
无用