本节将通过一个实例介绍静态脱敏的使用方式,方便用户更好的了解静态脱敏。

准备


静态脱敏功能主要是配合数据传输进行使用的,因此在进行静态脱敏之前首先要准备进行脱敏的表。以MySQL to Hive为例,此处需要先准备MySQL表,MySQL表要事先在数据源登记中进行登记并完成连通性测试保证可用,如果不清楚如何进行登记,可查看数据传输中关于这块的介绍。

在MySQL中准备好进行脱敏的数据,建表语句如下:

CREATE TABLE `mysql2hive_static`(
  `user_id` varchar(64) COMMENT'用户ID',
  `phone` varchar(64) COMMENT'手机号'
)

这里的phone字段需要为varchar格式才能够被作为敏感字段识别。

插入数据:

insert into mysql2hive_static values ('1','15812388888'),('2','13339999999')

查看数据:

select * from mysql2hive_static

静态脱敏配置


涉及该操作的功能权限:数据传输离线任务的新建查看运行&上线&下线

通过导航栏进入数据传输页面。

离线同步任务页面,点击新建任务

配置任务的基本信息,如下:

数据来源与去向中,首先填写数据来源MySQL表所在的数据源和库;然后,在数据去向中勾选hive库,此时因为没有构建去向表,所以需要通过快速创建表的方式进行创建,点击快速创建表按钮。

在弹框中输入表名称,点击生成SQL,修改好后确认无误,点击执行

其它项不需要修改,默认即可。查看字段映射内容,如没有问题,可开始进行数据脱敏配置。

高级配置项中可看到数据脱敏,此处我们对手机号进行脱敏,因此在脱敏规则中选择如下:

扫描配置处,因为此例中就2条数据,所以可将扫描条数设置为2,扫描匹配率为100%,实际使用过程中可根据情况进行设置。配置完成后,点击扫描按钮。

扫描完成后,会将识别出来的字段列在下方框中。

点击确定完成配置。在任务列表里面,点击运行

运行完成后,可前往数据地图,查找该hive表并在数据预览标签页中看到phone字段已被脱敏。