什么是数据脱敏?
数据脱敏,又称数据隐私或数据变形,是在给定的规则和策略下对敏感数据进行转换和修改的技术机制,可以在很大程度上解决不可信环境下敏感数据的使用问题。根据数据保护标准和脱敏策略,对业务数据中的敏感信息进行自动变形,实现敏感信息的隐藏。
数据脱敏的方法有哪些?
几种常见的脱敏方法包括:
替代:用虚构的数据代替真实的价值。比如建立一个大型的虚拟值数据表,为每个实值记录生成随机种子,用哈希映射代替原始数据内容。用这种方法得到的数据与真实数据非常相似。失效:将真值或部分真值替换为NULL或* * * * *,如覆盖信用卡号的最后12位数字。
加扰:重新随机分配敏感数据列的值,混淆了原始值与其他字段的关系。这种方法不影响原始数据的统计特性,如最大/最小/方差。
求平均值:对于数值数据,先计算它们的平均值,然后使脱敏值随机分布在平均值周围,以保持数据之和不变。通常用于产品成本表、工资表等场合。
反推理:找到另一个可能从某些字段中推断出来的敏感字段的映射,对这些字段进行脱敏,比如可以从出生日期推断出身份证号、性别、地区的场景。
偏移量:通过随机移位改变数字数据。
FPE:格式保持加密,即格式保持加密是一种特殊的可逆脱敏方法。原始数据采用加密密钥和算法加密,密文格式与原始数据在逻辑规则上一致,如日期、卡号、结构化值等。原始数据可以通过解密密钥来恢复。
基于其他参考信息的筛选:根据预定义的规则,仅更改部分响应内容(例如,筛选VIP客户名称,但显示其他客户等)。).
限制返回的行数:只提供响应数据的子集,以防止用户访问所有符合要求的数据。