(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 109829328 A (43)申请公布日 2019.05.31 | ||
(21)申请号 CN201811560044.4
(22)申请日 2018.12.19
(71)申请人 上海晶赞融宣科技有限公司
地址 200072 上海市静安区灵石路695号珠江创业园区25幢1101室
(72)发明人 姜勇刚
(74)专利代理机构 北京集佳知识产权代理有限公司
代理人 张振军
(51)Int.CI
权利要求说明书 说明书 幅图 |
(54)发明名称
数据脱敏、逆脱敏方法及装置、存储介质、终端 | |
(57)摘要
一种数据脱敏、逆脱敏方法及装置、存储介质、终端,数据脱敏方法包括:获取待脱敏数据,所述待脱敏数据为姓名;确定所述姓名中的姓氏与名字,所述姓氏与所述名字分别对应至少一个字;根据所述名字以及各个字与统一码之间的映射关系获得所述名字对应的原始统一码;对于所述名字中每个字对应的原始统一码,按照预设偏移量确定所述名字中每个字对应的新的统一码;确定各个新的统一码对应的字为脱敏后的名字。本发明技术方案可以在实现对数据脱敏的同时保留数据的统计特性。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
2022-10-11 | 发明专利申请公布后的驳回IPC(主分类):G06F21/62专利申请号:2018115600444申请公布日:20190531 | 发明专利申请公布后的驳回 |
权 利 要 求 说 明 书
1.一种数据脱敏方法,其特征在于,包括:
获取待脱敏数据,所述待脱敏数据为姓名;
确定所述姓名中的姓氏与名字,所述姓氏与所述名字分别对应至少一个字;根据所述名字以及各个字与统一码之间的映射关系获得所述名字对应的原始统一码;
对于所述名字中每个字对应的原始统一码,按照预设偏移量确定所述名字中每个字对应的新的统一码;
确定各个新的统一码对应的字为脱敏后的名字。
2.根据权利要求1所述的数据脱敏方法,其特征在于,所述按照预设偏移量确定所述名字中每个字对应的新的统一码包括:
在所述名字中每个字对应的原始统一码的基础上增加所述预设偏移量,以得到所述名字中每个字对应的新的统一码。
3.根据权利要求1所述的数据脱敏方法,其特征在于,采用以下公式计算所述新的统一码:
newPosition=[oldPostion-19968+deltaRange]mod 20901+19968;其中,newPosition表示新的统一码,oldPostion表示原始统一码,deltaRange表示所述预设偏移量。
正则匹配到第一个关键字就停止4.根据权利要求1所述的数据脱敏方法,其特征在于,所述确定所述姓名中的姓氏与名字包括:
将所述姓名中各个字与知识库中的标准姓氏进行匹配,以得到匹配结果;
至少根据匹配结果将与所述标准姓氏相匹配的所述姓名中的字作为所述姓氏。
5.根据权利要求4所述的数据脱敏方法,其特征在于,所述匹配结果包括所述姓名中与所述标准姓氏相匹配的至少一个字,所述至少根据匹配结果将与所述标准姓氏相匹配的所述姓名中字作为所述姓氏包括:
确定所述匹配结果中与所述标准姓氏相匹配的至少一个字在所述姓名中的位置,所述位置包括字在所述姓名中的顺序;
确定位置处于所述姓名的首位的字,以作为所述姓氏。
6.根据权利要求1所述的数据脱敏方法,其特征在于,所述获取待脱敏数据包括:
获取原始数据;
利用正则表达式对所述原始数据中的姓名进行识别,以得到所述待脱敏数据。
7.一种数据逆脱敏方法,其特征在于,包括:
获取脱敏后的名字;
按照所述脱敏后的名字以及各个字与统一码之间的映射关系获得所述脱敏后的名字对应的新的统一码;
对于所述脱敏后的名字中每个字对应的新的统一码,按照预设偏移量确定所述脱敏后的名字中每个字对应的原始统一码;
确定各个原始统一码对应的字为脱敏前的名字。
8.一种数据脱敏装置,其特征在于,包括:
脱敏数据获取模块,适于获取待脱敏数据,所述待脱敏数据为姓名;
分离模块,适于确定所述姓名中的姓氏与名字,所述姓氏与所述名字分别对应至少一个字;
第一映射模块,适于根据所述名字以及各个字与统一码之间的映射关系获得所述名字对应的原始统一码;
脱敏模块,适于对于所述名字中每个字对应的原始统一码,按照预设偏移量确定所述名字中每个字对应的新的统一码;
脱敏后数据确定模块,适于确定各个新的统一码对应的字为脱敏后的名字。
9.一种数据逆脱敏装置,其特征在于,包括:
脱敏后数据获取模块,适于获取脱敏后的数据,所述脱敏后的数据包括脱敏后的名字;
第二映射模块,适于按照所述脱敏后的名字以及各个字与统一码之间的映射关系获得所述脱敏后的名字对应的新的统一码;
逆脱敏模块,适于对于所述脱敏后的名字中每个字对应的新的统一码,按照预设偏移量确定所述脱敏后的名字中每个字对应的原始统一码;
脱敏前数据确定模块,适于确定各个原始统一码对应的字为脱敏前的名字。
10.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至6中任一项所述数据脱敏方法的步骤,或者执行权利要求7所述的数据逆脱敏方法的步骤。
11.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至6中任一项所述数据脱敏方法的步骤,或者执行权利要求7所述的数据逆脱敏方法的步骤。
说 明 书
<p>技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据脱敏、逆脱敏方法及装置、存储介质、终端。
背景技术
随着商业数据管理平台(DataManagementPlatform,DMP)步入大数据时代,目前可以在海量数据中进行数据挖掘与分析,为公司发现新的商业机遇提供数据支持。但在对数据进行挖掘利用的过程中,不可避免的产生数据安全问题。例如在商业DMP系统中,存储着大量个人姓名、出生日期、手机号码等一系列的敏感数据,因此,如何在程序开发、测试、业务分析的场景下,安全有效使用这些数据也就成为亟需解决的问题。一般情况下,会用数据脱敏的方式来解决这个问题。数据脱敏是指对敏感数据进行关键字屏蔽、字符替换、字符变形、随机字符替换等处理方式,达到对用户访问敏感数据真实内容的权限控制。对于存储在分布式系统中的原始敏感数据,通过脱敏处理,不同权限的业务用户可以看到不同的展现结果,且不会丢失业务统计所需要的维度。这样处理之后即可以满足业务统计需求,也保护了个人敏感数据。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论