(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 110472434 A (43)申请公布日 2019.11.19 | ||
(21)申请号 CN201910628442.3
(22)申请日 2019.07.12
(71)申请人 北京字节跳动网络技术有限公司
地址 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间
(72)发明人 江国洲 谭典雄
(74)专利代理机构 北京睿驰通程知识产权代理事务所(普通合伙)
代理人 张文平
(51)Int.CI
权利要求说明书 说明书 幅图 |
(54)发明名称
数据脱敏方法、系统、介质和电子设备 | |
(57)摘要
本发明提供一种数据脱敏方法、系统、介质及电子设备。所述方法包括:在离线数据库中提取用户数据;处理所述用户数据,获取用户在对文档编辑的一段时间内产生的增量数据及当前的版本快照内容;判断所述增量数据中的操作类型是否存在于操作类型白名单;当所述增量数据中的操作类型存在于所述操作类型白名单时,对所述操作类型对应的值的不同数据结构进行脱敏处理。所述方法通过脱敏规则对用户数据中的敏感信息进行数据的变形,实现敏感隐私数据的可靠保护。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
2019-12-13 | 实质审查的生效 | 实质审查的生效 |
2019-11-19 | 公开 | 公开 |
2022-12-20 | 专利权人的姓名或者名称、地址的变更IPC(主分类):G06F21/62专利号:ZL2019106284423变更事项:专利权人变更前:抖音视界(北京)有限公司变更后:抖音视界有限公司变更事项:地址变更前:100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间变更后:100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间 | 专利权人的姓名或者名称、地址的变更 |
权 利 要 求 说 明 书
1.一种数据脱敏方法,其特征在于,包括:
在离线数据库中提取用户数据;
处理所述用户数据,获取用户在对文档编辑的时间内产生的增量数据及当前的版本快照内容;
判断所述增量数据中的操作类型是否存在于操作类型白名单;
当所述增量数据中的操作类型存在于所述操作类型白名单时,对所述操作类型对应的值的不同数据结构进行脱敏处理。
2.根据权利要求1所述的方法,其特征在于,当所述数据结构包括值、样式及版本快照字段时,对所述值、样式及版本快照字段进行脱敏处理,包括:
当所述值、样式及版本快照字段的数据类型为整数型或浮点型时,则将所述值、样式及版本快照字段转换为统一数字。
3.根据权利要求2所述的方法,其特征在于,所述对所述值、样式及版本快照字段进行脱敏处理,进一步包括:当所述值、样式及版本快照字段的数据类型为字符串,且所述字符串不是内部网页地址时,遍历所述字符串,并根据所述字符串的类型进行相应的脱敏处理。
4.根据权利要求2所述的方法,其特征在于,所述对所述值、样式及版本快照字段进行脱敏处理,进一步包括:当所述值、样式及版本快照字段的数据类型为数组泛型时,则获取所述增量数据中关键值为类型时对应的字段值,并根据所述字段值的数据类型对所述字段值进行脱敏处理。
5.根据权利要求4所述的方法,其特征在于,所述根据所述字段值的数据类型对所述字段值进行脱敏处理,包括:
当所述字段值的类型包括链接或图片时,则将所述链接及图片所属链接、图片中的值字段进行转换;或,
当所述字段值的类型包括通知时,则将所述通知对应的用户标识、文本内容及链接字段进行转换;或,
当所述字段值的类型包括文本时,则将所述文本字段进行转换。
6.根据权利要求3所述的方法,其特征在于,所述根据所述字符串的类型进行相应的脱敏处理,包括:
当所述字符串为大写英文字母时,将所述字符串转换为统一固定的大写字母;或,
当所述字符串为小写英文字母时,将所述字符串转换为统一固定的小写字母;或,
当所述字符串为汉字时,则将所述字符串转换为汉;或,
当所述字符串为特殊字符集时,则所述字符串保留不变。
7.根据权利要求1所述的方法,其特征在于,所述对所述操作类型对应的值的不同数据结构进行脱敏处理,进一步包括:当所述数据结构包括公式字段时,对所述公式字段进行脱敏处理,包括:
根据正则匹配规则获取所述公式名称;
判断所述公式名称是否存在于现有公式白名单中;
当所述公式名称存在于所述现有公式白名单中时,根据所述正则匹配规则匹配所述公式中的值;
根据所述值的数据类型对所述值进行转换处理。
8.根据权利要求1所述的方法,其特征在于,所述对所述操作类型对应的值的不同数据结构进行脱敏处理,进一步包括:当所述数据结构包括表格名称字段时,根据MD5加密算法对所述表格名称进行脱敏处理。
9.一种数据脱敏系统,其特征在于,包括:
提取模块,用于在离线数据库中提取用户数据;
处理模块,用于处理所述用户数据,获取用户在对文档编辑的一段时间内产生的增量数据及当前的版本快照内容;
判断模块,用于判断所述增量数据中的操作类型是否存在于操作类型白名单;
脱敏模块,用于当所述增量数据中的操作类型存在于所述操作类型白名单时,对所述操作类型对应的值的不同数据结构进行脱敏处理。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至8中任一项所述的方法。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一项所述的方法。
说 明 书
<p>技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种数据脱敏方法、系统、介质和电子设备。
正则匹配两个大写字母加两个数字背景技术
随着产品的快速迭代,在迭代的过程中经常会发生问题,为了解决发生的问题,通常会采用后台调试工具(Debug)来定位问题,获取到信息后再进行更加深层次的调试。然而,在定位问题的过程中,用户数据中的敏感信息会发生暴露,容易造成用户数据的泄露。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论