(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 104123370 A (43)申请公布日 2014.10.29 | ||
(21)申请号 CN201410356492.8
(22)申请日 2014.07.24
(71)申请人 杭州安恒信息技术有限公司
地址 310051 浙江省杭州市滨江区通和路浙江中财大厦15层
(72)发明人 刘海卫 范渊 python正则表达式判断
(74)专利代理机构 杭州中成专利事务所有限公司
代理人 周世骏
(51)Int.CI
G06F17/30
权利要求说明书 说明书 幅图 |
(54)发明名称
数据库敏感信息探测方法及系统 | |
(57)摘要
本发明涉及信息安全技术领域,旨在提供数据库敏感信息探测方法及系统。该数据库敏感信息探测方法包括步骤:扫描数据库的系统视图,获取所有的用户表,对每一个用户表每个字段抽取一部分数据做为样本,对样本进行分析匹配,判断是否是敏感信息;该数据库敏感信息探测系统包括系统表、扫描模块、判断模块和显示模块,扫描模块和数据库连接,判断模块分别与敏感信息特征库、扫描模块相连,判断模块与显示模块连接。本发明基于正则表达特征库,通过特征库对数据库里的用户数据进行扫描探测,能够发现手机号、银行卡号、身份证号以及邮箱等敏感信息所在的位置,并提供详细的扫描报告,使数据库管理员能够重点防护和审计。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
权 利 要 求 说 明 书
1.数据库敏感信息探测方法,其特征在于,具体包括下述步骤:
(1)扫描数据库的系统视图,获取所有的用户表;
(2)对每一个用户表每个字段抽取一部分数据做为样本;
(3)对样本进行分析匹配,判断是否是敏感信息;
所述步骤(1)具体包括下述步骤:
步骤A:连接数据库;
步骤B:用SELECT语句获取数据库的系统视图里,数据库所有的表名,并排除系统 表,剩下用户表;
步骤C:将步骤B中获得的用户表列表返回;
所述步骤(2)具体包括下述步骤:
步骤D:在步骤C返回的用户表列表中,取一个用户表名;
步骤E:用SELECT语句和分页查询的方法,获取步骤D中选取的用户表中所有字段 的部分数据;所述部分数据是指取一个表开头的N条记录;
步骤F:将步骤E中获取的所有字段的部分数据,作为样本数据返回;
所述步骤(3)具体包括下述步骤:
步骤G:取步骤F返回的一个字段的样本数据;
步骤H:对步骤G中选取的样本数据,采用正则表达式匹配的方法判断样本数据是 否
属于敏感信息,判断方法为:如果样本数据全部跟敏感信息特征库中的敏感信息匹配, 认为样本数据是敏感数据字段,得出判断结果是;如果样本数据跟敏感信息特征库中的 敏感信息不低于80%的比例匹配,得出判断结果疑是;如果样本数据跟敏感信息特征库 中的敏感信息全部不匹配或者低于20%的比例匹配,则得出判断结果否;
步骤I:循环执行步骤D、步骤E、步骤F、步骤G、步骤H,直至完成对步骤C返 回的所有用户表进行判断,然后将步骤H中得出的判断结果返回,并显示包含有判断结 果的扫描报告,且当判断结果为疑是或者是时,扫描报告中还包括敏感信息字段清单。
2.根据权利要求1所述的数据库敏感信息探测方法,其特征在于,所述步骤H中 的敏感信息特征库是用于判断敏感信息的正则表达式的一个集合;敏感信息是指需要防 护和审计的数据,包括手机号、银行卡号、身份证号和邮箱。
3.根据权利要求2所述的数据库敏感信息探测方法,其特征在于,所述敏感信息 特征库中的正则表达式能进行自定义添加,用于敏感信息的匹配判断;正则表达式是公 开通用的字符串匹配方法。
4.实现权利要求1所述的数据库敏感信息探测方法的系统,其特征在于,包括系 统表、扫描模块、判断模块和显示模块,扫描模块和数据库连接,判断模块分别与敏感 信息特征库、扫描模块相连,判断模块与显示模块连接;
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论