(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 113946823 A (43)申请公布日 2022.01.18 | ||
(21)申请号 CN202111218213.8
(22)申请日 2021.10.20
(71)申请人 中国电子科技集团公司第三十研究所
地址 610000 四川省成都市高新区创业路6号
(72)发明人 李航 丁建伟 孙恩博 黎艺泉 陈周国
(74)专利代理机构 51214 成都九鼎天元知识产权代理有限公司
代理人 张杰
(51)Int.CI
G06F21/56(20130101)
G06F21/55(20130101)
G06F21/57(20130101)
G06N20/00(20190101)
G06F21/55(20130101)
G06F21/57(20130101)
G06N20/00(20190101)
权利要求说明书 说明书 幅图 |
(54)发明名称
一种基于URL基线偏离度分析的SQL注入检测方法及装置 | |
(57)摘要
本发明提供一种基于URL基线偏离度分析的SQL注入检测方法及装置,所述方法包括:构建基线的步骤;样本再划分的步骤;有监督学习的步骤。本发明的有益效果是:(1)通过构造基线和样本再划分,不仅能提升白样本的纯度,使对正常业务的http流量数据的画像更精确,同时还能从业务数据中发现黑样本,缩小训练样本中的正负样本比例,使分类器更加高效快速训练与预测。同时,黑样本能不断累积,具有较强的灵活性。(2)本发明从多个维度进行特征构造,刻画较为全面,同时黑样本的不断累积,使得可以发现新的SQL注入方式,具有强大的适应性。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
2022-02-08 | 实质审查的生效 | 实质审查的生效 |
2022-01-18 | 公开 | 公开 |
权 利 要 求 说 明 书
1.一种基于URL基线偏离度分析的SQL注入检测方法,其特征在于,包括:正则匹配快代理
构建基线的步骤;
样本再划分的步骤;
有监督学习的步骤;其中,在有监督学习的步骤中进行多维度特征构造。
2.根据权利要求1所述的基于URL基线偏离度分析的SQL注入检测方法,其特征在于,所述构建基线的步骤包括:
获取正常业务的http流量数据;
以http请求中的host和cgi作为主键,对此主键下的正常业务的http流量数据进行分析,以head、param以及content进行泛华,统计相关内容,构建基线。
样本再划分的步骤;
有监督学习的步骤;其中,在有监督学习的步骤中进行多维度特征构造。
2.根据权利要求1所述的基于URL基线偏离度分析的SQL注入检测方法,其特征在于,所述构建基线的步骤包括:
获取正常业务的http流量数据;
以http请求中的host和cgi作为主键,对此主键下的正常业务的http流量数据进行分析,以head、param以及content进行泛华,统计相关内容,构建基线。
3.根据权利要求2所述的基于URL基线偏离度分析的SQL注入检测方法,其特征在于,所述样本再划分的步骤包括:
获取SQL注入的http流量数据;
计算SQL注入的http流量数据与基线的偏离程度,综合考虑精确率和召回率,以F1值作为偏离程度取值的评价标准,将F1值得分最高的偏离程度即为样本划分标准;
根据样本划分标准对输入的正常业务的http流量数据以及SQL注入的http流量数据进行再次选择,选择出标准的白样本并增加黑样本。
4.根据权利要求3所述的基于URL基线偏离度分析的SQL注入检测方法,其特征在于,所述有监督学习的步骤包
括:
在进行样本再划分后,将得到的白样本和黑样本进行多维度特征构造;
将完成多维度特征构造后的白样本和黑样本作为训练样本输入分类器中进行有监督训练;
将待预测样本输入训练好的分类器中得到预测白样本和预测黑样本。
5.根据权利要求4所述的基于URL基线偏离度分析的SQL注入检测方法,其特征在于,所述有监督学习的步骤还包括:
将预测黑样本作为已知黑样本添加到训练样本中,再将训练样本输入分类器中进行有监督训练。
在进行样本再划分后,将得到的白样本和黑样本进行多维度特征构造;
将完成多维度特征构造后的白样本和黑样本作为训练样本输入分类器中进行有监督训练;
将待预测样本输入训练好的分类器中得到预测白样本和预测黑样本。
5.根据权利要求4所述的基于URL基线偏离度分析的SQL注入检测方法,其特征在于,所述有监督学习的步骤还包括:
将预测黑样本作为已知黑样本添加到训练样本中,再将训练样本输入分类器中进行有监督训练。
6.根据权利要求1所述的基于URL基线偏离度分析的SQL注入检测方法,其特征在于,所述分类器为XGboost模型。
7.一种基于URL基线偏离度分析的SQL注入检测装置,其特征在于,包括:
基线构造模块;所述基线构造模块用于执行构建基线的步骤;
样本再划分模块;所述样本再划分模块用于执行样本再划分的步骤;
有监督学习模块,所述有监督学习模块用于执行有监督学习的步骤;其中,在有监督学习的步骤中进行多维度特征构造。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论