(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 109101657 A
(43)申请公布日 2018.12.28
(21)申请号 CN201811007473.9
(22)申请日 2018.08.30
(71)申请人 杭州安恒信息技术股份有限公司
    地址 310000 浙江省杭州市滨江区通和路68号浙江中财大厦15层
(72)发明人 罗青云 范渊 莫金友
(74)专利代理机构 北京超凡志成知识产权代理事务所(普通合伙)
    代理人 王文红
(51)Int.CI
     
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      传销推荐人网站识别方法、装置及设备
(57)摘要
      本发明提供了一种传销推荐人网站识别方法、装置及设备,属于网站识别分类技术领域。本发明提供的传销推荐人网站识别方法、装置及设备,通过获取目标网站所包含的页面数据,然后从页面是中提取一级页面和二级页面的页面数据,再遍历一级页面和二级页面的页面数据,进行传销推荐人网站识别,该方法通过对一级页面和二级页面的页面数据进行分析,进而准确判断目标网站是否为传销推荐人网站,解决了无法准确识别传销推荐人网站的问题,同时为阻止网络传销行为作了有效的贡献。
法律状态
法律状态公告日
法律状态信息
法律状态
2021-07-30
发明专利申请公布后的驳回
发明专利申请公布后的驳回
2019-01-22
实质审查的生效
实质审查的生效
2018-12-28
公开
公开
权 利 要 求 说 明 书
1.一种传销推荐人网站识别方法,其特征在于,包括:
获取目标网站所包含的页面信息;
从所述页面信息中提取一级页面和二级页面的页面数据;
遍历所述一级页面和二级页面的页面数据,进行传销推荐人网站识别。
2.根据权利要求1所述的方法,其特征在于,从所述页面信息中提取一级页面和二级页面的页面数据的步骤,包括:
判断所述一级页面和二级页面的页面数据中是否存在节点数据;
如果是,获取form表单节点数据;其中,所述form表单节点数据为从所述一级页面和二级页面的页面数据中提取的。
3.根据权利要求2所述的方法,其特征在于,所述获取form表单节点数据的方法,还包括:
采用依次向上递归解析的方式,获取所述一级页面和二级页面的页面数据中存在的所有节点数据。
4.根据权利要求1所述的方法,其特征在于,遍历所述一级页面和二级页面的页面数据,进行传销推荐人网站识别的步骤,包括:
正则匹配到第一个关键字就停止提取所述一级页面和二级页面的页面数据中的传销特征的关键字信息;其中,所述关键字信息包括:推荐人、推荐码、邀请人及邀请码;
将所述关键字信息进行正则匹配;
如果匹配成功,则确定所述目标网站为传销推荐人网站。
5.根据权利要求4所述的方法,其特征在于,所述遍历一级页面和二级页面的页面数据,进行传销推荐人网站识别的步骤之前,所述方法还包括:
对所述一级页面和二级页面的页面数据进行文字标点切割。
6.一种传销推荐人网站识别装置,其特征在于,包括:
获取模块,用于获取目标网站所包含的页面信息;
提取模块,用于从所述页面信息中提取一级页面和二级页面的页面数据;
识别模块,用于遍历所述一级页面和二级页面的页面数据,进行传销推荐人网站识别。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
判断模块,用于判断所述一级页面和二级页面的页面数据中是否存在节点数据;
节点信息获取模块,用于当所述一级页面和二级页面的页面数据中存在节点数据时,获取form表单节点数据。
8.根据权利要求6所述的装置,其特征在于,所述识别模块还用于:提取所述一级页面和二级页面的页面数据中的传销特征的关键字信息;其中,所述关键字信息包括:推荐人、推荐码、邀请人及邀请码;将所述关键字信息进行正则匹配;如果匹配成功,则确定所述目标网站为传销推荐人网站。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
切割模块,用于对所述一级页面和二级页面的页面数据进行文字标点切割。
10.一种传销推荐人网站识别设备,其特征在于,包括:存储器以及处理器,所述存储器用于存储并支持处理器执行权利要求1~5中任一项所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
说  明  书
<p>技术领域
本发明涉及网站识别分类技术领域,具体而言,涉及一种传销推荐人网站识别方法、装置及设备。
背景技术
随着互联网的发展,互联网已经进入了各个领域。然而同样随着而来的是,互联网也被一些传统的非法行业所使用,如用来贩卖支、,经营赌博及网络传销等。
针对传销的分析特性看来,传销都是进行上下级的关联,通过拉人头的方式实现不限制级别的分润体系,进而从中进行获利,随着传销规模的增大,已经通过网络进行传销,促使传销行为更加猖狂。但是,现阶段对于推荐人相关网站的分析未达到精准化,未能成形成有效的的分析,不能准确识别传销网站和阻止网络传销行为。
发明内容
针对上述现有技术中存在的对于推荐人相关网站的分析未达到精准化,未能成形成有效的分析,依然存在不能准确识别传销网站和阻止网络传销行为问题,本发明提供了一种传销推荐人网站识别方法、装置及设备,可以准确识别推荐人网站,进而阻止网络传销行为。
第一方面,本发明实施例提供了一种传销推荐人网站识别方法,其中,包括:
获取目标网站所包含的页面信息;
从所述页面信息中提取一级页面和二级页面的页面数据;
遍历所述一级页面和二级页面的页面数据,进行传销推荐人网站识别。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,从所述页面信息中提取一级页面和二级页面的页面数据的步骤,包括:
判断所述一级页面和二级页面的页面数据中是否存在节点数据;
如果是,获取form表单节点数据;其中,所述form表单节点数据为从所述一级页面和二级页面的页面数据中提取的。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述获取form表单节点数据的方法,还包括:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。