⽹络爬⾍?你可能⾯临的法律责任
⽬前,我国并未出台专门针对⽹络爬⾍技术的法律规范,但在司法实践中,相关判决已屡见不鲜。
以“爬⾍”为关键字在中国裁判⽂书⽹进⾏检索,其中四分之三的案件集中在民事领域,刑事案件和⾏政案件占⽐四分之⼀。民事案由主要为“知识产权与竞争纠纷”,⽽刑事案由主要为刑法第⼆百五⼗三条之⼀规定的“侵犯公民个⼈信息罪”和第⼆百⼋⼗五条、⼆百⼋⼗六条规定的计算机⽹络犯罪。
从技术中⽴的⾓度来看,爬⾍技术本⾝并⽆违法违规之处,使⽤爬⾍技术是否触犯法律底线,取决于主体如何使⽤、为何使⽤。
因此本⽂将从以下⼏个⽅⾯对有关法律规范和司法案例进⾏梳理。
⼀、从爬取的数据内容看
从爬取对象看,个⼈信息、商业秘密和作品,都是为法律所保护的对象。
(⼀)爬取个⼈信息
《民法典》第⼀百⼀⼗⼀条规定,⾃然⼈的个⼈信息受法律保护。任何组织或者个⼈需要获取他⼈个⼈
信息的,应当依法取得并确保信息安全,不得⾮法收集、使⽤、加⼯、传输他⼈个⼈信息,不得⾮法买卖、提供或者公开他⼈个⼈信息。⽽《⽹络安全法》第四⼗四条也规定了任何个⼈和组织不得窃取或者以其他⾮法⽅式获取个⼈信息,不得⾮法出售或者⾮法向他⼈提供个⼈信息。ybyx35在线中文字日产幕
同时,惩罚最为严厉的《刑法》也对抓取个⼈信息的⾏为进⾏了规制。《刑法》第⼆百五⼗三条之⼀规定了侵犯公民个⼈信息罪,违反国家有关规定,向他⼈出售或者提供公民个⼈信息,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚⾦;情节特别严重的,处三年以上七年以下有期徒刑,并处罚⾦。单位犯此罪的,对单位判处罚⾦,并对其直接负责的主管⼈员和其他直接责任⼈员,依照各该款的规定处罚。此外,未经被收集者同意,即使是将合法收集的公民个⼈信息向他⼈提供的,也属于刑法第⼆百五⼗三条之⼀规定的“提供公民个⼈信息”,可能构成犯罪。
此前宣判的“魔蝎科技案”【案号:(2020)浙0106刑初437号】,涉案单位杭州魔蝎数据科技有限公司犯侵犯公民个⼈信息罪,判处罚⾦三千万元。公司法⼈周某某被判有期徒刑三年,缓刑四年;技术总监袁某被判有期徒刑三年,缓刑三年。
魔蝎公司主要与各⽹络贷款公司、⼩型银⾏进⾏合作,为⽹络贷款公司、银⾏提供需要贷款的⽤户的个⼈信息及多维度信⽤数据,魔蝎公司将其开发的前端插件嵌⼊上述⽹贷平台APP中,当⽹贷平台⽤户使⽤⽹贷平台的APP借款时,贷款⽤户需要在魔蝎公司提供的前端插件上,输⼊其通讯运营商、社
保、公积⾦、淘宝、京东、学信⽹、征信中⼼等⽹站的账号、密码,经过贷款⽤户授权后,魔蝎公司的爬⾍程序代替贷款⽤户登录上述⽹站,进⼊其个⼈账户,利⽤各类爬⾍技术,爬取(复制)上述企、事业单位⽹站上贷款⽤户本⼈账户内的通话记录、社保、公积⾦等各类数据,并按与⽤户的约定提供给⽹贷平台⽤于判断⽤户的资信情况,并从⽹贷平台获取每笔0.1元⾄0.3元不等的费⽤。
期间,魔蝎公司在和个⼈贷款⽤户签订的《数据采集服务协议》中明确告知贷款⽤户“不会保存⽤户账号密码,仅在⽤户每次单独授权的情况下采集信息”,但未经⽤户许可仍采⽤技术⼿段长期保存⽤户各类账号和密码在⾃⼰租⽤的阿⾥云服务器上。
杭州西湖区⼈民法院认为,魔蝎科技明确告知不会保存⽤户各类账号密码,还是未经许可⾮法留存⽤户信息,是以其他⽅法⾮法获取公民个⼈信息,构成侵犯公民个⼈信息罪。
(⼆)爬取作品和商业秘密
如果爬取的对象是著作权法意义上的作品,此⾏为可能落⼊著作权法的规制范畴。
⾸先,如果访问对象设置了保证只有获得授权的⽤户才可访问的技术措施,⽽爬⾍为获得数据(作品)突破了此技术措施,此⾏为可能被认定为《著作权法》第四⼗九条规定的破坏技术措施⾏为。其次,存储被爬数据(作品)的⾏为,其实质上是著作权法所规定的对作品进⾏“复制”的⾏为,因⽽落⼊著作权⼈“复制权”的控制范围。
最后,如果⾏为⼈将被爬取的作品在互联⽹上公开传播,则可能会侵犯著作权⼈的“信息⽹络传播权”,情节严重则有可能构成“侵犯著作权罪”。如⾦某某、潘某侵犯著作权罪案中【(2018)沪0110刑初150号】,被告⼈以冰⾖公司的名义雇佣员⼯开发“免费⼩说书城”⼿机APP软件(安卓端),并编写爬⾍软件从互联⽹上抓取⼩说数据储存⾄租⽤的阿⾥云服务器za软件即从互联⽹上抓取⽤户所需的⼩说内容,发送并缓存⾄上述服务器内,供⽤户免费阅读。因此,上海市杨浦区⼈民法院认为⾦某某、潘某构成侵犯著作权罪。
此外,如果⾏为⼈在突破技术措施后接触、存储访问对象存储的“商业秘密”,此后⼜将该数据进⼀步利⽤,甚⾄公开披露、使⽤,则可能触犯《反不正当竞争法》第九条,构成对权利⼈商业秘密的侵犯。在前锦公司诉逸橙公司其他不正当竞争纠纷案中【(2019)沪73民终263号】,前程⽆忧⽹站(www.51job)是由前锦公司主办的。www.ifchange 是⽹站由逸橙公司主办,该⽹站名称为“e成”。该⽹站“功能设置”内有“关联外⽹账号”的服务,⽤户关联完成后可以在e成轻松完成⼀键发布、刷新等职位管理⼯作,可以⾃⾏设置是否将外⽹主投简历统⼀存储到⾃有云⼈才库。前锦公司主张逸橙公司通过关联账号功能获取并使⽤了⽤户在前程⽆忧⽹站的账号和密码,登录前程⽆忧⽹站后使⽤爬⾍技术查阅了⽹站中的简历,并将该些简历缓存在其服务器上。同时,前锦主张保存于前程⽆忧⽹站以及上诉⼈企业账户内的整体简历信息为商业秘密,逸橙公司侵害其商业秘密的⾏为包括未经前锦公司及其⽤户的许可,实施了向逸橙公司员⼯及其他企业⽤户披露含有个⼈联系⽅式的保密信息的⾏为。
浦东法院在⼀审判决书中【(2017)沪0115民初89112号】确认前锦公司主张的信息构成商业秘密。虽然上海知识产权法院在⼆审时并未认可逸橙公司的经营模式构成对前锦公司的不正当竞争,此案仍可以作为企业的合规参考。
⼆、从爬⾍绕开技术措施看
“如何使⽤”爬⾍技术,是判断爬⾍⾏为是否正当的标准之⼀。
(⼀)robots协议
⽬前,Robots协议在法律上尚未被认可为具有法律约束⼒的“协议”或是⼀种强有⼒的技术措施,我国司法实践多认为Robots协议是⼀种“声明”。
国内判决中对Robots协议的法律性质作为较为完整论述的见于百度诉奇虎360案【案号:(2013)⼀中民初字第2668号、(2013)⾼民初字第3755号】。百度公司的Robots协议不允许360爬⾍抓取百度⽹页内容,但奇虎公司未遵守其Robots协议,抓取了百度⽹站内容并作为搜索结果提供给⽤户。此后,在互联⽹协会牵头下,百度公司和奇虎公司作为共同发起⼈之⼀,签署《互联⽹搜索引擎服务⾃律公约》。
在该案件审理中,北京市⼀中院对于对Robots协议的相关法律问题进⾏了评述:Robots 协议是技术规
范,并⾮法律意义上的协议;Robots协议系⽹站服务商或所有者⾃⾏编写,属于单⽅宣⽰,⽆论他⼈爬⾍是否遵守,Robots 协议不是强制禁⽌访问的技术措施;Robots协议已经成为了⼀种国内外互联⽹⾏业内普遍通⾏、普遍遵守的技术规范;《⾃律公约》并⾮法院可以直接参照适⽤的法律法规或规章,但其反映和体现了⾏业内的公认商业道德和⾏为标准,法院对于《⾃律公约》所体现出的精神予以充分考虑。即,北京市⼀中院并不认为Robots协议是具有法律约束⼒的合同,⽽是将其作为业内普遍遵守的“公认的商业道德”。
nuclear disarmament(⼆)技术措施
如果⾏为⼈通过爬⾍技术侵⼊国家事务、国防建设、尖端科学技术领域的计算机信息系统,可能构成《刑法》第285条第1款规定的⾮法侵⼊计算机信息系统罪,处三年以下有期徒刑或者拘役。其中,为了获取⾏政信息⽽爬取国家机关政务⽹站的,属于“侵⼊国家事务领域的计算机信息系统”。[1]
如果⾏为⼈通过爬⾍技术绕开⽹站设置的⾝份验证、访问频率限制等反爬技术措施,侵⼊国家事务、国防建设、尖端科学技术领域以外的计算机信息系统,抓取其服务器中存储、处理或者传输的数据,情节严重的[2],则可能构成《刑法》第285条第2款规定的⾮法获取计算机信息系统数据罪,处三年以下有期徒刑或者拘役,并处或者单处罚⾦;情节特别严重的,处三年以上七年以下有期徒刑,并处罚⾦。
如果⾏为⼈提供专门⽤于侵⼊、⾮法控制计算机信息系统的爬⾍程序[3],或者明知他⼈实施侵⼊、⾮法控制计算机信息系统的违法犯罪⾏为⽽为其提供爬⾍程序,情节严重的,则可能构成《刑法》第285条第3款规定的提供侵⼊、⾮法控制计算机信息系统程序、⼯具罪。
其中,⽐较值得关注的是“⾮法获取计算机信息系统数据罪”。在司法实践中,⼀般对⾮法获取的形式有两种理解,⼀是对技术措施的突破,⼆是绕开技术措施。如果司法机关⽆法证明⾏为⼈的爬⾍⾏为突破/绕开了技术措施,那么⼀般认为此种犯罪是不成⽴的。此外,⾏为⼈如果绕开的技术措施强度较低(如token数值常年不变),司法机关也⼀般不做犯罪处理。
罪处理。
⽐较典型的是晟品公司、侯某强等⾮法获取计算机信息系统数据案【(2017)京0108刑初2384号】。本案中,被告⼈侯某强等⼈作为晟品公司的员⼯,经过共谋,于2016年⾄2017年间采⽤技术⼿段抓取被害单位北京字节跳动⽹络技术有限公司服务器中存储的视频数据,并由侯某强指使被告⼈郭某破解北京字节跳动⽹络技术有限公司的防抓取措施,使⽤“tt_spider”⽂件实施视频数据抓取⾏为,造成被害单位北京字节跳动⽹络技术有限公司损失技术服务费⼈民币2万元。经鉴定,“tt_spider”⽂件中包含通过头条号视频列表、分类视频列表、相关视频及评论3个接⼝对今⽇头条服务器进⾏数据抓取,并将结果存⼊到数据库中的逻辑。在数据抓取的过程中使⽤伪造device_id绕过服务器的⾝份校验,使⽤伪造
UA及IP绕过服务器的访问频率限制。北京市海淀区⼈民法院认为上述⾏为属于⾮法获取计算机信息系统中存储的数据,情节严重,构成⾮法获取计算机信息系统罪。
此外,在呙某某⾮法获取计算机信息系统数据⼀案中【(2019)鲁0213刑初144号】,被告⼈呙某某⾸先利⽤“SQL注⼊漏洞”获取⽹站的后台管理权限,进⽽利⽤其编写的爬⾍脚本程序侵⼊计算机信息系统,获取计算机系统内存储的、⾮在公开页⾯显⽰的数据。因此,青岛市李沧区⼈民法院认为此⾏为违反《刑法》第⼆百⼋⼗五条规定,构成⾮法获取计算机信息系统数据罪。
三、从爬⾍造成的客观后果看
爬⾍作为⼀种技术⼿段,其天然并不具备违法性,⽽爬取数据的⾏为之所以落⼊法律,尤其是刑法的调整范畴,在于利⽤此技术⼿段的⾏为造成了危害性后果。
⾸先,为了运⾏爬⾍程序,⾏为⼈往往会强⾏突破访问对象设置的反爬技术措施。如⾕⽶公司诉元光公司案【(2017)粤0305刑初153号】,被告元光公司开始⾮法获取原告数据之际破解“酷⽶客”客户端的加密算法没有成功,被告⼈陈某便出⾯聘请其他公司的技术⼈员帮忙将原告APP的加密系统攻破,从⽽得以顺利⾮法获取原告服务器中的⼤量公交车⾏驶实时数据。
其次,⾏为⼈使⽤爬⾍技术也可能导致访问对象长时间⽆法访问,在杨杰明、张国栋破坏计算机信息
系统⼀案中【(2019)粤0305刑初193号】,被告⼈开发⼀款名为“快鸽信贷系统”的软件,该软件内的“⽹络爬⾍”功能能与深圳市居住证⽹站链接,可以在深圳市居住证⽹站上查询到房产地址、房屋编码等对应的资料,该软件对深圳市居住证⽹站访问量能达到每⼩时数⼗万次,以达到为其公司主营业务便捷的⽬的。2018年5⽉2⽇10时⾄5⽉2⽇12时许两⼩时内,该软件对深圳市居住证系统查询访问量为每秒183次,共计查询信息1510140条次并将查询的信息以阿某云⽹络云盘的形式保存,在该时段内造成深圳市居住证系统⽆法正常运作,极⼤地影响了该居住证系统使⽤⽅深圳市公安局⼈⼝管理处的⽇常运作。深圳市南⼭区⼈民法院认为此⾏为违反了《刑法》第⼆百⼋⼗六条的规定,构成破坏计算机信息系统罪。
最后,⾏为⼈通过爬⾍获取第三⽅数据,从⽽削弱了第三⽅的竞争优势,破坏了第三⽅的商业模式。如⼤众点评诉百度案【(2016) 沪73民终242号】、⾕⽶公司诉元光公司案,法院并未认可原告对数据享有直接权利,但认为原被告之间存在竞争关系,且被告将爬取数据直接⽤于其经营的软件运营中,利⽤了原告的劳动成果,属于“搭便车”⾏为。此⾏为将削弱了原告的竞争优势,减少⽤户对原告软件的使⽤,损害原告的合法权益。
fscanf函数的参数四、总结
当前,我国在⽴法上并没有明确界定使⽤爬⾍技术的合法边界, 其对于数据抓取⾏为的规制散见于《刑
自媒体135素材库
法》、《反不正当竞争法》与《⽹络安全法》中,其中不同的法律规范对⾏为规制侧重点也有所不同,《刑法》强调的是对于法益的保护,打击的是具有社会危害性的爬⾍⾏为,即导致个⼈信息泄露、商业秘密公开、计算机系统瘫痪、著作权侵权等不正当数据抓取⾏为将会受到刑法的规制。⽽《反不正当竞争法》对此⾏为的调整也值得关注。在⽆法获得刑法救济的情况下,许多权利⼈会转⽽寻求《反不正当竞争法》的保护。
最后,第⼗三届全国⼈民代表⼤会常务委员会第⼆⼗九次会议于2021年6⽉10⽇通过了《数据安全法》。该法是数据领域的基础性法律,也是国家安全领域的⼀部重要法律。该法第⼋条明确规定,开展数据处理活动,应当遵守法律、法规,尊重社会公德和伦理,遵守商业道德,诚实守信,履⾏数据安全保护义务,承担社会责任,不得危害国家安全、公共利益,不得损害个⼈、组织的合法权益。该法第五⼗⼀条则规定了相应的法律责任,即窃取或者以其他⾮法⽅式获取数据,开展数据处理活动排除、限制竞争,或者损害个⼈、组织合法权益的,依照有关法律、⾏政法规的规定处罚。对于在经营过程需要进⾏⼤量数据抓取⼯作的有关企业⽽⾔,除了建⽴数据分类分级保护、数据安全管理等基本制度外,在数据源获取层⾯需要进⾏更详尽的业务评估与风控管理,以应对《数据安全法》出台后的监管要求。
[1] 案例参考:(2018)川3424刑初169号
爬虫软件 app[2] 《最⾼法最⾼检关于办理危害计算机系统安全刑事案件应⽤法律若⼲问题的解释》第1条对于“情节严重”进⾏了解释。
释。
flash播放器官方免费下载[3] 《最⾼法最⾼检关于办理危害计算机系统安全刑事案件应⽤法律若⼲问题的解释》第2条对“专门⽤于侵⼊、⾮法控制计算机信息系统的程序、⼯具”进⾏了解释

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。