THF. CHINKSK PHOCI KATORS
案说检察|责任编辑:陈冰I
应对“网络爬虫”刑事犯罪的新路径探索
—覃某某等十二人侵犯著作权案
••李慧7文
摘要:在数字经济时代,网络侵犯知识产权类犯罪对刑事司法提出的挑战不仅在于犯罪手段的日渐新型化、科 技化、隐蔽化,更在于检察机关在借力专业机制、专业技术/专业平台辅助办案上能否做好充足的应对。以北京 市最大利用爬虫技术侵犯著作权案为例,在办案过程中探索确立了捕诉一体化背景下,集全程引导、多维鉴定、灵活调证、立体庭审于一体,以发挥检察主导作用、认罪认罚落实落地、综合治理能力提升为内核的专业化案件 办理新模式,并在破解电子证据取证难题、突破传统侵权认定方式等方面提供一些新视角、新经验,:
关键词:爬虫技术侵犯著作权罪单位犯罪
一、基本案情
被告单位北京鼎阅文学信息技术有限公司。
被告人覃某某,案发前系北京鼎阅文学信息技术 有限公司实际控制人兼股东。
被告人柯某,案发前系北京鼎阅文学信息技术有 限公司股东.:
被告人刘某,案发前系北京鼎阅文学信息技术有 限公司法定代表人兼股东.:
被告人陈某,案发前系北京鼎阅文学信息技术有 限公司副总裁。
被告人王某,案发前系北京鼎阅文学信息技术有 限公司技术总监。
被告人吕某,案发前系北京鼎阅文学信息技术有 限公司技术总监。
被告人武某,案发前系北京鼎阅文学信息技术有 限公司产品总监。
被告人许某某,案发前系北京鼎阅文学信息技术 有限公司产品经理。
被告人刘某某,案发前系北京鼎阅文学信息技术 有限公司内容组组长。
*北京市海淀区人民检察院一级检察官[100089 ]
被告人陈某一,案发前系北京鼎阅文学信息技术 有限公司内容组成员
被告人王某某,案发前系北京鼎阅文学信息技术 有限公司内容组成员
被告人梁某某,案发前系北京鼎阅文学信息技术 有限公司内容组成员c
自2016年,被告人覃某某、柯某、刘某共同商议 成立北京鼎阅文学信息技术有限公司及关联公司(以下简称鼎阅集团)。其中,被告人覃某某负责鼎阅集团 的全面运营及管理;被告人柯某负责传媒管理和技术 开发支持;被告人刘某负责内容管理;被告人陈某负 责法务、市场等职能管理;被告人王某、吕某负责技 术管理;被告人武某负责产品管理;被告人许某某负 责布置内容需求;被告人刘某某负责并指挥被告人陈 某一、王某某、梁某某实施内容爬取。
被告单位鼎阅集团自2018年开始,在被告人覃某 某等12名被告人负责管理或参与运营下,未经掌阅科 技股份有限公司、北京幻想纵横网络技术有限公司等 权利公司许可,利用内容爬取等信息网络技术,爬取 正版电子图书后,在其推广运营的“鸿雁传书”“TXT
2021/02H(经典案例1
案说检察
I责任编a陈冰
全本免费小说”等10余个A P P平台上展现,供他人访 问并下栽阅读,通过广告收入、付费阅读等方式进行 牟利经查明,涉案作品侵犯掌阅科技股份有限公司、北京幻想纵横网络技术有限公司享有独家信息网络传 播权的文字作品共计部其中,章节数目及内容 川()%相同的有3167部,具有相同内容的侵权章节比例 在90%不到100%的1087部,具有相同内容的侵权章 节比例80%以上不到9(1%的161部
被告单位鼎阅集团自2018年成立以来,在被告人 覃某某等12名被告人负责管理或参与运营下,未经 中文在线数字出版集团股份有限公司许可,利用内容 爬取等信息网络技术,爬取正版电子图书后,在其推 广运营的"鸿雁传书”A P P平台上展现,供他人访问 并下栽阅读,通过广告收入、付费阅读等方式进行牟 利,经查明,涉案作品侵犯中文在线数字出版集团股 份有限公司享有独家信息网络传播权的文字作品共计 469部其中,章节数目及内容1<)0%相同的有17部,具有相同内容的侵权章节比例在90%不到100%的257 部,具有相同内容的侵权章节比例8(1%以上不到90%的59部,具有相同内容的侵权章节比例在70%以上不 到80%的44部。
被告人覃某某、柯某、刘某、陈某、王某、吕某、武某、许某某、刘某某、陈某一、王某某、梁某某于 2019年3月25日被公安机关抓获,到案后被告人均如 实供述了上述犯罪事实
2⑴9年6月27日北京市公安局海淀分局(以下简 称海淀分局)以犯罪嫌疑人覃某某、柯某、刘某、陈某、王某、吕某、武某、许某某、刘某某、陈某一、王某某、梁某某涉嫌侵犯著作权罪移送北京市海淀区 人民检察院(以下简称海淀检察院)审查起诉。202(1 年1月H)日,海淀检察院以被告单位北京鼎阅文学信 息技术有限公司、被告人覃某某、柯某、刘某、陈某、王某、吕某、武某、许某某、刘某某、陈某一、王某 某、梁某某犯侵犯著作权罪,向北京市海淀区人民法 院(以下简称海淀法院)提起公诉,并于2020年4月20日向海淀法院追加起诉.2020年川月20日,海淀
THKI:HI、KSK PRIK:丨|中^■么宰•‘客'23
法院对木案依法公开开庭审理,并于20211年12月31
曰作出一审判决如下:被告单位北京鼎阅文学信息技
术有限公司犯侵犯著作权罪,判处罚金人民币150万
元;被告人覃某某犯侵犯著作权罪,判处有期徒刑3 年,罚金人民币80万元;被告人柯某犯侵犯著作权罪,
判处有期徒刑3年,罚金人民币3()万元;被告人刘某
犯侵犯著作权罪,判处有期徒刑3年,罚金人民币丨
万元;被告人王某犯侵犯著作权罪,判处有期徒刑3 年,罚金人民币20万元;被告人陈某犯侵犯著作权罪,
判处有期徒刑1年1(>个月,罚金人民币15万元;被
告人吕某犯侵犯著作权罪,判处有期徒刑1年10个月,
process on登录罚金人民币15万元;被告人武某犯侵犯著作权罪,判
处有期徒刑1年10个月,罚金人民币15万元;被告
人许某某犯侵犯著作权罪,判处有期徒刑1年10个月,
罚金人民币15万元;被告人刘某某犯侵犯著作权罪,
判处有期徒刑1年10个月,罚金人民币15万元;被告简明pyhton教程 pdf
人陈某一犯侵犯著作权罪,判处有期徒刑1年(S个月,
缓刑2年,罚金人民币8万元;被告人梁某某犯侵犯
著作权罪,判处有期徒刑1年6个月,缓刑2年,罚
金人民币5万元;被告人王某某犯侵犯著作权罪,判
处有期徒刑1年3个月,缓刑1年6个月,罚金人民
币3万元判决宣告后,被告单位和被告人均未提出
上诉,该判决已生效。
二、构筑“全程引导”模式,提升侦查取证质量
为解决新型网络著作权案件取证难、成案率低等
问题,检察官充分发挥捕诉一体专业化优势,全程引
导侦查取证,传导庭审证明标准,定期组织专案沟通,
准确论证行为定性:
在捕前介人阶段,与治安、网安、法制、派出所
召开多次联席会议,在注重分类引导,逐项引导,常
态反馈的对接模式下进一步厘清犯罪脉络,向公安机
关传导取证思路、规范调证程序,指明侦查方向,固 .定关键证据在审查逮捕阶段,检察官充分发挥捕诉
一体化优势,引导公安机关有针对性取证,与鉴定及
审计部门及时沟通,借助外力补强技术短板,逐步攻
克取证难点,夯实核心证据基础在审查起诉阶段,
2021/02H(经典案例丨
中蜀趋备嘗THF. CHINKSE PHOCURATORS案说检察|
责任编辑.陈冰I
积极联络多家权利公司,组织梳理海量权属材料,追 加主要犯罪事实,形成完整证据闭环9最终打通从侵 权书籍内容调取到“爬虫”侵权模式认定再到侵权行 为有力指控的全链条,高质量完成了对90名犯罪嫌疑 人的审查逮捕、12名被告人的审查起诉工作。
(一)重视电子证据调取,科学确立引导方向
一是确立“从源头锁定数量,全面固定电子证据”的引导思路。该案系一起利用爬虫技术非法获利的高 科技犯罪,亦是一起侵权著作权的知识产权类犯罪,电子证据的调取与固定是本案取证的重中之重。鉴于 本案具有涉案书籍数目庞大,涉及权利公司众多、侵 权公司关系交错、侵权APP种类繁杂,侵权时间周期 较长、合法非法作品混杂等显著特点,且在案发前嫌 疑人多次对侵权书籍进行了违法删除下架,这为合理 追踪涉案书籍来源及确定侵权数目带来极大难度。针 对上述情况,检察官及时引导公安机关从存储侵权图 书的阿里云服务器上,根据提供的浏览器及下载权限,下载镜像文件并计算哈希值后保存固定至硬盘内,交 由北京网络行业协会电子数据鉴定中心(以下简称电 子数据鉴定中心)进行相关鉴定。该份电子数据的及 时固定构筑了全案办理的坚固基石。
二是确立“分类调取,逐项固定,完整追踪”的 引导方案。一方面,针对涉案侵权书籍的来源,在捕 前对阿里云服务器镜像数据固定的基础上,引导公安 机关前往被查封的鼎阅集团办公场所,通过电脑数据 查询平台导出案发前平台统计数据源中的书籍信息、点击量、APP信息及外网地址源等文件,并由电子数 据司法鉴定中心对侵权书籍的点击情况进行梳理比对,进而确定涉案图书实际被点击阅读的数量。以上调证 均系由公安机关依法定程序独立完成,确保了检材来 源、委托主体的合法性。另一方面,对涉案人员电脑 进行现场勘验。“如在利用‘爬虫’软件抓取权利人文 字作品类型的案件中,‘爬虫’软件的技术原理、抓取 过程等需重点关注,审查该技术实施过程是否具有破 坏性,是否利用了 ‘爬
inputstream源码解析
虫’软件临时复制他人作品并 缓存在服务器中。” [11检察官引导公安机关从鼎阅集团APP代码所在服务器中提取APP代码;从嫌疑人许
某某笔记本电脑中提取数据流书单、数据流产品需求、
爬虫软件及抓取结果;从公司财务数据所在服务器提
取鼎阅财务数据。以上三份勘验为后续确定嫌疑人客
观行为及分T情况,审计鼎阅集团获利及人员分红情
况提供了重要的前提保障。
(二)精准审查嫌疑人责任,充分注重引导效果
1. 确立差异化分类、主次分明、逐人逐事的审查原 则。该案于2019年4月23日移送海淀检察院审查逮捕,
爬虫软件 app涉案嫌疑人多达90名,包含鼎阅集团内部各层级员工。
为实现精准有力打击,锁定嫌疑人追究范围,在审查逮
捕阶段,检察官积极发挥主导作用,引导公安机关及自
行调取了法务总监、推广部经理、产品经理、大数据负
责人等关键证人证言,调取了钉钉聊天记录、聊天
记录等相关书证,结合同案犯供述及审计报告中体现的
获利情况对逐个嫌疑人均进行综合性评价,充分证实上
述人员在严密组织、分工协作的背景下,通过爬虫技术
获取他人权利作品、上传至自营APP平台非法牟利的
主观故意及行为。通过分析研判鼎阅集团公司框架、不
同层级员工职责范围,涉案人员主观明知程度、准确充
数据结构malloc是什么意思分论证行为定性,最终确定追究主管领导及直接技术人
员的刑事责任,高质量完成了对上述嫌犯的审查逮捕1:
作,其中对直接实施爬取行为但地位层级较低员工以无
逮捕必要作出不批准逮捕决定;对参与时间十分短暂、
主观明知程度不高、未开展实际侵权行为的员工以证据
不足作出不批准逮捕决定,充分体现了刑法谦抑性原
则,为审查起诉工作打下坚实基础。
2. 按照地位、层级、作用,明确单位犯罪主管人 员及直接责任人员,并区分主从犯。据刑法对单位犯
罪的规定,“‘直接负责的主管人员’与‘其他直接责
任人员’承担刑事责任的基础是不同的。‘其他直接责
任人员’承担刑事责任,是因为直接参与了实施犯罪构
成要件的行为,而‘直接负责的主管人员’承担刑事责
任,是因为所具有的职责与犯罪的实施之间具有因果关
系,也即直接负责的主管人员负有监督其他责任人员
保证其依法行为的义务。” [2]某种程度上来讲,“应该
2021/02 H(经典案例)
案说检察
i责任编辑陈冰
作为直接负责的主管人员处罚的,指鼓励、纵容或者支 持部下实施犯罪行为的上级管理人员,也包含组织、指 挥或者决定实施犯罪行为的上级管理人员”[3]
3.围绕核实不同层级人员在整个犯罪活动中发挥作 用的大小,制订个性化侦查引导方案,引导公安机关对 重点人员、可疑人员、关键证人针对性取证。犯罪嫌疑 人覃某某、柯某、刘某、陈某是鼎阅集团的高层管理人 员,虽然分管职责不同,但在整个侵权犯罪活动中都起 到了关键性作用,故认定为单位犯罪直接负责的主管人 员。结合其他人员的主观明知程度及客观行为,宜认定 为其他直接责任人员。
其中,王某作为技术负责人一直 领导内容组爬取文字作品的T.作;吕某担任技术总监期 间负责侵权APP维护运营,对于鼎阅集团侵犯著作权 有较多的帮助行为;武某系产品总监,负责侵权APP 的前端产品T作并实施了紧急下架侵权图书逃避刑事责 任的客观行为;许某某曾系鼎阅集团产品经理,负责爬 取数据、产品分析、布置爬取任务;刘某某系爬虫组 组长,陈某一、梁某某、王某某均是爬虫组成员,该四 人负责爬取书籍,为后续实现APP信息网络传播及广 告牟利提供了内容前提在充分考虑上述嫌疑人地位作 用、参与公司侵权事宜、整体运营程度大小等方面,将 嫌疑人覃某某、柯某、刘某、陈某、王某认定为主犯,将其他人员认定为从犯。
三、创新“多维鉴定”思路,破解专业技术难题
“网络爬虫(W eh Crawler)(简称爬虫),也被称 为网络蜘蛛、蜘蛛爬虫(W eh Spider)或网络机器人 (W eh Roh(>l ),是互联网时代一项运用非常普遍的网络 信息搜索技术。爬虫技术的本质是一套实现高效下载 的系统,通过遍历网络内容,按照指定规则提取所需 的网页数据,并下载到本地形成互联网网页镜像备份 的程序。”+由此可见,“爬虫技术就是一个高效的下 载系统,能够将海量的网页数据传送到本地,在本地形 成互联网网页的镜像备份。” 151换言之,即是一种按照 一定的规则自动抓取互联网信息的程序或者脚本:鼎阅集团通过爬虫、A F>I等信息网络技术,爬取 5000余部正版电子图书,并通过创设及优化APP等
T H K(:H IN KSK PR<)(:rK ATORS 中舄抬寮霄 25
多种形式,将获取的图书资源在10余个APP平台上 展示并供他人访问阅读,其中通过植入广告、广告变 现、收费阅读等方式进行牟利。根据2008年《最高人 民检察院、公安部关于公安机关管辖的刑事案件立案 追诉标准的规定(一)》第26条规定,通过信息网络 向公众传播他人文字作品、音乐、电影、电视、录像 作品、计算机软件及其他作品,或者通过信息网络传 播他人制作的录音录像制品的行为,应当视为本条规 定的“复制发行”。由此,鼎阅集团的爬取行为系在未 获取掌阅科技股份有限公司等权利公司许可的情况下. 对他人权利作品的著作权侵犯,该复制发行行为已构 成侵犯著作权罪。
本案中电子数据提取是整个案件办理的牢固基石,而技术鉴定则是整个案件的核心框架对侵权APP软 件、侵权作品内容、复制传播原理等方面的系统性鉴 定,是侦查突破的难点,也是审查办理的重中之重。为充分了解“爬虫技术”这一新型侵犯著作权手段,检察官借助外脑力量询问领域内技术专家并要求网络 安全部门对爬取原理进行了全面解析;为充分核实侵 权书籍的存储来源、是否被实际传播、与正品书籍是 否具有同一性以及侵权APP与阿里云服务器是否数据 关联等方面,检察官引导公安机关逐阶段逐步骤开展 一系列鉴定工作,并与鉴定机构积极沟通,详细了解 鉴定意见作出的依据、采取的方法,在基础上创造性 确立了“多维”鉴定思路,构筑严密证据体系。
据对“鸿雁传书”等3个APP的路径鉴定,证明 侵权A P P上展现的涉案作品来自于鼎阅集团后台服务 器数据库;据电子数据司法鉴定中心出具的阿里云服 务器内容鉴定,证明涉案侵权图书的数量及来源;据 电子数据司法鉴定中心出具的作品点击量鉴定,证明 涉案侵权图书均被实际点击和阅读;据中国版
权保护 中心及国丁.信安司鉴所出具的异同性鉴定,证明取证 作品与对应“权利作品”存在相同内容;据对“鸿雁 传书”APP的功能性鉴定,证明涉案APP具有在线阅 读和搜索图书的功能;据电子数据司法鉴定中心出具 的“全本追书阅读器”等10个涉案APP的鉴定,证
2021/020 (经典案例}
中I T H K I:HI、KSK™II:1IIATIIKS案说检察
责任编辑陈冰I
明具有展现广告功能;据北京国盾信息中心司法鉴定 所对涉案人员手机、电脑的鉴定,从中提取的钉钉记 录及聊天记录,充分体现爬虫组刘某某、陈某一、王 某某、梁某某等人的分工情况、技术人员王某、武某 的地位及作用,案发前紧急下架侵权图书的客观行为 以上鉴定T.作均在公安机关委托下开展,鉴定结果均 依法定程序告知嫌疑人:通过扎实全面的多维度鉴定,上述证据充分证实鼎阅集团系在嫌疑人覃某某等人的 授意下,利用爬虫技术抓取网络中正版文字作品,经 技术处理后上传存放于公司阿里云服务器,并以创设 的多个APP软件为载体,辅以植入广告、收费阅读等 模式非法获利的犯罪事实_
综上,从侵权图书的爬取上架、云服务器存储再 到实际被点击阅读;从APP的研发运维、内容获取,
阅读实现、广告嫁接,再到与权利作品的异同性比对; 从技术内部分工协作爬取、有组织有规模的集团犯罪 再到逃避法律的紧急下架灭失证据,每一链条中的每 一环节都决定了案件办理的整体走向为集中力量突破办案瓶颈,实现化繁为简有的放矢,检察官确立了 “多维鉴定”思路,即涵盖作品内容异同性鉴定、侵 权APP功能性鉴定,广告展现功能鉴定,内容获取路 径鉴定,手机及电脑数据提取鉴定在内的全方位鉴定,不仅从根源上确立了法律框架下爬虫技术的侵权模式,也尝试性突破了技术维度下的法律认知局限。
四、关注网络作品属性,审慎确定侵权数量
本案被侵权公司众多,电子作品数量庞大,授权 文件繁杂,为核实确定侵权作品数量带来极大难度,为此检察官多次前往权利公司自行取证,倾听权利公 司诉求,引导权利公司按照科学合理规范的方式提供 配套侵权证明文件,出具被侵权作品总数、明细及详 细权属证明材料。经前期充分调证,在从阿里云服务 器提取的镜像文件中,经核实授权资料、著作权声明 等相关材料后,确定初步侵权书籍数量并与鼎阅集团 内部点击量数据逐一比对,结合同异性鉴定结果,最 终确定在侵权APP上实际被点击阅读的作品数量,确保了侵权数据认定更加真实客观。
检察官创新确立了“按步骤、按公司、按比例”的认定方法。由于网络电子书籍与实体纸质图书具有 不同的属性,其发布的路径和形式具有极大灵活性、便捷性和实时共享性,并不是必须整部同时发布,
恶搞代码教程绝 大多数系分章节、有进度地发布,随时或定期更新, 逐章或逐节推进供读者阅读下载,这必然会导致书籍 爬取部分占正品书籍内容比例的问题,本案中基于权 利作品的发布进度及行为人抓取的时间不同,侵权 APP爬取到的作品章节比例也不一样,存在部分没有 抓取权利作品全部章节,抓取章节比例不到100%.的情 况为全面审慎确定书籍数量,检察官在要求公安机 关委托鉴定的过程中,按照比例区段的方式确定不同 爬取比例的书籍:据鉴定结果显示,大部分侵权作品 的抓取章节比例都在80%以上,有三千余部作品系被 100%爬取,有四千余部爬取比例在90%以上,经过 实质性审查,发现即便存在略微差距的作品,所爬取 的章节内容与对应的正版作品章节内容相同度仍然是 100%,不同之处主要因连载更新时间节点等问题导致,并不影响刑法意义上盗版作品与被侵权作品实质性相 同的性质认定,仍然符合侵犯著作权犯罪中“情节特 别严重”的标准。
笔者认为,基于网络电子书自身发行的特点,权 利作品在网络平台上传、发布、营销模式与进度直接 相关,在异同性鉴定中要充分注意到电子书籍的特殊 属性,按照区段准确区分不同作品的爬取比例,进而 为科学认定侵权作品数量提供真实客观基础。“网上传 播的结果并非作品有形载体物理空间的变更,而是在 新的有形载体上产生了作品复制件,导致复制件数量 的绝对增加。”6需要说明的是,电子书的被侵权作 品数量并不等同于相关司法解释中规定的复制品数量,不能简单地将正版电子书的部数与传统纸质盗版图书 的册数做等量计算,但被侵权作品的数量可以作为评 价侵权犯罪行为情节及侵权作品数量的重要参考标准:
五、确立“灵活调证”策略,切实优化办案质效
第一,根据我国刑法及司法解释相关规定,侵犯 著作权罪既是数额犯又是情节犯。据刑法第217条的
2021/02(3 (经典案例1

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。