我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
2015年,被告人肖某开发了一款免费看小说 APP,为了牟利,肖某从腾讯广告联盟下载广告包并插入该 APP 应用程序,用户在通过该 APP 阅读小说时点击其中的广告,广告联盟会自动以点击量计算广告推广费。之后肖某注册成立“某网络技术工作室”公司,并以公司名义将 APP 陆续上架到应用商城。为通过著作权资质的审查,肖某伪造相应作品转让授权证明上传至各应用商城。
2019年,肖某成立公司开发“悦读免费小说”手机 APP 软件并上架,提供网络小说在线阅读服务。后为获取更多利益,肖某将网络爬虫程序植入 APP 应用中,自动爬取互联网上各小说网站的网页链接、小说名称、小说作者、小说简介、小说图片等信息,并分类存放于腾讯云服务器当中,且不间断更新爬取内容。用户在 APP 中搜索或点击相关信息后,APP 将自动爬取到的小说信息提取出来,发送并缓存在上述服务器中,再通过第三方网页重新排版,并插入广告公司提供的广告供用户阅读。
腾讯公司每月根据该程序中的点击量按每次单价 0.2 元至 1 元不等的价格结算广告推广费,费用转到长沙畅想网络技术工作室的银行账户。为了规避风险,肖某分别于2020年5月26日、7月17日以其父亲肖某、母亲王某的身份注册上海昶悠网络技术工作室和上海毓璃网络技术工作室,并用该两个公司的对公银行账户接收腾讯公司结算的广告推广费用。
2021年6月,北京腾飞克科技有限公司发现“悦读免费小说” APP 在未经其许可的情况下,大量非法复制了该公司享有著作权的作品。经广东甄明司法鉴定所鉴定:固定至“悦读免费小说” APP 中 576 部小说作品与永丰舸渡网络科技有限公司提供的拥有著作权的小说作品具有相同名称,其中 551 部小说作品相似度大于70%。
公诉机关变更起诉为:经广东甄明司法鉴定所于2022年2月25日鉴定,固定到“悦读免费小说” APK 文件并通过程序获得“悦读免费小说侵权书单.xlsx”同名小说 4547 本,经检验,与版权方提供的版权小说相似度大于70%的共计 3968 本。上述相似度大于70%的小说合计 4519 本。
2020年1月至2021年8月期间,长沙畅想网络技术工作室广告收益 9167638.55 元,上海毓璃网络技术工作室广告收益 10863914.2 元,上海昶悠网络技术工作室广告收益 286828.46 元。肖某共获取广告推广费 2000 余万元。
《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》第三条规定“网络用户、网络服务提供者未经许可,通过信息网络提供权利人享有信息网络传播权的作品、表演、录音录像制品,除法律、行政法规另有规定外,人民法院应当认定其构成侵害信息网络传播权行为。通过上传到网络服务器、设置共享文件或者利用文件分享软件等方式,将作品、表演、录音录像制品置于信息网络中,使公众能够在个人选定的时间和地点以下载、浏览或者其他方式获得的,人民法院应当认定其实施了前款规定的提供行为”。
本案中被告人肖某开发的“悦读免费小说” APP 中设置了爬虫程序从其他网站扒取小说书名、封面、网站链接等,并把小说链接、小说简介、小说名字等信息存储到其服务器里,并且进行了增减、排版和过滤,插入广告,读者可以六种方式通过“阅读免费小说” APP 进行阅读,其中“立即阅读”模式读者可以在该 APP 页面直接阅读小说,“全书缓存”模式可以下载小说供读者在选定的时间和地点阅读,“悦读免费小说”中扒取的小说均未经过著作权或其授权人的许可,侵害了著作权权利人的信息网络传播权。
被告人肖某辩护其服务器中并未存储小说,但存储了小说链接、小说简介、小说名字,虽然“悦读免费小说” APP 中确实有链接服务,但是其提供的不是普通链接服务,用户点击后并不直接跳转到第三方网页首页,而是直接在该 APP 中显示相关页面,被告人亦供述“悦读免费小说” APP 默认是全屏阅读,读者都是在 APP 的界面中进行阅读,在全屏阅读时分辨不出在哪个网站进行观看小说的,因为软件自动进行了转码阅读,只有读者自己退出全屏阅读点击菜单才能看到是在哪个网站看到的,也就是说读者完全感觉是在“悦读免费小说” APP 中进行阅读,而不是在其他网站进行阅读,故应当认定属于复制发行和传播行为。“悦读免费小说” APP 中扒取的小说经司法鉴定与被害人北京腾飞克科技有限公司享有著作权包括信息网络传播权的小说相似度大于70%的有 4519 部,因此被告人的行为构成侵犯著作权权利人信息网络传播权的行为。
法院认为,被告人肖俊以营利为目的,未经著作权权利人许可,擅自在其开发的“悦读免费小说” APP 中复制发行他人享有著作权权利的文字作品,其行为构成侵犯著作权罪。被告人肖俊非-法-经营数额达 2000 余万元,非法复制发行他人作品的数量众多,属于情节特别严重,依法应在三年以上十年以下有期徒刑幅度内量刑,并处罚金。
2021年12月24日,永丰县人民检察院以肖某犯侵犯著作权罪提起公诉。2022年8月15日,法院作出一审判决,以犯侵犯著作权罪,判处肖某有期徒刑五年,并处相应罚金。肖某不服判决,提出上诉。2022年10月25日,中级人民法院裁定驳回上诉,维持原判。
被告人肖某犯侵犯著作权罪,判处有期徒刑五年,并处罚金人民币 100 万元;
追缴被告人肖某违法所得 20318381.21 元及其产生的收益,上缴国库;。
没收扣押在案的作案工具苹果 macbookpro 电脑一台。
(2022)赣0825刑初2号
根据案情介绍,肖某通过网络爬虫技术爬取电子小说信息,为用户提供直接阅读、下载功能,使公众可以在选定的时间和地点阅读,符合信息网络传播行为的实质性要件,侵犯了权利人的信息网络传播权,并依此获取了巨额的利益,这种行为明显是触犯了法律法规的。这种小说侵犯著作权案屡见不鲜,早在2011年,盛大文学就告了“小说5200”网站的侵权行为,后者的相关负责人最终也都被判刑了。在网络上爬取喜欢的小说,供自己或朋友阅读,见仁见智,但是切莫大量的爬取小说、文章等,然后借此获利,这是缺乏道德,且违反法律的行为。
通过爬虫侵犯著作权来获取作品并以盈利的方式使用,将著作权人的劳动成果无偿占为己有,对著作权人造成经济损失。同时,这种行为也扭曲了正常的市场竞争,给那些合法获得授权并按照规定使用作品的人带来不公平的竞争环境。一旦大众缺乏版权意识,都抱着白嫖的心理,使得盗版抄袭行为猖獗,形成一种恶性的市场环境,必然会打击原创者的积极性,好的作品将会越来越少。
随着网络技术的发展,通过信息网络向公众提供作品的获利方式不再局限于收取会员注册费或者作品下载费、阅读费等直接、传统的收益方式,而是逐渐转向收取第三方高额广告费等间接方式,利用海量用户在使用软件时的巨大广告点击量牟取暴利。这不失为一种好的策略,但切记提供的产品一定不能是侵权所得,不然获利再多,也迟早有吐出来的那一天,谁都想赚钱,不过一定要通过合法合规的渠道。
还是老话长谈,技术本身是无罪的,但谨记不要利用技术来实施可能违法犯罪的行为。不要心怀侥幸,若一直游走于刀尖,出事是迟早的事情,一定不要为一时的利益蒙蔽了双眼。在此劝谏各位爬虫工程师们,切莫触碰灰黑地带,越过了法律的红线!