要过年了,中国爬虫违法违规案例汇总!不要被钱财蒙蔽你的双眼

最近的爬虫真的有点火哦,博客上总有网友私信我,希望我能帮忙爬取一些数据。我思来想去,作为一个小小的博客主,何德何能得到这么多命运的垂青,于是就扒了扒自己以前写过的文章,发现都是因为我之前写的一篇爬取某程民宿数据的博客惹的祸。对于朋友们的请求,我本来想一口答应的,后面发现,这块还真的是个法律雷区。而我在全球最大同性交友网站交流的时候,也发现了一个关于爬虫违法案例汇总的项目,特来分享给有志于从事爬虫事业的小伙伴们。一定要避坑哦。

一、中国大陆爬虫开发者涉诉与违规项目介绍

项目地址:https://github.com/HiddenStrawberry/Crawler_Illegal_Cases_In_China

作者给项目起了一个很骚气的名字Collection of China illegal cases about web crawler,该项目用来整理所有中国大陆爬虫开发者涉诉与违规相关的新闻、资料与法律法规。致力于帮助在中国大陆工作的爬虫行业从业者了解我国相关法律,避免触碰数据合规红线。

截止到今天,项目的star数为742,还挺活跃的,看来大家也都对这个很关注。

要过年了,中国爬虫违法违规案例汇总!不要被钱财蒙蔽你的双眼_第1张图片

二、违法违规案例汇总

违法违规案例共分为四大模块,下面我一一来进行介绍:

这部分很重要,都是违法实例,里面的情节跟故事会一样,跌宕起伏,我研究了很久,建议大家详细研读,各种违法违规手段层出不穷,有些都是我们平时感觉没什么事的情况,但其实也是红线。共整理了9个案例,还分成了四类出来。

爬虫禁区1:为违法违规组织提供爬虫相关服务(验证码识别服务贩卖、SEO……)

这种比较坑,经常有小伙伴问我,我能不能爬某某数据,我们经理安排我爬的,经理说这个没问题。对于这种情况,请坚决说NO,并请你的上级好好去读一下相关法律法规,而且,这种情况出了事,老板反而可能是最没责任的,而你们爬虫程序员,我只能说呵呵。

  • CASE1:知乎某极验破解者自述被抓(已删除)
  • CASE2:“快啊答题”AI破解验证码服务开发者被判刑
  • CASE9:永嘉警方揪出“黑”百度黑客团伙 干扰搜索引擎牟利超七千万元

爬虫禁区2:个人隐私数据抓取与贩卖

这个最严重,曾经有朋友让我帮忙爬取公安系统的个人数据,还说他们的项目是公安局的项目,没事的,公安局那边都同意了,吓得我赶紧把这哥们的微信都删了,也不知道他现在过的怎么样,唉,甚是想念啊!

  • CASE3:简历大数据公司“巧达科技”被一锅端
  • CASE4:社保掌上通被下架 用户的信息很容易泄露太不安全了
  • CASE5:爬虫为何受关注?业内:大数据服务商或因合作方涉套路贷犯罪而被牵连

忠告一句,国家特别关注个人隐私的数据泄露问题,抓到了,就是大事情。

爬虫禁区3:利用无版权的商业数据获利

这种情况,也是很严重的,爬取商业竞争对手的数据,并进行商用,车来了这个事件,老板被罚款,程序员一审进去了。你看看到底谁吃亏?从这个事情就能看出资本家的本质。

  • CASE6:“车来了”涉嫌偷数据被警方立案
  • CASE8:裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权

有朋友问我,某网站的音乐不错,某网站的视频不错,我能不能爬下来放到我个人的小站上供亲戚朋友使用,其实这也是不行的。如果对方追究,也是痴不了兜着走。

爬虫禁区4:爬取未经授权的资源

从上家公司离职了,千万不要因为对上家公司的系统比较熟悉,而非法获取数据,数据都是很敏感的,下面这个就是如此。

  • CASE7:头疼大战前传:头条前高管反噬被判刑

三、相关法律法规介绍

下面的法律法规为必读必会内容,一定请重视!

非法获取计算机系统数据罪

根据《中华人民共和国刑法》第二百八十五条规定,非法获取计算机信息系统数据、非法控制计算机信息系统罪,是指违反国家规定,侵入国家事务、国防建设、尖端科学技术领域以外的计算机信息系统或者采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据,情节严重的行为。刑法第285条第2款明确规定,犯本罪的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。

非法侵入计算机信息系统罪

《刑法》第二百八十六条还规定,违反国家规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,后果严重的,构成犯罪,处五年以下有期徒刑或者拘役;后果特别严重的,处五年以上有期徒刑。而违反国家规定,对计算机信息系统中存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作,后果严重的,也构成犯罪,依照前款的规定处罚。

侵犯公民个人信息罪

《刑法》修正案(九)中将刑法第二百五十三条进行了修订,明确规定违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,构成犯罪;在未经用户许可的情况下,非法获取用户的个人信息,情节严重的也将构成“侵犯公民个人信息罪”。 根据《最高人民法院 最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第五条规定,对“情节严重”的解释,(1)非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上的;(2)非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上的;(3)非法获取、出售或者提供第三项、第四项规定以外的公民个人信息五千条以上的便构成“侵犯公民个人信息罪”所要求的“情节严重”。

侵犯商业秘密罪

《反不正当竞争法》第九条,以不正当手段获取他人商业秘密的行为即已经构成侵犯商业秘密。而后续如果进一步利用,或者公开该等信息,则构成对他人商业秘密的披露和使用,同样构成对权利人的商业秘密的侵犯。

网络安全法

《网络安全法》第四十四条 任何个人和组织不得窃取或者以其他非法方式获取个人信息。因此,如果爬虫在未经用户同意的情况下大量抓取用户的个人信息,则有可能构成非法收集个人信息的违法行为。

民法总则

《民法总则》第111条任何组织和个人需要获取他人个人信息的,应当依法取得并确保信息安全。不得非法收集、使用、加工、传输他人个人信息

这些都要熟记于心,心中时刻有个高压线,一定不能去触碰,不然持久的注定是自己。

四、专业律师发表的相关观点

现在国内对IT方向诉讼比较精通的律师不多,下面请看知名律师的解读。

周 浩:利用网络爬虫获取数据的刑事责任分析

金 杜:数据之争:网络爬虫涉及的法律问题

核心无非是这么几个:

  1. 你用爬虫有没有获利,不同的金额有不同的判罚档位
  2. 你利用爬虫获取了多少数据,不同的数量有不同的档位
  3. 你是具体的执行者,那你和你的领导如何定责,可以很负责任地告诉你,你占大头,老板罚点钱
  4. 你用获取的数据做了什么,有没有泄露给其他人,如果有,那你的麻烦大了。

最后告诫大家,能赚钱的事情都写在法律里面,有些事情真的不能碰啊不能碰。


我的微信公众号:架构真经(id:gentoo666),分享Java干货,高并发编程,热门技术教程,微服务及分布式技术,架构设计,区块链技术,人工智能,大数据,Java面试题,以及前沿热门资讯等。每日更新哦!

你可能感兴趣的:(爬虫)