python开源爬虫项目违法吗_爬虫究竟是合法还是违法的?

法律没有对爬虫行为有司法解释,从已有判决案例来看主要是看你数据用途/是否有商业竞争/商业侵权/扰乱破坏对方软件正常经营,而且必须是对方有证据来举证你。

现在已有案例对爬虫的判决依据是《刑法》第285条,非法获取计算机信息系统罪;第286条,破坏计算机信息系统罪;《网络安全法》倒卖隐私数据,如果你抓取隐私数据进行倒卖的话;等几条。

先定义一下爬虫行为,爬虫技术不只是用来抓取网络数据,爬虫技术本质上是模拟网络请求。所以广义的爬虫技术可以用来做:抓取网页/APP数据,刷票/耍点击,抢票(火车票,医院挂号等),自动加好友等等事情。

下面来看看已有司法判决的几个典型案例:

1.今日头条离职员工抓取今日头条视频

从判决文书网上描述来看,修改UA,device_id等行为,我想大部分爬虫程序员都会干这个。但是被告是今日头条的离职员工,这就比较敏感,上海晟品也在做视频业务,这就涉及直接商业竞争。

2.脉脉非法使用微博用户信息

脉脉抓取微博用户头像等账户信息,显示在脉脉APP里面,这是不正当竞争,直接使用别人产品数据风险很大。

3.扰乱正常经营

写爬虫抢票,刷量,抢号,而且用于商业牟利,这是通过软件扰乱别人正常经营。

4.商业竞争

“车来了”抓取“酷米客”的公交信息展示在自己的产品上,这两家都是提供公交数据查询,是直接商业竞争关系。

从上面的案例能够看出,爬虫被举证违法主要还是看你抓取数据后的运用。

1.抓取竞品数据,运用商业目的,风险大;

2.抓取拥有知识产权/版权数据,运用商业目的,风险大;

3.爬虫扰乱软件/产品的正常经营,运用商业目的,风险大;

所以,如果你是公司员工,要关注下抓取数据后的运用,通常数据直接被运用的风险较大,负责抓取的技术人员和公司负责人都要进去。

另外要注意看被抓产品的知识产权申明,可以看我写的这篇:

爬虫有风险,开爬需谨慎。

你可能感兴趣的:(python开源爬虫项目违法吗)