必须收藏!23个Python爬虫开源项目代码:微信、淘宝、等

今天分享的文章为大家整理了23个Python爬虫项目。

整理的原因是,爬虫入门简单快速,也非常适合新入门的小伙伴培养信心,所有链接指向GitHub,微信不能直接打开,老规矩,可以用电脑打开。.

必须收藏!23个Python爬虫开源项目代码:微信、淘宝、等_第1张图片

必须收藏!23个Python爬虫开源项目代码:微信、淘宝、等

 

 

1. WechatSogou – 微信公众号爬虫

基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。

github地址:

https://github.com/Chyroc/WechatSogou

 

2. DouBanSpider – 豆瓣读书爬虫

可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的Sheet ,采用User Agent伪装为浏览器进行爬取,并加入随机延时来更好地模仿浏览器行为,避免爬虫被封。

github地址:

https://github.com/lanbing510/DouBanSpider

 

3. zhihu_spider – 知乎爬虫

你可能感兴趣的:(python,python,java,大数据,数据库,github)