这个用Python写的开源爬虫网站 让你秒搜所有豆瓣好书(附零基础学习资料)

前言

程序员在提升自己的道路,大多还是会选择阅读编程书籍这一途径,但找到一本好书就没那么容易了。(文末送福利)

通过查看各大销售网站的销量数据和评价,以及豆瓣评分和评价人数,可以帮助我们更快的挖掘出经典的计算机书籍,还有那些被人们忽视的好书。

最近在GitHub上发现了一个网站,是中国科学院自动化研究所的一大神(lanbing510)用Python写的一个爬虫,他在16年的时候就爬下了豆瓣所有的读书数据并做了个WebApp接口方来挖掘查找和阅读好书。怪我知道的太晚

后来lanbing510再次爬了一遍豆瓣读书的数据,总共更新了3232088本图书信息,共2138386KB,并将其开源

为什么说它很好用呢?猿哥演示一遍你就知道了:
这个用Python写的开源爬虫网站 让你秒搜所有豆瓣好书(附零基础学习资料)_第1张图片
可以看出这网站的界面非常简洁,没有花里花哨的内容,只有干货,你可以直接通过关键字、分数、和评价人数这三个选项进行搜索,比如我们可以搜索关键字:编程;分数:9.0;评价人数:100人以上

查找结果的显示方式有按照分数排序和人数排序两种,按照分数排序的截图如下:
这个用Python写的开源爬虫网站 让你秒搜所有豆瓣好书(附零基础学习资料)_第2张图片
按照评价人数排序的截图如下:
这个用Python写的开源爬虫网站 让你秒搜所有豆瓣好书(附零基础学习资料)_第3张图片
除了以上演示的操作,这个网站并实现了以下功能:

可以爬下豆瓣读书标签下的所有图书

按评分排名依次存储

存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的Sheet

采用User Agent伪装为浏览器进行爬取,并加入随机延时来更好的模仿浏览器行为,避免爬虫被封

也就是说你不仅可以在网站上搜索,还能通过下载各类目下的Excel书单文件,直接在Excel中搜索
这个用Python写的开源爬虫网站 让你秒搜所有豆瓣好书(附零基础学习资料)_第4张图片
效果截图如下:
这个用Python写的开源爬虫网站 让你秒搜所有豆瓣好书(附零基础学习资料)_第5张图片

如果你也对Python感兴趣的话,试试这套python学习资料,毕竟小编也是用这套方法自学并成功上岸的

对于0基础小白入门:

如果你是零基础小白,想快速入门Python是可以考虑培训的。

一方面是学习时间相对较短,学习内容更全面更集中。

零基础Python学习资源介绍

Python学习路线汇总

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(学习教程文末领取哈)

Python必备开发工具

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

Python学习视频600合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

100道Python练习题

检查学习结果。

面试刷题



在这里插入图片描述

资料领取

这份完整版的Python全套学习资料已为大家备好,朋友们如果需要可以微信扫描下方二维码添加,输入"领取资料" 可免费领取全套资料【有什么需要协作的还可以随时联系我】朋友圈也会不定时的更新最前言python知识。
在这里插入图片描述

好文推荐

了解python的前景: https://blog.csdn.net/weixin_49892805/article/details/127196159

python有什么用: https://blog.csdn.net/weixin_49892805/article/details/127214402

你可能感兴趣的:(程序员,python,爬虫,开源,python免费资料,编程开发)