知乎是个好地方。虽然近年来,为了吸引更多的用户,知乎的定位与早期略有点偏离。但从内容质量和专业性来说,知乎仍然是国内数一数二的知识型社区。不少同学都是通过知乎发现了我们编程教室,我自己也经常会通过知乎去寻求一些专业知识的解答和参考。
之前,为了让大家能更好地挖掘知乎上有价值的信息,我们做了一个索引,把编程入门相关的一些问答和文章做了整理:
文中曾立下FLAG说之后会整理爬虫、数据分析、机器学习等方面的索引,然而却一拖再拖。好在现在,有同学帮我们做了后续整理,今天就把“爬虫篇”分享给大家。
注意:由于微信文中不能直接跳转外部链接,因此建议点击文末的“阅读原文”,收藏知乎原文。
有很多人正在入门Python爬虫,学习Python爬虫。在这个过程中,会遇到很多难题,许多小伙伴都会去寻找答案,但是因为答案的纷繁复杂和种类多样,往往要花上好些时间。
所以我通过整理知乎上关于Python爬虫的精彩回答文章和教程,制作一篇关于Python爬虫的索引,包括:
入门指南-教程资源-框架工具-爬虫实例-专栏索引
大家有什么好的建议和资源也可以留言提出。
入门指南:
1.如何入门Python爬虫?—谢科的回答
https://www.zhihu.com/question/20899988/answer/24923424
(简介:爬虫怎么工作以及怎么在python实现。)
2.爬虫基本原理
https://zhuanlan.zhihu.com/p/35324806
(简介:给有一些有python基础,但是对爬虫一无所知的人)
3.Python爬虫入门
第一讲:Python爬虫|Python爬虫入门(一):基本
https://zhuanlan.zhihu.com/p/21377121?refer=xmucpp
第二讲:Python爬虫|Python爬虫入门(二):请求
https://zhuanlan.zhihu.com/p/21394571
第三讲:Python爬虫|Python爬虫入门(三):解析
https://zhuanlan.zhihu.com/p/21442500
第四讲:Python爬虫|Python爬虫入门(四):储存
https://zhuanlan.zhihu.com/p/21452812
(简介:本爬虫系列入门教程假设读者仅有一点点Python基础或者近乎为零的基础。如果是有Python基础的可以跳过一些对于Python基本知识的补充。)
教程资源:
书籍:
1.一份Python爬虫电子书 (路人甲)
https://zhuanlan.zhihu.com/p/28865834
(简介:这本书主要内容是Python入门,以及Python爬虫入门和Python爬虫进阶)
2.问题:求大神们推荐Python入门书籍
https://www.zhihu.com/question/38801925/answer/184406876
(简介:Python爬虫方面入门书籍推荐)
教程:
系列教程:
1.Python爬虫学习系列教程
https://zhuanlan.zhihu.com/p/25949099
(简介:学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫)
2.Python爬虫教程(一)使用request+Beautifi
https://zhuanlan.zhihu.com/p/35493091
Python爬虫教程(二)使用request+正则re批量下载好听轻音乐网歌曲https://zhuanlan.zhihu.com/p/35528714
3.python爬虫初探(一):爬虫的基本结构
https://zhuanlan.zhihu.com/p/32652572
python爬虫初探(二):URL管理器和下载器
https://zhuanlan.zhihu.com/p/32673371
python爬虫初探(三):HTML解析器
https://zhuanlan.zhihu.com/p/32675668
python爬虫初探(四):数据存储器
https://zhuanlan.zhihu.com/p/32697330
拓展教程:
1.爬虫万金油,一鹅在手,抓遍全球:goose 简介https://zhuanlan.zhihu.com/p/46595420
2.这个男人让你的爬虫开发效率提升8倍
https://zhuanlan.zhihu.com/p/38466193
3.Python 抓取网页乱码原因分析
https://zhuanlan.zhihu.com/p/21057822
4.干了这碗“美丽汤”,网页解析倍儿爽
https://zhuanlan.zhihu.com/p/58445021
进阶拓展:
进阶:
1.Python爬虫进阶
https://www.zhihu.com/question/35461941/answer/192693594
https://www.zhihu.com/question/35461941/answer/72909421
(简介:爬虫无非分为这几块:分析目标、下载页面、解析页面、存储内容)
2.“百行代码”实现简单的Python分布式爬虫
https://zhuanlan.zhihu.com/p/26045460
(简介:进阶知识)
拓展:
1.利用爬虫技术能做到哪些很酷很有用的事情?
https://www.zhihu.com/question/27621722
2.Python爬虫学到什么样就可以找工作了https://www.zhihu.com/question/61103114/answer/183926752
3.从python爬虫,到更爱这个世界
https://zhuanlan.zhihu.com/p/32711505
4.Python爬虫和情感分析简介
https://zhuanlan.zhihu.com/p/20359324
5.你是如何开始能写Python爬虫?
https://www.zhihu.com/question/21358581/answer/274132025
爬虫资源:
1.一个很“水”的Python爬虫入门代码文件
https://zhuanlan.zhihu.com/p/22982208
2.156个Python网络爬虫资源!
https://zhuanlan.zhihu.com/p/28407245
3.可能是最全面的75个Python爬虫资源
https://zhuanlan.zhihu.com/p/27985429
学习经验:
1.用Python写爬虫时应该注意的坑?
https://www.zhihu.com/question/49296232/answer/368313956
2.Python3网络爬虫学习建议?
https://www.zhihu.com/question/41277528/answer/95885043
3.Python爬虫知识点梳理
https://zhuanlan.zhihu.com/p/29523349
4.常用的 Python 爬虫技巧
https://zhuanlan.zhihu.com/p/23088379
5.如何优化Python爬虫的速度?
https://www.zhihu.com/question/20145091/answer/618321662
6.Python爬虫—破解JS加密的Cookie
https://zhuanlan.zhihu.com/p/25957793
7.主流网站 Python 爬虫模拟登陆方法汇总
https://zhuanlan.zhihu.com/p/59733826
8.三步走,教你定制自己的个性Python爬虫
https://zhuanlan.zhihu.com/p/23178014
9.Python爬虫传送post请求要携带哪些参数?https://www.zhihu.com/question/60256922/answer/174211193
框架工具:
框架:
1.Python有哪些常见的、好用的爬虫框架?
https://www.zhihu.com/question/60280580/answer/617068010
2.一个极为简洁的Python爬虫框架
https://zhuanlan.zhihu.com/p/23017812
3.拥有属于自己的Python爬虫框架--练习编写多线程、协程爬虫框架https://zhuanlan.zhihu.com/p/24469566
工具:
1.10个爬虫工程师必备的工具了解一哈
https://zhuanlan.zhihu.com/p/54855072
(简介:工欲善其事必先利其器的道理相信大家都懂。)
2.推荐4个爬虫抓包神器
https://zhuanlan.zhihu.com/p/61980749
(简介:今天推荐4个HTTP代理工具通过抓包分析,帮助你还原APP背后的每个请求。)
3.爬虫必备工具,掌握它就解决了一半的问题
https://zhuanlan.zhihu.com/p/39340856
(简介:今天这篇文章不谈任何具体网站的抓取,只来说一个共性的东西:如何通过 Chrome 开发者工具寻找一个网站上特定数据的抓取方式。)
4.听说你好不容易写了个爬虫,结果没抓几个就被封了?
https://zhuanlan.zhihu.com/p/28726244
(简介:实现一个自动获取可用代理 IP 的接口。)
爬虫实例:
1.利用python爬取网易云音乐,并把数据存入mysqlhttps://zhuanlan.zhihu.com/p/34354440
2.python爬取20w表情包之后,从此你就成为了微信斗图届的高手https://zhuanlan.zhihu.com/p/66243518
3.如何让Python爬虫一天抓取100万张网页
https://zhuanlan.zhihu.com/p/65508954
4.Python爬虫告诉你上海房价有多高
https://zhuanlan.zhihu.com/p/40293278
5.Python爬虫入门 | 2 爬取豆瓣电影信息
https://zhuanlan.zhihu.com/p/32037625
6.Python爬虫一步步抓取房产信息
https://zhuanlan.zhihu.com/p/25713752
7.我用Python又爬虫了拉钩招聘,给你们看看2019市场行情https://zhuanlan.zhihu.com/p/65081383
8.爬虫爬了下知乎上的神回复,已笑趴~
https://zhuanlan.zhihu.com/p/46132179
9.一键下载:将知乎专栏导出成电子书
https://zhuanlan.zhihu.com/p/44918640
10.如何用Python抓抖音上的小姐姐
https://zhuanlan.zhihu.com/p/46396868
11.【招聘数据分析】Python就业前景如何
https://zhuanlan.zhihu.com/p/35027220
专栏索引:
Python爬虫索引:
1.如何入门爬虫(路人甲)
https://zhuanlan.zhihu.com/p/21479334
(简介:一个知乎大神整理的关于Python爬虫的索引,内容详细全面,结构完整。对于新手和正在学习的小伙伴是非常有帮助的。)
2.从零开始写Python爬虫(Ehco)
https://zhuanlan.zhihu.com/p/26673214
(简介:提供了实用的方法和建议)
3.自学入门 Python 优质中文资源索引
https://zhuanlan.zhihu.com/p/49798116
(简介:自学入门Python的整理,有关于Python爬虫的索引)
Python爬虫号推荐:
1.蚍蜉撼大树
https://www.zhihu.com/people/handashu/posts/posts_by_votes
(简介:Python爬虫之旅系列)
2.州的先生
https://www.zhihu.com/people/zmister/posts/posts_by_votes?page=2
(简介:python爬虫实战入门系列)
3.学习python的正确姿势
https://www.zhihu.com/people/xue-xi-pythonde-zheng-que-zi-shi-92/posts/posts_by_votes
(简介:Python爬虫实战系列)
4.不吃夹生饭
https://www.zhihu.com/people/bu-chi-jia-sheng-fan/posts
(简介:反反爬虫系列)
爬虫项目索引:
1.资源整理|32个Python爬虫项目让你一次吃到撑
https://zhuanlan.zhihu.com/p/27938007
(简介:32个爬虫项目)
2.GitHub上有哪些优秀的Python爬虫项目?
https://www.zhihu.com/question/58151047/answer/640461600
(简介:GitHub上优秀的Python爬虫项目)
3.23个Python爬虫开源项目代码,包含微信淘宝,豆瓣知乎,微博等
https://zhuanlan.zhihu.com/p/58851666