哪些 Python 库让你相见恨晚?

作者:刘十九
链接:https://www.zhihu.com/question/24590883/answer/28377017
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

相见恨晚的库有很多啊
决定利用午休的时间,把曾经惊艳过我的库都整理出来好了
还不勇敢的点赞么亲
马上为你呈上一锅热腾腾的美味,当当当当

web框架:
  • django
  • flask
  • tornado
  • bottle
微信框架:
  • WeRoBot
网络:
  • requests
  • httpie
爬虫:
  • scrapy
系统方面:
  • fabric
  • ansible
ORM:
  • peewee
  • sqlalchemy
模板引擎:
  • jinja2
图像处理:
  • Pillow
  • Python Imaging Library (PIL)
命令行应用:
  • docopt
静态网站生成器
  • pelican
数据处理:
  • pandas
其他:
  • awesome-python
-------------我是分割线-------------
此外我对django关注比较多,专门列出django部分
等有空再对其做细分
  • django-debug-toolbar
  • django-rest-framework
  • django-xadmin
  • wagtail
  • pinax
  • mezzanine
  • django-crispy-forms
  • django-compressor
  • django-grappelli
  • django-taggit
  • django-basic-apps
  • django-userena
  • django-mptt
  • sorl-thumbnail
  • django-guardian
  • django-pipeline
 
作者:龙鹏-言有三
链接:https://www.zhihu.com/question/24590883/answer/652463850
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

推荐一波爬虫库供玩耍吧,参考

龙鹏-言有三:【杂谈】GitHub上有哪些好用的爬虫(从Google百度,腾讯视频抖音,豆瓣知乎到不可描述)​zhuanlan.zhihu.com哪些 Python 库让你相见恨晚?_第1张图片

1、awesome-spider

地址:https://github.com/facert/awesome-spider

这是ID为facert的一个知乎工程师开源的,star6000+,内容如下:

哪些 Python 库让你相见恨晚?_第2张图片 哪些 Python 库让你相见恨晚?_第3张图片

这一款爬虫,里面搜集了几乎所有可以爬取的中文网址,从知乎豆瓣到知网,抖音微博到QQ,还有很多的不可描述的网站,你懂的。

2、Nyspider

地址:https://github.com/Nyloner/Nyspider

这是ID为Nyloner的一个今日头条的工程师弄的,star1000+,风格与上面的项目大有不同。

哪些 Python 库让你相见恨晚?_第4张图片 哪些 Python 库让你相见恨晚?_第5张图片

可以看出,都是各类网址。这很头条,跟这位小哥哥的工作内容估计有关系。

3、awesome-python-login-model

地址:https://github.com/CriseLYJ/awesome-python-login-model

这是ID为CriseLYJ(职业不详)的用户,这个项目用于模拟各种网址登陆,也包含一些简单的爬虫,star6000+。

哪些 Python 库让你相见恨晚?_第6张图片 哪些 Python 库让你相见恨晚?_第7张图片

先从这个项目开始分析各大网站的登录方式,非常有用,可谓摸清对手再动手。

4、python-spider

地址:https://github.com/Jack-Cherish/python-spider

这是ID为Jack-Cherish的东北大学的一个学生整理的学习python爬虫的资料,star6000+,包含不少的实战项目,非常适合想学习的朋友。

哪些 Python 库让你相见恨晚?_第8张图片 哪些 Python 库让你相见恨晚?_第9张图片

其他还有一些项目,不再一一介绍。

https://github.com/jhao104/proxy_pool
https://github.com/Ehco1996/Python-crawler

--------------------------------------此处是分割线--------------------------------------

如果你是做图像的,我再推荐两个功能强大,简单好用的图片和视频爬虫。工具亲测长期有效,省去了很多找爬虫工具的时间,早用早好。

1、Google,Baidu,Bing三大搜素引擎图片爬虫

地址:https://github.com/sczhengyabin/Image-Downloader

这个爬虫由ID为sczhengyabin的用户整理,可以按要求爬取百度、Bing、Google上的图片,我已经用了几年了,提供了非常人性化的GUI方便操作,使用方法如下:

使用python image_downloader_gui.py调用GUI界面,配置好参数(关键词,路径,爬取数目等),关键词可以直接在这里输入也可以选择从txt文件中选择。

可以配置需要爬取的样本数目,这里一次爬了2000张,妥妥的3分钟搞定。

哪些 Python 库让你相见恨晚?_第10张图片 哪些 Python 库让你相见恨晚?_第11张图片

这个爬虫足够满足小型项目初始数据集的积累(爬几千张高质量图片妥妥的),结果命名也非常整齐规范,最大的优势就是稳定啊,不会三天两天不能用了。

2、各大视频网站爬虫

地址:https://github.com/iawia002/annie

由ID为iawia002的用户整理,Annie是一款以go语言编码的视频下载工具,使用便捷并支持youtube,腾讯视频,抖音等多个网站视频和图像的下载,收录站点如下,可以说是该有的都有的:

哪些 Python 库让你相见恨晚?_第12张图片 哪些 Python 库让你相见恨晚?_第13张图片

虽然这个项目可以下载图片,但是我们还是来用它下载视频吧,使用方法很简单:

annie [可选参数]http://…  (视频网址)
哪些 Python 库让你相见恨晚?_第14张图片 哪些 Python 库让你相见恨晚?_第15张图片

视频会下载到当前目录,至于那些可选参数,赶紧去摸索吧。

哪些 Python 库让你相见恨晚?_第16张图片 哪些 Python 库让你相见恨晚?_第17张图片

转载于:https://www.cnblogs.com/valorchang/p/11288009.html

你可能感兴趣的:(哪些 Python 库让你相见恨晚?)