大多都是从网络上获取,有兴趣的话自取吧
# 学习资料 (请不要用于盈利)
Python Cookbook(第3版)中文版
流畅的Python - [Ba Xi ] Luciano Ramalho
Python编程:从入门到实践
学习JavaScript数据结构与算法(第3版)
python-3.6.7-docs-html
链接:https://pan.baidu.com/s/1czvA_9BvTmpgEOFuYIVYQw 密码:lqub
(我不喜欢带水印的资料,所以只把找得到的原版资料放上来了)
# 官方手册
MATLAB:
官方手册: https://ww2.mathworks.cn/help/
Matlab中文论坛: https://www.ilovematlab.cn
Python:
Python官网: https://www.python.org/
官方文档: https://docs.python.org/3/index.html
中文: https://docs.python.org/zh-cn/3/tutorial/index.html
PEP 8: https://www.python.org/dev/peps/pep-0008/
Anaconda: https://www.anaconda.com/
Scipy: https://www.scipy.org/
NumPy: https://www.numpy.org/devdocs/
Matplotlib: https://matplotlib.org/users/index.html
Pandas: http://pandas.pydata.org/
Scrapy: https://scrapy-chs.readthedocs.io/zh_CN/1.0/intro/tutorial.html
BeautifulSoup:
英文版: https://www.crummy.com/software/BeautifulSoup/bs4/doc/
中文版: https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
Requests:
中文版: https://2.python-requests.org//zh_CN/latest/user/quickstart.html
Selenium:
https://selenium-python.readthedocs.io/
W3schools tutorial
https://www.w3schools.com/default.asp
[注]:引用一位前辈的话:
永远记住,对于爬虫程序,模拟浏览器往往是下下策,只有实在没有办法了,才去考虑模拟浏览器环境,因为那样的内存开销实在是很大,而且效率非常低。
那么我们怎么处理呢?经验是,这样的情况,大多是是浏览器会在请求和解析HTML之后,根据js的“指示”再发送一次请求,得到页面展示的内容,然后通过js渲染之后展示到界面。好消息是,这样的请求往往得到的内容是json格式的,所以我们非但不会加重爬虫的任务,反而可能会省去解析HTML的功夫。