爬虫进阶路线指引

基础原理:

浏览器的工作原理:
爬虫进阶路线指引_第1张图片
爬虫四步”:获取数据(包含请求和响应两个动作)、解析数据、提取数据、存储数据:
爬虫进阶路线指引_第2张图片
Network能够记录浏览器的所有请求。我们最常用的是:ALL(查看全部)/XHR(仅查看XHR)/Doc(Document,第0个请求一般在这里),有时候也会看看:Img(仅查看图片)/Media(仅查看媒体文件)/Other(其他)。最后,JS和CSS,则是前端代码,负责发起请求和页面实现;Font是文字的字体。

你可能感兴趣的:(爬虫,python)