爬虫五(Scrapy框架整体流程介绍、Scrapy解析数据爬取Cnblogs文章信息、Settings相关配置提高爬取效率、持久化方案保存到本地数据库、爬虫中间件)
文章目录一、Scrapy架构流程介绍二、Scrapy解析数据(爬取Cnblogs文章信息)三、Settings相关配置提高爬取效率四、持久化方案五、爬虫中间件一、Scrapy架构流程介绍Scrapy一个开源和协作的框架,其最初是为了页面抓取(更确切来说,网络抓取)所设计的,使用它可以以快速、简单、可扩展的方式从网站中提取所需的数据。但目前Scrapy的用途十分广泛,可用于如数据挖掘、监测和自动化测