scrapy框架——架构介绍、安装、项目创建、目录介绍、使用、持久化方案、集成selenium、去重规则源码分析、布隆过滤器使用、redis实现分布式爬虫
文章目录前言一、架构介绍引擎(EGINE)调度器(SCHEDULER)下载器(DOWLOADER)爬虫(SPIDERS)项目管道(ITEMPIPLINES)下载器中间件(DownloaderMiddlewares)爬虫中间件(SpiderMiddlewares)一、安装一、项目创建1创建scrapy项目2创建爬虫3启动爬虫,爬取数据二、目录介绍三、解析数据四、配置1.基础配置2.增加爬虫的爬取效率