利用scrapy抓取读书网站关于多级分类书的信息,通过pipeline保存到MongoDB、Redis、MySQL数据库和本地表格
1、创建Scrapy项目scrapystartprojectDushu2.进入项目目录,使用命令genspider创建Spiderscrapygenspiderdushudushu.com3、定义要抓取的数据(处理items.py文件)importscrapyclassDushuItem(scrapy.Item):#书籍IDbook_id=scrapy.Field()#书的链接地址book_url