爬虫学习笔记-scrapy爬取电影天堂(双层网址嵌套)

 

1.终端运行scrapy startproject movie,创建项目

2.接口查找爬虫学习笔记-scrapy爬取电影天堂(双层网址嵌套)_第1张图片

 3.终端cd到spiders,cd scrapy_carhome/scrapy_movie/spiders,运行 scrapy genspider mv https://dy2018.com/

4.打开mv,编写代码,爬取电影名和网址

爬虫学习笔记-scrapy爬取电影天堂(双层网址嵌套)_第2张图片

5.用爬取的网址请求,使用meta属性传递name ,callback调用自定义的parse_second

6.导入ScrapyMovieItem,将movie对象传递给管道下载

7.settings开启管道

爬虫学习笔记-scrapy爬取电影天堂(双层网址嵌套)_第3张图片

8.下载爬取的movie对象存储到movie.json中

爬虫学习笔记-scrapy爬取电影天堂(双层网址嵌套)_第4张图片

 9.爬取的结果

爬虫学习笔记-scrapy爬取电影天堂(双层网址嵌套)_第5张图片

你可能感兴趣的:(爬虫,学习,笔记)