python爬虫(四)---scrapy框架之腾讯招聘项目实战

目的:功能就是翻页请求

步骤:如下

在这里插入图片描述


爬取职位名,职位链接等

在这里插入图片描述
 职位名:
 职位详情链接:
 职位类别:
 人数:
 地点:
 发布时间:
python爬虫(四)---scrapy框架之腾讯招聘项目实战_第1张图片

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第2张图片


下一步骤:写爬虫 :tencent.py文件写

在这里插入图片描述

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第3张图片

方法一:

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第4张图片
在这里插入图片描述

或者这样写
python爬虫(四)---scrapy框架之腾讯招聘项目实战_第5张图片
在这里插入图片描述


获取职位名

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第6张图片


获取链接

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第7张图片

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第8张图片
在这里插入图片描述


再传给管道:

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第9张图片

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第10张图片


设置settings函数

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第11张图片


开始翻页(提取第二页的链接)

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第12张图片
以上只是构建了请求但是没有发出去请求,因此需要用yield
在这里插入图片描述


排错一:
因为有的没有类别,所以要判断:
python爬虫(四)---scrapy框架之腾讯招聘项目实战_第13张图片
排错二:
在这里插入图片描述

方法二:用scrapy提取链接
python爬虫(四)---scrapy框架之腾讯招聘项目实战_第14张图片


总结:一个项目的大致流程

python爬虫(四)---scrapy框架之腾讯招聘项目实战_第15张图片

你可能感兴趣的:(python爬虫)