python爬取拉钩网招聘信息分析

金9银10,又到了校招季,今天来看一下目前拉钩的Python工作技能要求和薪资待遇。

浏览器访问下

https://www.lagou.com/jobs/list_python/p-city_0?px=default&gx=&isSchoolJob=1#filterBox

观察xhr,这个positionajax很可疑,看看response,就是它了

python爬取拉钩网招聘信息分析_第1张图片
请求url

python爬取拉钩网招聘信息分析_第2张图片
请求头

python爬取拉钩网招聘信息分析_第3张图片
参数

python爬取拉钩网招聘信息分析_第4张图片

cookie,根据前辈的经验,拉钩采用动态token,防御伪造请求,重复提交

python爬取拉钩网招聘信息分析_第5张图片

这个token,当第一次访问拉钩网时,会给你一个permanent cookie

python爬取拉钩网招聘信息分析_第6张图片

我们利用requests.session()访问获取cookie,利用这个cookie值模拟positionajax

python爬取拉钩网招聘信息分析_第7张图片

有了,将数据筛选一下,存入json

python爬取拉钩网招聘信息分析_第8张图片

用pyecharts看看城市分布情况

python爬取拉钩网招聘信息分析_第9张图片

北京一枝独秀,上海、广州位列2,3,北上广牛批。

薪资分布

python爬取拉钩网招聘信息分析_第10张图片

五花八门,最低1k,最高50k,不知算什么水平,对比下java的

python爬取拉钩网招聘信息分析_第11张图片

使用微词云看看技能标签

python爬取拉钩网招聘信息分析_第12张图片

代码地址点我

求个star和关注。

你可能感兴趣的:(爬虫)