Pyhton抓取BOSS直聘职位描述和数据清洗,很简单没有那么难

一、抓取详细的职位描述信息

详情页分析

Python学习资料或者需要代码、视频加Python学习群:960410445

在详情页中,比较重要的就是职位描述和工作地址这两个

由于在页面代码中岗位职责和任职要求是在一个 div 中的,所以在抓的时候就不太好分,后续需要把这个连体婴儿,分开分析。

爬虫用到的库

使用的库有:

requests

BeautifulSoup4

pymongo

Python 代码

代码 easy,初学者都能看懂。

二、数据清洗

校正发布日期

校正薪水以数字保存

根据 工作经验年限 划分招聘等级

你可能感兴趣的:(Pyhton抓取BOSS直聘职位描述和数据清洗,很简单没有那么难)