Python爬虫学习(二) ——————爬取前程无忧招聘信息并写入excel

作为一名Pythoner,相信大家对Python的就业前景或多或少会有一些关注。索性我们就写一个爬虫去获取一些我们需要的信息,今天我们要爬取的是前程无忧!说干就干!进入到前程无忧的官网,输入关键字“Python”,我们会得到下面的页面

Python爬虫学习(二) ——————爬取前程无忧招聘信息并写入excel_第1张图片

 我们可以看到这里罗列了"职位名"、"公司名"、"工作地点"、"薪资"、"发布时间",那么我们就把这些信息爬取下来吧!确定了需求,下一步我们就审查元素找到我们所需信息所在的标签,再写一个正则表达式把元素筛选出来就可以了!

Python爬虫学习(二) ——————爬取前程无忧招聘信息并写入excel_第2张图片

顺理成章得到这样一个正则表达式:

reg = re.compile(r'class="t1 ">.*? (.*?).*?(.*?).*? (.*?)',re.S)
完成这关键的一步,下面写入本地就灰常简单了!还是来段代码吧!

 再来一张效果图

Python爬虫学习(二) ——————爬取前程无忧招聘信息并写入excel_第3张图片

 看起来效果还不错,要是能够以表格的形式展示出来就更好了,在网上看到有的大佬直接把招聘信息写入excel表格,今天我也来试一下吧!其实也并麻烦,只需要将上面的代码稍加修改就可以了。下面贴一下代码,重要的地方会有注释。

最后实现的效果如下图:

Python爬虫学习(二) ——————爬取前程无忧招聘信息并写入excel_第4张图片

至此,我们的工作就已经完成了!有的朋友可能想要爬取其他工作的招聘信息,观察了一下URl可以知道修改一下关键字名称就可以了!可以定义成一个函数只需输入关键字,然后就可以自动爬取该工作的招聘信息!条条大路通罗马,想要实现上面的效果肯定不止这一种方法,以上内容仅供参考,希望可以给有需要的朋友提供一点思路!至于代码就比较粗糙了,而本人也希望有一天能够写得一手风骚代码!还是要重申一遍,本人能力有限,文章中可能会有纰漏或者错误,也欢迎表哥表姐们前来指正!谢谢大家!

 

 


 

转载于:https://www.cnblogs.com/Beyond-Ricky/p/6771028.html

你可能感兴趣的:(Python爬虫学习(二) ——————爬取前程无忧招聘信息并写入excel)