爬虫课程作业02-解密大数据社群

作业要求:

选择解密大数据专题里面上次爬虫课的作业文档地址作为分析页面,分析并提交该页面的网页结构分析与元素标签位置信息。

上次作业链接 http://www.jianshu.com/p/7e2fccb4fad9

HTML基本结构

爬虫课程作业02-解密大数据社群_第1张图片
HTML基本结构.png

网页基本结构图

爬虫课程作业02-解密大数据社群_第2张图片
爬虫课程作业01-解密大数据社群 - -标注版.png

head 区域

网页标题

爬虫课程作业01-解密大数据社群 -

顶部导航栏

|

写文章

|
| 写文章
|

发现、关注、消息和搜索四个按钮


文章标题

爬虫课程作业01-解密大数据社群

作者信息





作者
在旅途的车

文章基本信息,包括更新时间、字数、阅读数量、评论数量、喜欢数量等等



2017.07.04 00:26*
字数 387
阅读 33评论 2

文章主体内容:



爬虫课程作业02-解密大数据社群_第4张图片

glenn-carstens-peters-203007.jpg


最近对金融行业的就业情况比较感兴趣,准备从领英网站获取一些数据,做一些分析。


一、要爬取的数据类别


领英网站金融行业的职位数据,包括公司名称、职位名称、薪酬范围、职位要求


二、对应的数据源网站


领英网址 www.linkedin.com


三、爬取数据的URL


https://www.linkedin.com/jobs/search/?keywords=audit&location=%E5%85%A8%E7%90%83&locationId=OTHERS.worldwide


四、数据筛选规则


根据职位的类别、招聘公司、职位所在地域、职位对应工作年限的要求、发布日期、职位要求、薪酬范围等维度,对爬取的数据进行筛选和分析,希望获得以下结论:


某个特定职位的薪酬水平及变化趋势,判断该职位的稀缺程度和就业概率;


某个特定职位的地域分布情况,提供自己发展的区域选择参考依据;


某个特定职位在不同行业的分布情况,和对应的薪酬水平,以审计(audit)为例,该职位具备一定的行业共性,但是不同行业、同一个职位薪酬水平不同,可以为自己做职业转换提供参考;


某个特定职位的工作要求,为自己的职业发展和技能培训提供指导性意见。

    

侧边浮动按钮,主要包括回到顶部、文章投稿、收藏文章和分享文章四个功能:

" data-original-title="" title="" class="function-button">

底部作者信息:

你可能感兴趣的:(爬虫课程作业02-解密大数据社群)