基于excel的数据分析

1.研究背景

由于很多公司都需要数据分析,所以就想研究一下最近比较火热的岗位,希望通过本文的分析能够给广大求职者一个借鉴。

2.分析思路

(1)明确分析思路

想要了解数据分析类岗位招聘现状,可以从一下几个维度去进行现状下描述性分析:

招聘数据分析的公司有哪些特点?——公司基本信息

招聘薪酬待遇如何?——职位基本信息

招聘有什么要求?——职位要求信息

(2)搭建指标分析体系

针对以上分析维度问题搭建维度指标体系

基于excel的数据分析_第1张图片

3.数据采集

(1)采集工具

在八爪鱼采集器或者python爬虫。

(2)数据来源

采集拉勾网“数据分析”岗位,具体操作可从网络上学会。

4.数据清洗

(1)数据预处理

第一步 先备份数据,隐藏不需要的列,修改列名。

第二步 理解表中行列数据,观察数据有没有缺失值,有无错位,或者一些影响分析的脏数据,根据相关的观察并处理数据。

第三步 经过上一步的的简单清洗 ,心中应该有此数据元清洗加工的大致方向。

(2)数据清洗

a 处理重复值

在excel数据-删除重复值,检测到78条重复项,故删除。

基于excel的数据分析_第2张图片

 b 处理缺失值

查看计算每列是否存在缺失值,如果一个字段数据确实超过40%,就要考虑删除重新获取数据或作其他措施。通过数据发现该数据并没有缺失值,所以无需处理。

c 处理异常值

公司所在地区是城市加地区,需将它们进行分析才能刚好地进行分析。利用分列功能将他们进行分列,并查看数据是否规范。

d 数据加工

观察到薪资列为文本数据,将其转换为数值型。通过观察数据,可以看到这列数据都有一个共同的特质,都是XXk-XXk。可以通过分列将数据分为最低工资和最高工资,替换k,就可以将数据变成数值了。

提取后的部分数据如图所示

基于excel的数据分析_第3张图片

 5.数据可视化

(1)招聘公司分析

招聘数据分析的公司有什么特点呢?主要从招聘公司所在地区、公司规模,以及公司所属行业等维度指标来进行分析。

a 招聘的公司主要分布在那些城市?

基于excel的数据分析_第4张图片

从上述结果来看,北京是数据分析岗位占比最大的,占比高达30%,其次是上海,占比也到了26%,再然后就是深圳、广州、杭州、成都。其他城市的需求较少。

b 招聘企业都属于那些规模?

基于excel的数据分析_第5张图片

由此可知,公司规模越大,招聘的数据分析职位就越多。符合企业规模越大,产生的数据量级越大的一般规律 ,数据分析/挖掘的需求也越旺盛 。

 基于excel的数据分析_第6张图片

从以上结果可以了解到,数据服务是招聘数据分析岗位最多的行业,其次就是金融/游戏/电商等行业是招聘数据分析的主要行业,如果大家需要选择行业的话,也可以以此为参考。

以便于同时观看城市和行业对招聘的需求影响,且由于数据比较分散,故通过城市筛选出北上广深杭五个城市。

基于excel的数据分析_第7张图片

 (2)薪资待遇分析

招聘的薪资待遇如何呢?一般通过城市、行业、学历、经验等密切相关,针对不同的影响因子,进行简单的描述性分析。

a 城市的不同,对需求和薪资的影响分布

基于excel的数据分析_第8张图片

 由上述结果可知,香港的薪资最高,但是企业所招聘的数量较少。而对于北京、广州、深圳、上海、杭州的招聘数量较多,薪资水平也不低。

b 行业的不同,对薪资的影响的状况?

基于excel的数据分析_第9张图片

 标出行业前10%的数据,以便于更好地进行分析。除了电商平台和内容咨询这两个行业,其他行业薪资前10%的行业大多都是招聘数量较少的行业,例如薪资最高的区块链行业,岗位招聘的占比才0.27%。所以说热门做数据分析的行业薪资不一定是最高,但是也不会差到哪里去,从数据上看,反而是冷门的行业做数据分析反而薪资最高。

c 经验与学历的不同,对薪资的影响

基于excel的数据分析_第10张图片

 在不限经验的时候,博士的工资在几个学历中是最高的,5-10年经验的本科和硕士的工资在25-30k,1年以下的薪资最低。1-3年和在校的薪资都差不多,10年以上经验的硕士工资最高。由此看来,工作经验的提升和学历的提高,薪资待遇也会越来越高。

(2)岗位要求

招聘岗位有什么要求呢?主要从工作经验、学历、软件技能等维度进行分析,但由于数据中没有软件技能的数据,所以只对工作经验和学历进行分析。

a 经验的不同,对需求和薪水的影响

经验 平均值项:平均工资 计数项:招聘岗位
10年以上 45 0.27%
1-3年 16.92553191 25.47%
1年以下 14.6 1.36%
3-5年 24.06462585 39.84%
5-10年 29.74489796 13.28%
不限 22.68181818 14.91%
在校 17.41666667 4.88%
总计 22.39837398 100.00%

 基于excel的数据分析_第11张图片

 符合一般规律:基本上符合工作经验越高,薪资越高。工作经验3年以下的占比高达50%以上,说明该行业对对求职者的工作经验是比较包容的。

b 学历的不同,对需求的薪资的影响

学历 平均值项:平均工资 计数项:招聘岗位
本科 22.85648148 87.80%
博士 45 0.27%
不限 26 1.90%
大专 11.9375 2.17%
硕士 20.31818182 2.98%
应届 17.41666667 4.88%
总计 22.39837398 100.00%

基于excel的数据分析_第12张图片

 该岗位对本科的招聘数据达到了87.8%,在各项数据中相对占优势的硕士学历占比为2.98%,说明数据分析岗位对学历的要求标准为本科。且本科和硕士的薪资相差不大明显,也就是新兴的岗位学历要求不高,对求职者是利好的消息。

6.总结

各城市的岗位需求北京>上海>广州>深圳>杭州>成都,可以按照以上顺序去找工作,在以上顺序下也可以按照数据>服务金融>游戏>电商顺序去找工作,比较好找。

从招聘需求和薪资来看,招聘本科的需求占87.8%,工作经验也主要集中在1-5年经验,并且经验的积累是明显大于学历提升对薪资的影响。建议重点提升自我的工作经验和能力。

不足之处在于没有抓取到职位的软件技能,其实对于初级数据分析师,excel可以解决80%的问题;对于中高级数据分析师,后期必须多积累经验并掌握编程工具:sql、tableau、python等。

数据来源于拉勾网,而拉勾网是比较偏向互联网招聘 ,可能会影响城市/行业/薪资的需求分布,以上也仅仅作一个参考。

你可能感兴趣的:(数据分析)