数据分析案例:对拉勾网数据分析岗位进行分析

关于主要城市数据分析岗位招聘信息的分析

  • 前言
  • 分析思路
  • 数据获取
  • 数据清洗加工
    • 删除无效数据
    • 数据加工
  • 数据分析
    • 公司分析
      • 位置分布
      • 融资情况
      • 行业分布
    • 岗位分析
      • 学历要求
      • 工作经验
      • 职业诱惑
      • 岗位要求
    • 薪资分析
      • 薪资与城市
      • 城市、经验与薪资
      • 城市、行业与薪资
  • 分析总结

前言

随着互联网的飞速发展,用户积累的数据越来越多,企业从大数据中挖掘有价值的信息似乎成了主流,加上各种营销,导致许多人想转行数据分析师,认为入门门槛相对较低、工资高于大多传统行业岗位,当然我也是其中一个,为了避免被各种营销带节奏,还是分析了解一下数据分析师目前的大概行情吧,比如薪资待遇如何,工作内容是什么,去哪座城市机会好等等。

使用工具:Xmind(思维导图)、Excel(数据处理清洗)、Tableau(数据可视化)、Pycharm(词云)

数据来源:Kesci网(【爬遍拉钩,带你看看数据分析师的真实现状】)

分析思路

数据分析案例:对拉勾网数据分析岗位进行分析_第1张图片

数据获取

目前,还没学习爬虫,使用他人爬取数据进行分析。

打开Kesci网,注册账号,搜索下载数据集。

数据清洗加工

打开结果如下:
数据分析案例:对拉勾网数据分析岗位进行分析_第2张图片

删除无效数据

使用排序和删除重复值功能将无用数据和缺失值较多的行列删除并去重。

数据分析案例:对拉勾网数据分析岗位进行分析_第3张图片

数据加工

删除无用重复数据后,对数据进一步加工,比如说薪资6K-12K,拆分为最低薪资、最高薪资、平均薪资。

  • 薪资:最低薪资、最高薪资、平均薪资(转化为数值)
1.利用FIND、LEFT、MID函数提取最高和最低薪资
最低薪资 = LEFT(H2,FIND("-",H2,1)-1)
最高薪资 = MID(H2,FIND("-",H2,1)+1,3)

2.利用SUBSTITUTE函数将薪资转换为数值
最低薪资 = SUBSTITUTE(I2,"k","")*1000
最高薪资 = SUBSTITUTE(K2,"k","")*1000

3.求平均薪资
平均薪资 = (J2+L2)*0.5

结果如下:
数据分析案例:对拉勾网数据分析岗位进行分析_第4张图片

  • 公司领域:只保留第一个主要所属行业。

观察这一列数据,发现行业之间用逗号(“,”)空格(“ ”),竖线(“丨”)分开,直接用分列功能进行加工,保留第一个行业信息。
数据分析案例:对拉勾网数据分析岗位进行分析_第5张图片
最终加工结果如下:
数据分析案例:对拉勾网数据分析岗位进行分析_第6张图片

数据分析

公司分析

位置分布

数据分析案例:对拉勾网数据分析岗位进行分析_第7张图片
颜色越红,圆形越大,说明招聘岗位数量越多。从图中可以看出,招聘数据分析岗位的公司主要分布在北京、成都、武汉、上海等城市,大多数岗位分布在南方中部及沿海一线发达城市。

融资情况

数据分析案例:对拉勾网数据分析岗位进行分析_第8张图片
其中不需要融资和为融资的公司需求量大一些,其他发展阶段的公司需求比较均匀。

行业分布

数据分析案例:对拉勾网数据分析岗位进行分析_第9张图片
目前,是互联网+大数据时代,许多公司的用户会产生大量数据,需要相关人才利用数据去驱动业务,为企业创造价值,所以来说这些行业数据分析师需求大,入职这些行业的机会也比较多。

岗位分析

学历要求

数据分析案例:对拉勾网数据分析岗位进行分析_第10张图片

数据分析岗位的主要要求学历是本科,可能是以下两点原因:

1.该行业涉及高等数学、各种业务知识等,要求知识水平高。

2.行业更新发展快,需要应聘者有较高的学习能力。

工作经验

数据分析案例:对拉勾网数据分析岗位进行分析_第11张图片
从图中得知数据分析岗位经验主要集中在1-5年,企业偏招聘3-5年工作经验的数据分析师,可能由于业务能力各方面比较成熟,能够为企业创造更多的价值,而1-3年工作经验的数据分析师,业务能力相对弱一些,可能作为重点培养对象。

做到这里的时候,心里面哇凉哇凉的,像我这种没有工作经验的转行应届毕业生该何去何从,数量占比还不到10%。

职业诱惑

python代码如下:

import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS
import jieba
import numpy as np
from PIL import Image

text = open(r'C:\Users\Administrator\Desktop\gwyq.txt').read()

wordlist = jieba.cut(text,cut_all = True)  #分词
wl = " ".join(wordlist)
wc = WordCloud(
    scale=4,
    width=1000,                 #设置图片宽度
    height= 800,                #设置图片高度
    background_color = 'white', #设置图片背景颜色
    max_words = 20,				#设置词语数目							
    stopwords = STOPWORDS,      #停用词 默认
    max_font_size = 200,		#设置最大字号
    margin= 1,					#设置词语边缘
    font_path = "C:\Windows\Fonts\simfang.ttf", #设置字体

)
wc.generate(wl)

image_colors = ImageColorGenerator(backgrim)
plt.rcParams['figure.dpi'] = 10000     #设置清晰度,原来默认dpi100
plt.rcParams['savefig.dpi'] = 10000
plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file('cy1.png') # 导出当前文件夹

数据分析案例:对拉勾网数据分析岗位进行分析_第12张图片
大部分公司拥有双休、带薪休假、年终奖这些诱惑。

岗位要求

python代码如下:

import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS
from PIL import Image

text = open(r'C:\Users\Administrator\Desktop\gwyq.txt').read()
ws = set(STOPWORDS)    # 设置屏蔽词语
ws.add("岗位职责")
ws.add("任职资格")
ws.add("任职要求")
ws.add("岗位要求")
ws.add("工作职责")
ws.add("职位描述")
ws.add("职位要求")
ws.add("数据分析")
ws.add("数据挖掘")
ws.add("数据运营")
wc = WordCloud(
    scale=4,
    width=1000,
    height= 800,
    background_color = 'white',
    max_words = 100,
    stopwords = ws,
    max_font_size = 200,
    margin= 1,
    font_path = "C:\Windows\Fonts\simfang.ttf",
)
wc.generate(text)

plt.rcParams['figure.dpi'] = 10000
plt.rcParams['savefig.dpi'] = 10000
plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file('cy2.png')

数据分析案例:对拉勾网数据分析岗位进行分析_第13张图片
对于岗位要求这一块,涉及到SQL、Python、BI、SPSS等数据分析工具,对应聘者的学历和数学知识也有一定的要求。

薪资分析

薪资与城市

数据分析案例:对拉勾网数据分析岗位进行分析_第14张图片
对于这几个主要城市来说,其中北京、杭州、上海、深圳这几个城市的工资要高于总体的平均工资,这几个城市是经济发展最强的城市,人才聚集,薪资偏高,如果想要高薪职业,可以优先考虑选择这几个城市,当然竞争压力和生活压力也会很大。

城市、经验与薪资

考虑到北京、成都、武汉、上海这四个城市招聘岗位多,就业机会大,下面以这四个城市分析。
数据分析案例:对拉勾网数据分析岗位进行分析_第15张图片
根据自己的工作经验和所在城市估计自己大概的期望薪资,如果自己的工作年限范围工资偏低,可选择性跳槽。

城市、行业与薪资

同上,重点以招聘岗位较多的行业为主进行分析。

数据分析案例:对拉勾网数据分析岗位进行分析_第16张图片
如果是进入金融行业做数据分析,优先考虑上海。其他行业的数据分析,去北京待遇更好。

分析总结

综合上面的分析,提出以下建议:

1.数据分人员需要掌握一些技能,比如SQL、Python、SPSS等工具。

2.就业城市可以优先考虑去北京,就业机会大、待遇好。

3.应届毕业生、转行人员向自己相关行业转行,以学习经验为主。

4.1-3年工作人员需要提升自身的业务能力及分析能力才能更好的竞争高薪;3-5年的工作经验的人员,在某个领域已经有很深的资历,可以考虑管理岗发展。

你可能感兴趣的:(数据分析案例,数据分析)