随着互联网的飞速发展,用户积累的数据越来越多,企业从大数据中挖掘有价值的信息似乎成了主流,加上各种营销,导致许多人想转行数据分析师,认为入门门槛相对较低、工资高于大多传统行业岗位,当然我也是其中一个,为了避免被各种营销带节奏,还是分析了解一下数据分析师目前的大概行情吧,比如薪资待遇如何,工作内容是什么,去哪座城市机会好等等。
使用工具:Xmind(思维导图)、Excel(数据处理清洗)、Tableau(数据可视化)、Pycharm(词云)
数据来源:Kesci网(【爬遍拉钩,带你看看数据分析师的真实现状】)
目前,还没学习爬虫,使用他人爬取数据进行分析。
打开Kesci网,注册账号,搜索下载数据集。
使用排序和删除重复值功能将无用数据和缺失值较多的行列删除并去重。
删除无用重复数据后,对数据进一步加工,比如说薪资6K-12K,拆分为最低薪资、最高薪资、平均薪资。
1.利用FIND、LEFT、MID函数提取最高和最低薪资
最低薪资 = LEFT(H2,FIND("-",H2,1)-1)
最高薪资 = MID(H2,FIND("-",H2,1)+1,3)
2.利用SUBSTITUTE函数将薪资转换为数值
最低薪资 = SUBSTITUTE(I2,"k","")*1000
最高薪资 = SUBSTITUTE(K2,"k","")*1000
3.求平均薪资
平均薪资 = (J2+L2)*0.5
观察这一列数据,发现行业之间用逗号(“,”)空格(“ ”),竖线(“丨”)分开,直接用分列功能进行加工,保留第一个行业信息。
最终加工结果如下:
颜色越红,圆形越大,说明招聘岗位数量越多。从图中可以看出,招聘数据分析岗位的公司主要分布在北京、成都、武汉、上海等城市,大多数岗位分布在南方中部及沿海一线发达城市。
其中不需要融资和为融资的公司需求量大一些,其他发展阶段的公司需求比较均匀。
目前,是互联网+大数据时代,许多公司的用户会产生大量数据,需要相关人才利用数据去驱动业务,为企业创造价值,所以来说这些行业数据分析师需求大,入职这些行业的机会也比较多。
数据分析岗位的主要要求学历是本科,可能是以下两点原因:
1.该行业涉及高等数学、各种业务知识等,要求知识水平高。
2.行业更新发展快,需要应聘者有较高的学习能力。
从图中得知数据分析岗位经验主要集中在1-5年,企业偏招聘3-5年工作经验的数据分析师,可能由于业务能力各方面比较成熟,能够为企业创造更多的价值,而1-3年工作经验的数据分析师,业务能力相对弱一些,可能作为重点培养对象。
做到这里的时候,心里面哇凉哇凉的,像我这种没有工作经验的转行应届毕业生该何去何从,数量占比还不到10%。
python代码如下:
import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS
import jieba
import numpy as np
from PIL import Image
text = open(r'C:\Users\Administrator\Desktop\gwyq.txt').read()
wordlist = jieba.cut(text,cut_all = True) #分词
wl = " ".join(wordlist)
wc = WordCloud(
scale=4,
width=1000, #设置图片宽度
height= 800, #设置图片高度
background_color = 'white', #设置图片背景颜色
max_words = 20, #设置词语数目
stopwords = STOPWORDS, #停用词 默认
max_font_size = 200, #设置最大字号
margin= 1, #设置词语边缘
font_path = "C:\Windows\Fonts\simfang.ttf", #设置字体
)
wc.generate(wl)
image_colors = ImageColorGenerator(backgrim)
plt.rcParams['figure.dpi'] = 10000 #设置清晰度,原来默认dpi100
plt.rcParams['savefig.dpi'] = 10000
plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file('cy1.png') # 导出当前文件夹
python代码如下:
import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS
from PIL import Image
text = open(r'C:\Users\Administrator\Desktop\gwyq.txt').read()
ws = set(STOPWORDS) # 设置屏蔽词语
ws.add("岗位职责")
ws.add("任职资格")
ws.add("任职要求")
ws.add("岗位要求")
ws.add("工作职责")
ws.add("职位描述")
ws.add("职位要求")
ws.add("数据分析")
ws.add("数据挖掘")
ws.add("数据运营")
wc = WordCloud(
scale=4,
width=1000,
height= 800,
background_color = 'white',
max_words = 100,
stopwords = ws,
max_font_size = 200,
margin= 1,
font_path = "C:\Windows\Fonts\simfang.ttf",
)
wc.generate(text)
plt.rcParams['figure.dpi'] = 10000
plt.rcParams['savefig.dpi'] = 10000
plt.imshow(wc)
plt.axis("off")
plt.show()
wc.to_file('cy2.png')
对于岗位要求这一块,涉及到SQL、Python、BI、SPSS等数据分析工具,对应聘者的学历和数学知识也有一定的要求。
对于这几个主要城市来说,其中北京、杭州、上海、深圳这几个城市的工资要高于总体的平均工资,这几个城市是经济发展最强的城市,人才聚集,薪资偏高,如果想要高薪职业,可以优先考虑选择这几个城市,当然竞争压力和生活压力也会很大。
考虑到北京、成都、武汉、上海这四个城市招聘岗位多,就业机会大,下面以这四个城市分析。
根据自己的工作经验和所在城市估计自己大概的期望薪资,如果自己的工作年限范围工资偏低,可选择性跳槽。
同上,重点以招聘岗位较多的行业为主进行分析。
如果是进入金融行业做数据分析,优先考虑上海。其他行业的数据分析,去北京待遇更好。
综合上面的分析,提出以下建议:
1.数据分人员需要掌握一些技能,比如SQL、Python、SPSS等工具。
2.就业城市可以优先考虑去北京,就业机会大、待遇好。
3.应届毕业生、转行人员向自己相关行业转行,以学习经验为主。
4.1-3年工作人员需要提升自身的业务能力及分析能力才能更好的竞争高薪;3-5年的工作经验的人员,在某个领域已经有很深的资历,可以考虑管理岗发展。