前言
笔者从去年5月份下定决心离开汽车制造行业,6月份开始学习Udacity的DAND(Data Analysis Nano Degree, 数据分析纳米学位)课程至今。历经10个月挑灯苦读和1个月四处碰壁,终于在近期收货两个offer,正式开始自己数据分析师的生涯。回望这段时间,一把心酸、两处失落、几多彷徨、些许苦闷,凡此种种不足与外人道。不过终究实现了职业生涯上一次重要的转变。我把这个过程中所思、所想、经验和教训,做一个简单的梳理,希望能够给同样正在准备转行数据分析的小伙伴,提供一些微不足道的帮助。
不要等到一切就绪再找工作
虽然这篇文章的核心是讲准备,但这里要给大家的第一个建议是,不要试图等到一切准备就绪再找工作。相信一定有小伙伴跟笔者曾经一样,希望能够完成数据分析课程的学习,对数据分析的知识掌握的比较熟练之后再开始找工作。但是,这个想法是不对的。
首先,数据分析是一个涉及知识面很广的职业方向,数学基础、分析思维、python、R、数据库、大数据处理框架、数据可视化等等,这每一个方面展开来说都是一个非常庞大的课程体系,没有人敢断言自己能在所有这些方面有“充分”的了解,事实上这也是不必要的。即使对于工作经验非常丰富的数据分析师来说,依然会有许多知识和技能是欠缺的,是需要持续充电的,但是这并不妨碍他们可以成为一名合格的甚至是优秀的数据分析师。
其次,每年的3、4月份正是各大企业招聘的黄金时期,在这个时候会涌现出大量的岗位需求,包括数据分析师。并且,由于需求的突然涌现,一般都会带来一定程度的供不应求的状态,企业也会根据需求的紧急程度来适当调整入职门槛。这对于准备转行的小伙伴们来说,是个非常好的切入时机。 所以,当下,立刻,开始尝试去找一份数据分析的工作!
什么条件下比较有把握找到工作?
虽然说不要等到一切就绪再找工作,但如果能提前做好一些准备必然能大大提高job hunting的命中率。毕竟,机会是给有准备的人。我主要从知识积累和求职准备两个方面来说。
知识积累
相信大多数准备转行的小伙伴都已经通过各种途径、方法开始自己的学习,也一定会发现,数据分析这个职业方向根本是个“巨坑”,需要掌握的知识技能简直数不胜数。对于新手来说,面对诸多需要学习的内容很容易出现遥遥无期的无力感,或者迷失在知识的海洋中,渐渐偏离了自己的初衷。
笔者结合自身的学习、面试经验做了一个整理,对于新手来说,掌握以下知识/技能,就足以找到一份初阶的数据分析师(注意,不是数据专员,这两者是有区别的,找工作的小伙伴切记仔细分辨)的工作:统计基础;
分析理论
Excel
SQL
R
Python
仅仅知道要学什么是不够的,还需要知道学到什么程度才是合适的,这其实才是广大新手村小伙伴最大的困惑!按照笔者的看法,以上每项技能/知识应当掌握的程度如下:
我把每个技能的熟练程度划分为5个等级,依次分别是:1、了解基本概念;2、知道基本理论/会简单操作;3、熟知原理/熟练操作;4、数学、逻辑论证/灵活应用;5、精通、专家/能改进、优化。对于入门者来说,上面这几个知识领域大多只需要掌握2-3的熟练程度即可。
统计基础是每个人都必须掌握的,自然是学的越深入越好,不过对于基础比较差的伙伴来说,也不必太过苛求,大约掌握信息图形化、条件概率、贝叶斯公式、相关与独立、几何分布、二项分布、泊松分布、正态分布、统计抽样、估计、置信区间、假设检验这些,就差不多了。《深入浅出统计学》是一本不错的入门书,但是仅有这一本是不够的,请务必找一本更具严谨性和系统性的教材结合使用。
分析理论也是个绕不开的问题,尤其对于很多自学的伙伴来说,这一块可能比较容易疏忽。笔者作为新手,对这部分内容其实也不熟悉,能给出的建议不多。这里只推荐一篇文章,总结的比较精炼:数据分析中有哪些常见的数据模型? - 知乎 (李启方的回答)
大多数企业的内部数据存储在传统的关系型数据库中,作为分析师不可避免的要和数据库打交道,那么SQL是数据分析必备的技能了。好在SQL语言本身非常的简单易学。笔者认为只要会写简单的查询、存储过程就可以了,推荐大家买一本《SQL必知必会》放在手边,随时翻看。
R语言和Python语言应该是当前数据分析领域的双雄了,R语言支持者众多,相关库包极为丰富;Python则胜在灵活易用,通用性更加广泛。在网上,关于这两种语言的争论也从未止息。笔者建议初学者要对这两种语言都有所了解,但选择其中一项作为自己的主力语言。对于R语言来说,学会其命令行用法、掌握基本的数据分析库包(tidyr,dplyr,ggplot2)即可;对于Python语言,需要掌握其基本语法、函数和相关库包(numpy, pandas, matplotlib, sklearn)。
可能很多伙伴(包括笔者在内)经过一段时间学习以后,会对Excel这样一个工具不屑一顾,认为这是个非常低端的工具,完全不如R或者Python一般酷炫。但其实完全不该有此想法。笔者曾爬取拉钩网上数据分析这个岗位的信息并做过统计分析,在整个就业市场上,数据分析岗位对Excel技能的需求量非常之大,见下图:
可以看到,除了SQL之外,Excel是数据分析岗位要求频率最高的技能。好在,这个神器其实是非常简单易学的,并且网络上存在海量的各种教程和教材,随处可得。笔者认为只要学会常见函数的使用、各类基础图表的制作以及数据透视就能满足大部分需求。推荐大家买一本《谁说菜鸟不懂数据分析》放在手边,学习疲惫之余拿出来当故事书看看。
机器学习这一块其实应该算是数据分析岗位的加分项,不一定是必须的,看具体岗位。但是现在越来越多公司的数据分析岗要求对机器学习有一定的认知,笔者认为,关于机器学习算法,能够熟悉常见算法的基本原理、了解其用途和优缺点即可。比如:分类算法里的贝叶斯、决策树、随机森林;回归算法里的线性回归、Adaboost回归;聚类算法里的K-means算法等。另外了解一下用于降维的PCA等。
以上就是笔者认为做为初阶的数据分析师大概需要的知识储备,这些仅是个人经验,不是普适的标准。每个人的情况不同,每个岗位的情况需求也不同,大家还是需要根据自己的实际情况来认真思考,安排好自己的学习方向和计划。
求职准备
除了知识积累之外,求职前的准备也非常重要,可以说是最关键的部分。主要包括:项目经历,简历准备,心态准备。
先说说项目经历吧。当前几乎所有企业招聘时都要求有相关工作经验,而这个是转行的小伙伴们的死穴,简直无解。为了让HR相信我们能够胜任这份工作,我们必须拿出充分的证据来,在没有相关工作经验的前提下,找一些可以个人完成的项目来做就是唯一的选择了。
准备两到三个实际项目,能够极大的提高HR对你的兴趣,从而提高面试频率和通过概率。拿笔主自己来说,在找工作之前完成了两个实际的项目并形成了报告,其中一个项目被Udacity的知乎账号付费转载(可见:数据分析师挣多少钱?“黑”了招聘网站告诉你!)。正是在这个项目中很好的体现了数据分析的基本技能、方法和思路,所以吸引了HR的注意,并且最终打动了面试官。所以,在找工作之前准备几个实际的项目经验,对提高成功率帮助很大。
项目的来源很多,可以是工作中遇到的实际问题,也可以是学习过程中的练习作品,还可以是从类似于Kaggle这样的竞赛网站上找来的课题。当然,项目本身越靠近实际工作越好,这样会比较接地气。笔主当时工作方向和数据分析几乎没有关系,所以找了些自己感兴趣的问题和学习中的练习作品写入简历,当时打动面试官的项目是:拉勾网数据分析岗位分析。面试官坦言这个项目做的很接地气,而且虽然没有相关分析经验,但是从项目中能看出分析思路是非常成熟清晰的,很不错。
简历准备
写简历的重要性就不言而喻了。一直以来,怎样算是一份好简历,如何写好一份好简历,都是HR和所有求职者津津乐道的话题。笔者这一块其实并没太多经验,也曾因为丑陋的简历而屡屡碰壁。幸而偶然中认识同样转行的小伙伴@凌岸 ,他介绍我去看陈文老师的求职攻略课程,并且非常耐心的指导我该如何改简历。当晚我就对简历进行了一次大改。从自己实际的体验来看,简历修改之前,投了数百份简历,可是面试邀请寥寥无几。简历修改之后的第二天,投了16份简历,就收到了3个面试邀约,前后的差异之大简直震撼。所以,简历准备这块不展开讲了,建议大家去听听看陈文老师的课程:求职必胜,提升面试成功率靠谱攻略 - 天善智能-商业智能和大数据在线社区,用心创造价值
心态准备
其实,心态的准备并不仅仅是求职前的工作,对于要转行的小伙伴来说,这其实从下定决心的那一刻就已经开始了。
对于很多小伙伴来说,心态上最大的障碍可能是怀疑。放弃原行业数年的工作经验是否值得?数据分析的职业前景到底如何?面对数据分析庞大的知识系统,自己是否真的可以掌握并找到工作?凡此种种。这些想法如同心魔一般时涌时现,挥之不去抹之不平,不断的在动摇我们转行的决心和学习的信念。
笔者也曾无数次的摇摆不定,也曾一遍遍的质疑自己转行的决定,也曾怀疑自己对未来的判断。直到最终找到了工作,方才松了一口气,诸般心魔渐渐散去。其实秘诀只有一条:坚持。行动上坚持,心态上接纳。没有人能够对未来有明确的判断,人每一次的选择都不可能保证是对的,所以产生疑虑是非常正常的。要学会和疑虑共处,在杂念丛生的同时,持续学习和改变。有一个理念非常关键,那就是要坚信:主动拥抱变化,永远比被动接受变化更有意义。不管是因为什么决定转行,都一定是对原先的工作不满,带着不满的工作势必无法长久也很难提高。与其在不满的岗位上空耗下去,白白蹉跎了时光,不如果断转身给自己一个新的开始。
心态上的第二个障碍,可能是气馁。当学习进入瓶颈、当项目毫无头绪、当找工作处处碰壁的时候,挫败和气馁的情绪便会油然而现,慢慢的打磨我们的斗志,消磨信心。这个时候,学会对自己宽容是非常重要的。要明白,自己不是天才,在学习中遇到困难、找工作时被拒绝、甚至被HR轻视和刁难都是非常正常的。这是我们选择改变所必然要面对的情景。这并不意味着自己不行,不代表自己不合适,相反,这些都是提高和改进的机会。另外可以想一想,很多统计学、数学、计算机科学专业的学生,大学经过4年的学习之后还要经过残酷的竞争才能找到一份数据分析师的工作。而对于转行的同学来说,大多数人可能计划在1年之内完成知识的积累并找到工作。我们期望用更短的时间实现相同的工作目标,自然会遇到更多的困难和更大的挫折。而如果能够克服困难挺过去,不是说明我们可能比职业选手更厉害吗?不是吗?
最后要说说耐心。有句老话叫:尽人事,听天命。运气这种东西确实时常捉弄人,飘摇不定无法把握。所以可能即便准备的非常充分,还是找不到工作。这时候未必是自己出了问题,可能仅仅是命运女神还没有眷顾。对自己多点耐心,保持乐观、保持信心,随时准备好应对面试、应对HR的挑战。即便单从概率来算,好运气也迟早会光顾的。这里改一句话:机会是给所有人的,提前做好准备,你就比别人更容易抓到它。
结语
人生就是一连串的选择,年纪越大,每一步的选择就越困难。但是不管在任何阶段,敢于改变、敢于突破自己的人都是值得敬佩的。我相信所有有勇气、有毅力做出改变的人,都比别人有更多成功的可能。祝愿所有准备转行的伙伴都有好运气,也祝愿所有已经转行成功的伙伴迅速成长。
书单
评论区有的伙伴想要完整的书单,我简单列一下我自己使用的感觉比较好的书:统计基础:《深入浅出统计学》、《商务与经济统计(第12版)》
分析理论和Excel:《谁说菜鸟不会数据分析》
SQL:《SQL必知必会》还有MySQL的官方教程
R语言:《Learning R》、《R语言实战》
Python语言:随便一本入门教材 + 《利用Python进行数据分析》、《Python科学计算》。Python除了最基本的语法和数据结构之外,最重要的是Numpy, Pandas, matplotlib, Seaborn, scikit-learn这几个库包。看书只能了解一小部分,更多的是要读官方文档。
除此以外,强烈推荐Udacity的数据分析师纳米学位课程。以跟随教程学习为主,看书补充为辅,这样的话不用把每本书从头到尾全部看完,对于新手来说可以节约大量时间。另外,课程中本身带有7个项目,可以用来练习,也可以作为项目经验写进简历。尤其是P5的项目,本身就来源于实际项目,非常好。
PS:今天一觉醒来,发现点赞数居然过百了!作为一个知乎小透明,第一篇文章能收获如此多的赞同,笔者感到万分惊喜呀!谢谢各位小伙伴对我的认可!希望我的文章能给大家一点点微不足道的帮助!从大家点赞的热情来看,想要转行数据分析的小伙伴群体确实很庞大呀!笔者打算开辟一个专栏,陆续分享自己的学习和成长经验。笔者不是大牛,给不出高屋建瓴的指导性意见,但是作为一个半只脚踏进门槛的菜鸟新人,还是可以跟大家分享一下学习中的经验、教训,还有一些笔者自己跳过的坑。希望能帮助大家绕过一些坑,分享一些小的技巧,给大家的学习带来一点点小小的帮助。有兴趣的伙伴可以持续关注~
再次祝大家学习顺利、转行顺利~
PPS:都看到这儿了,顺手点个赞呗?
其他相关文章:BigCarrey:数据分析师必修课(1)——数据质量评估zhuanlan.zhihu.com