如何成为一名数据分析师,并不像如何成为一名程序员那么有章可循。高校都没有专门的数据分析专业,有的也是传统统计学范畴的。
很多人都不是很了解数据分析究竟该学些什么,那么我们如何通过学习数据分析来改变自己的职业道路,改变自己的人生呢?
首先我们先看一个故事:
一、对数据分析师的误解
直到做数据分析师五、六年了,每每和家人朋友聊天,都还是会有人不懂我在做什么。
家人:“数据分析?分析什么东西?”
我:“哪里有数据,哪里就有我们,什么都可以分析。”
家人:“是软件工程师吗?会编程吗?”
我:“...不是,不太会。”
家人:“那是管理层吗?”
我:“还...还不到级别。”
家人:“那是商务人员?做市场或销售。”
我:“...也不是,不过我们辅助他们作决策。”
家人:“决策不都是老板说了算吗?你们到底做什么?”
我:“......来,我去给您加点水。”
除了家人朋友,很多时候,同公司内部的人也会比较困惑,数据分析师究竟是做什么的。收集数据、整理数据表、做各种报表、写 ppt、做挖掘模型、打小报告......每个人的理解都不一样。
“小陈,你能给我发一个去年一年的xx页面的访问量吗?最好是以国家,行业,公司规模作为纬度的,浏览量和 UV 都要。”在数据分析师眼中,这样的场景早已司空见惯。
由于我们对 SQL 等数据工具轻车熟路,很多部门就会直接找我们要数据,但并不会说清楚前因后果。这样不仅浪费分析师时间,也并不能解决业务人员的需求。
数据分析,被很多部门漏看了“分析”二字。
二、数据分析师的正确姿势
数据分析师的正确姿势应该是什么样?
互联网公司的优势在于,运营过程中产生大量数据,这些数据可以通过一些手段转化为决策的动力。数据分析师,就是这其中的结合点。
产品,营销,销售等部门,都会有不同的需求。
例如:
产品经理最关心的,是 A/B 测试的数据,用以决定产品的效果;
营销团队,在乎营销渠道反馈与结果的数据,以便设计下一个营销战略;
销售,关心客户的购买率,保留,以及追加销售时机等。
三、一个合格的数据分析师要有怎样的知识体系?
统计相关的数学知识
数学知识是数据分析师的基础知识。
对于初级数据分析师,了解一些描述统计相关的基础内容,有一定的公式计算能力即可,了解常用统计模型算法则是加分。
对于高级数据分析师,统计模型相关知识是必备能力,线性代数(主要是矩阵计算相关知识)最好也有一定的了解。
而对于数据挖掘工程师,除了统计学以外,各类算法也需要熟练使用,对数学的要求是最高的。
趁手的工具
对于初级数据分析师,玩转Excel是必须的,数据透视表和公式使用必须熟练,VBA是加分。另外,还要学会一个统计分析工具,SPSS作为入门是比较好的;如果,能熟练使用一款数据可视化工具(例:Power BI)就更好了。
对于高级数据分析师,使用分析工具是核心能力,VBA基本必备,SPSS/SAS/R至少要熟练使用其中之一,其他分析工具(如Matlab)视情况而定。
对于数据挖掘工程师……嗯,会用用Excel就行了,主要工作要靠写代码来解决呢。
业务理解能力
业务理解说是数据分析师所有工作的基础也不为过,数据的获取方案、指标的选取、乃至最终结论的洞察,都依赖于数据分析师对业务本身的理解。
对于初级数据分析师,主要工作是提取数据和做一些简单图表,以及少量的洞察结论,拥有对业务的基本了解就可以。
对于高级数据分析师,需要对业务有较为深入的了解,能够基于数据,提炼出有效观点,对实际业务能有所帮助。
对于数据挖掘工程师,对业务有基本了解就可以,重点还是需要放在发挥自己的技术能力上。
逻辑思维
理工男都具有的思维。
对于初级数据分析师,逻辑思维主要体现在数据分析过程中每一步都有目的性,知道自己需要用什么样的手段,达到什么样的目标。
对于高级数据分析师,逻辑思维主要体现在搭建完整有效的分析框架,了解分析对象之间的关联关系,清楚每一个指标变化的前因后果,会给业务带来的影响。
对于数据挖掘工程师,逻辑思维除了体现在和业务相关的分析工作上,还包括算法逻辑,程序逻辑等,所以对逻辑思维的要求也是最高的。
大数据可视化工具
数据可视化说起来很高大上,其实包括的范围很广,做个PPT里边放上数据图表也可以算是数据可视化,所以我认为这是一项普遍需要的能力。
对于初级数据分析师,能用Excel和PPT做出基本的图表和报告,能清楚的展示数据,就达到目标了。
对于高级数据分析师,需要探寻更好的数据可视化方法,使用更有效的数据可视化工具,如可视化工具tableau,根据实际需求做出或简单或复杂,但适合受众观看的数据可视化内容。
对于数据挖掘工程师,了解一些数据可视化工具是有必要的,也要根据需求做一些复杂的可视化图表,但通常不需要考虑太多美化的问题。
协调沟通
不是业务,胜似业务!
对于初级数据分析师,了解业务、寻找数据、讲解报告,都需要和不同部门的人打交道,因此沟通能力很重要。
对于高级数据分析师,需要开始独立带项目,或者和产品做一些合作,因此除了沟通能力以外,还需要一些项目协调能力。
对于数据挖掘工程师,和人沟通技术方面内容偏多,业务方面相对少一些,对沟通协调的要求也相对低一些。
除此之外,还需要掌握基本的数据分析思路、方法、工具、应用相关知识,明悦数据旗下的马达金牌课就是一门数据分析师全体系培养课程。
通篇看下来,做一名合格的数据分析师真的是相当不容易(吓退一批学渣),行业人才紧缺和待遇之高也是可想而知,有媒体报道,在美国,数据分析师平均每年薪酬高达17.5万美元,而国内顶尖互联网公司,薪酬也要比同级别其他职位高20%-30%,而且颇受企业重视。所以,同学们努力吧,也许未来你就是那个穿梭在大城市最高端CBD的顶尖级数据分析师。