本文为我刚转行成功时的一篇复盘,对数据分析感兴趣的同学可以看一下
(文章对应资源已经上传到公众号-人人都会数据分析,也欢迎关注知乎专栏-数据分析师养成(陆续同步到))
刚刚转行成功的我冒昧来回答一下这个问题。
其实从知乎的搜索框中打下“如何快速成为数据分析师”,“怎么转行数据分析师”,“数据分析是干什么的”,诸如这类问题的人,可能很大一部分是零基础、对这一行不甚了解的老铁们。在一个月之前,我也是老铁里的一员,深深了解老铁们痛点,希望快速地了解数据分析师这一份职业,希望能够快速地找到一份数据分析师的工作,或许我的经历可以给你一点启发。
简单介绍下自己的情况,今年7月毕业,毕业,7-9月在一家建筑企业工作,9月2号提出辞职,从提出辞职到成功入职魔都一家互联网工资从事数据分析的工作仅仅花了14天。
没有看错,14天,14天成功转行毫不相关的职业,所以,腿长在自己身上,世界那么大,骚年想去哪,就去哪!!! 别犹豫!!!
废话半天,进入正题,告诉大家如何如何正确地快速地入行。首先必须感谢知乎各路大v给我的启发,有兴趣地也可以去看看人人都是产品经理上的专栏,给我这样的数据新人很多启发。
一、初识数据分析
职业规划以及目标
请自己动手,知乎或者其他搜一下了解一下,你会发现
数据分析主要十分偏业务和偏技术两个方向的
二、心理和思想上的准备
勇气、努力
可能阻挡你不能转行的不是你没有准备好,没有相关学历,没有经验等等这些看似相关的因素,其实只是取决于你的态度。
人的一生,会一直在路上,哪有什么能够准备的尽善尽美的事情,及时行动才是真正的奥义。
下定决心之后就要平时多关注数据,关注互联网,关注大知乎,培养自己的互联网和数据分析的思维,改变自己的固有思维。
另外,不要把转行想的那么难于上青天,对这一行有一个简单大致的了解,掌握一些基础知识,面试好好准备,找一份相关的工作还是很easy的。
答主我自己只是在工作的时候学习了一些统计学知识和excel、sql的基本操作、对python有一个初步的了解,花不了两个星期,更需要认真准备的是你的简历和逆向公司所展现的态度。
三、知识技能储备
A.统计学知识:读一读<深入浅出统计学>,对模型/数学量/分析模型有认识
统计知识对于一个优秀数据分析师就像内功之于武林高手,看不出来,但是却是你武功高强与否的基础,这门内功博大精深,得假以时日不断修炼。不过在入行阶段花大时间修炼吃力不讨好,不妨先了解大概的数理统计概念,深厚的统计内功还得在工作之后不断努力(借助搜索工具是个很好的办法)。
基础概念(重点是怎么得出自己的数据分析结论,客户和老板不需要知道具体数值,他们需要知道的是,这个价格跌了吗?为什么跌了?怎么不让他跌?这些得结合更多的业务知识):
均值、中位数、标准差、方差、概率、加权平均、假设检验、假阳性、假阴性、区别估算、显著性差异、p-value、p1/p25/p50/p75/p99、相关性、因果性、幸存者偏差、大数定律、80/20
这里有一份知乎大佬的解释汇总,我得空之后好好总结给大家https://zhuanlan.zhihu.com/p/24700344?refer=data93
常用的分析模型(结合实际应用,列了一些比较经典的):
1. SWOT分析:战略规划的经典分析工具
S (strengths)是优势、W (weaknesses)是劣势,O (opportunities)是机会、T (threats)是威胁。按照企业竞争战略的完整概念,战略应是一个企业“能够做的”(即组织的强项和弱项)和“可能做的”(即环境的机会和威胁)之间的有机组合。
2.PEST分析:组织外部宏观环境分析工具
PEST分析是指宏观环境的分析,P是政治(politics),E是经济(economy),S是社会(society),T是技术(technology)。在分析一个企业集团所处的背景的时候,通常是通过这四个因素来进行分析企业集团所面临的状况。
3.麦肯锡三层面分析:企业设计战略规划、开拓增长的有效工具
三层面增长理论认为健康的企业增长要综合平衡管理企业的三个层面的业务:第一层面是守卫和拓展核心业务,第二层面是建立即将涌现增长动力的业务,第三层面是创造有生命力的未来业务。
4.4Ps营销组合模型:制定市场战略最经典的营销理论工具
杰罗姆·麦卡锡(E.Jerome McCarthy)于1960年在其《基础营销》(Basic Marketing)一书中第一次将企业的营销要素归结四个基本策略的组合,即著名的“4P’s”理论:产品(Product)、价格(Price)、渠道(Place)、促销(Promotion),由于这四个词的英文字头都是P,再加上策略(Strategy),所以简称为“4P’s”
5.头脑风暴法:激发团队创新的有效决策工具
在群体决策中,由于群体成员心理相互作用影响,易屈于权威或大多数人意见,形成所谓的“群体思维”。群体思维削弱了群体的批判精神和创造力,损害了决策的质量。为了保证群体决策的创造性,提高决策质量,管理上发展了一系列改善群体决策的方法,头脑风暴法是较为典型的一个。
6.5W2H分析法:一种调查研究和思考问题的有效办法
发明者用五个以W开头的英语单词和两个以H开头的英语单词进行设问,发现解决问题的线索,寻找发明思路,进行设计构思,从而搞出新的发明项目,这就叫做5W2H法。
(1) what——是什么?目的是什么?做什么工作?
(2)why——为什么要做?可不可以不做?有没有替代方案?
(3)who——谁?由谁来做?
(4)when—何时?什么时间做?什么时机最适宜?
(5)where——何处?在哪里做?
(6)how——怎么做?如何提高效率?如何实施?方法是什么?
(7)howmuch——多少?做到什么程度?数量如何?质量水平如何?费用产出如何?
7.决策树分析法:现代管理决策者常用的有效工具
决策树分析法是指分析每个决策或事件(即自然状态)时,都引出两个或多个事件和不同的结果,并把这种决策或事件的分支画成图形,这种图形很像一棵树的枝干,故称决策树分析法。
8.STP分析:现代营销战略的核心分析工具
STP即目标市场营销,是指企业根据一定的标准对整体市场进行细分后,从中选择一个或者多个细分市场作为自身的目标市场,并针对目标市场进行市场定位。
推荐书籍:
《深入浅出统计学》《深入浅出数据分析》推荐在找工作之前阅读完这两本。
《女士品茶——20世纪统计学怎样变革了科学》
《统计陷阱》数字是怎样欺骗了你
《统计与真理----怎样运用偶然性》
《统计学的世界》
《爱上统计学》
《漫画统计学》
《社会心理学》戴维·迈尔斯第8版--这本书作为心理学的教材,超经典。毕业前曾认真读了一遍,可以看到心理学与统计学的结合
另外推荐网易公开课上的教程:哈里斯堡社区大学公开课:统计学入门_全24集_网易公开课
B.excel
Excel无疑是数据分析师最常用的工具,就我从事数据分析这段时间来看,初级的数据分析师60%的工作都是与excel有关的,包括对SQL调取出来的数据的处理,从公司的各种管理后来调取,进行初步的分析与图表的制作,包括后期报告的制作都离不开excel。
数据分析师掌握excel,我认为初步入门需要掌握Excel的三项主要功能,与实际工作息息相关。
1.数据透视表(工作和日常运用的神器)
数据透视表 (Pivot Table)是一种交互式的表,可以进行某些计算,如求和与计数等。所进行的计算与数据跟数据透视表中的排列有关。
之所以称为数据透视表,是因为可以动态地改变它们的版面布置,以便按照不同方式分析数据,也可以重新安排行号、列标和页字段。每一次改变版面布置时,数据透视表会立即按照新的布置重新计算数据。另外,如果原始数据发生更改,则可以更新数据透视表。
例如,可以水平或者垂直显示字段值,然后计算每一行或列的合计;也可以将字段值作为行号或列标,在每个行列交汇处计算出各自的数量,然后计算小计和总计。
例如,如果要按季度来分析每个雇员的销售业绩,可以将雇员名称作为列标放在数据透视表的顶端,将季度名称作为行号放在表的左侧,然后对每一个雇员以季度计算销售数量,放在每个行和列的交汇处。
2.各种函数,实用的有 sumifs函数,vlookup函数,其他更多的函数可以在实际运用中去搜索引擎寻找,这里先介绍这两种。
sumifs:sumif函数语法是:SUMIF(range,criteria,sum_range)
sumif函数的参数如下:
第一个参数:Range为条件区域,用于条件判断的单元格区域。
第二个参数:Criteria是求和条件,由数字、逻辑表达式等组成的判定条件。
第三个参数:Sum_range 为实际求和区域,需要求和的单元格、区域或引用。
当省略第三个参数时,则条件区域就是实际求和区域。
criteria 参数中使用通配符(包括问号 (?) 和星号 (*))。问号匹配任意单个字符;星号匹配任意一串字符。如果要查找实际的问号或星号,请在该字符前键入波形符 (~)。
excel sumif函数的实例介绍
实例:求报表中各栏目的总流量
结果如下图所示。
选中F2单元格,输入公式:=SUMIF(B2:B19,E2,C2:C19),输入公式完成后,直接按enter键,即可统计出办公软件栏目的总流量。
以此类推,选中F3单元格,输入公式:=SUMIF(B2:B19,E3,C2:C19),输入公式完成后,直接按enter键,可以求得网站
运营栏目的总流量。
选中F4单元格,输入公式:=SUMIF(B2:B19,E4,C2:C19),可以求得电脑医院栏目的总流量。
选中F5单元格,输入公式:=SUMIF(B2:B19,E5,C2:C19),可以求得工具软件栏目的总流量。
选中F6单元格,输入公式:=SUMIF(B2:B19,E6,C2:C19),可以求得网络安全栏目的总流量。
vlookup:
VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
Lookup_value为需要在数据表第一列中进行查找的数值。Lookup_value 可以为数值、引用或文本字符串。当vlookup函数第一参数省略查找值时,表示用0查找。
Table_array为需要在其中查找数据的数据表。使用对区域或区域名称的引用。
col_index_num为table_array 中查找数据的数据列序号。col_index_num 为 1 时,返回 table_array 第一列的数值,col_index_num 为 2 时,返回 table_array 第二列的数值,以此类推。如果 col_index_num 小于1,函数 VLOOKUP 返回错误值 #VALUE!;如果 col_index_num 大于 table_array 的列数,函数 VLOOKUP 返回错误值#REF!。
Range_lookup为一逻辑值,指明函数 VLOOKUP 查找时是精确匹配,还是近似匹配。如果为false或0 ,则返回精确匹配,如果找不到,则返回错误值 #N/A。如果 range_lookup 为TRUE或1,函数 VLOOKUP 将查找近似匹配值,也就是说,如果找不到精确匹配值,则返回小于 lookup_value 的最大数值。如果range_lookup 省略,则默认为近似匹配。
3.图表的制作,excel图表制作(推荐把谁说菜鸟不会数据分析里的各种图表都实操一下)
推荐资源: 《谁说菜鸟不会数据分析》
excel论坛:excelhome Excel教程学习,Excel表格交流,Excel技巧培训教程下载-ExcelHome技术论坛 - 超多干货
C.SQL
学习SQl和学习统计学知识一样,都要记住,它们是工具/理论,最终都是要应用于实践,为业务服务,所以开始入行不需要了解的太深,了解基础知识即可。
那么SQL是干嘛的?
要知道,作为一名数据分析是,主要的工作是分为两部分的,一部分是分析数据,另一部分就是提取数据,满足各个部门的需求。产品经理会找你要新上线功能的点击率,跳出率,下载转化率,广告部门惠找你要部分特定用户的imei、手机号等各种各样的信息。这些就是需求,满足需求就是你的工作,也就是数据分析,工作的工具就是SQL,编写各种SQL语言在数据库里提取满足条件的数据并整理分析。
所以首先,你得了解数据库的概念:
数据库基础知识复习
在了解数据库之后可以学习基本的sql语言了。
这个图就是最常见的一个sql语句,其实认真看一下,其中的语言并不难理解,大致的意思就是选取满足我给定要求的原始数据,稍稍了解一下sql的各种语句,学习安装一下常用的数据库管理软件,很快就能够上手。
平时工--作用到的语句主要有:
检索数据(Select语句)
排序数据(Order by语句)
过滤数据(Where语句)
汇总数据(Group by语句)
联结数据(Join语句)
在学习的时候着重这几个语言的应用,90%的需求都是可以解决的。
其他的参考书籍和网站,在工作需要的时候查一下就行了。没有基础的人,在三四天集中学习之下也能迅速上手。
推荐书籍及资源:
《数据库原理》 (选读)
《MySQL必知必会》(找工作之前请看一遍)
常用的查询网站:https://www.w3cschool.cn/sql/
《SQL沉思录》提升期可以一读
《SQL编程风格》
《SQL权威指南》
D.python:基本了解即可,后期视工作需要是否继续学习
四、业务知识储备
行业的运营指标,请自己动手查询,比如app的运营指标,电商运营指标
五、求职
根据职业规划定下方向:
我个人找的方向是偏业务方面的数据分析师
职位:数据分析师、数据运营、商业分析
做一份行业的数据分析报告、公司产品体验报告(展现态度),可能更加考虑的是你的可塑性和思维
第一次很认真地写文章,还有很多没写好,晚上回去继续码字,不断补充
如有不足,请君指出。
手机辛苦码字,也望大家给个赞。
另外我的一些学习资料均放在了
公众号:人人都会数据分析
需要自取。