作为办公一族,经常和报表打交道。日、周、月、季、年报等报表是工作日常。马上六月份结束,又要进行2018年上半年的总结,如何才能提供领导最有效的数据,通过数据能够了解现状,问题的原因分析以及对未来发展的预测,让数据驱动公司业务发展,体现自己的工作价值?为了提高自己的工作能力,看了数据分析的入门书《谁说菜鸟不会数据分析(入门篇)》,非常适合经常使用Excel的办公人员,内容深入浅出,用师徒对话的形式讲解,经常用美食和服装类比数据分析,形象生动,便于理解。
全书按数据分析的工作流程顺序编写的,数据分析分为六个步骤,明确分析目的并将思路结构化,然后收集数据,处理数据,分析数据,将分析数据展现出来,最后撰写数据分析报告。因为书中用到的主要分析工具是Excel,对于数据透视表和图表制作都比较熟练的工作人员,会大大提高本书的阅读速度,对于从事营销,财务,人力资源岗位的人提高职业竞争力有一定帮助。
《谁说菜鸟不会数据分析》是由张文霖、刘夏璐、狄松三位作者合作编写的,其中张文霖的新浪博客“小蚊子数据分析”,里面很多相关知识和小工具,可以进行扩展学习。在他的博客首页看到了网络爬虫的免费课,等写完这篇文字就去学一下,因为目前网络上收集数据最流行的是爬虫技术。
一、数据分析的目的和思路
首先明确数据分析方法论、分析工具、分析技术的区别,举例说明,数据分析的方法论包括5W2H、4P、逻辑树等分析思路;使用的分析工具有Excel、SPSS、SAS等;数据分析的技术有交叉分析、相关分析、回归分析、聚类分析等等。
根据不同的分析目的,选择不同的分析方法。例如,营销分析常使用的方法有4P、用户使用行为、STP理论、SWOT;用于管理分析常用的有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等。
以下是几种常用的分析模型的介绍:
▶ PEST分析法
PEST用于宏观环境的分析,主要应用于行业分析,四个字母分别代表Political政治,Economic经济,Technological技术,Social社会,分析外部因素对企业的影响。政治环境包括国家的社会制度,执政党的性质,政府的方针政策;经济环境包括宏观的国民收入,生产总值,以及微观的企业所在地的消费者消费能力,消费偏好,储蓄情况和就业程度等;技术环境包括国家对科技开发的支持重点,技术转移和技术商品化的速度,专利个数及专利保护情况等;社会环境包括国家或地区的人民受教育程度,宗教,风俗,人口规模,性别比例,年龄结构等。
▶5W2H分析法
5W2H分析法应用范围广,可用于用户行为分析,业务问题专题分析等。
5W:Why、What、Who、When、Where
2H: How、 How much
举例,对用户购买行为的分析:
Why(何因):用户购买目的是什么?产品为什么吸引顾客?
What(何事):公司提供什么产品或服务?用户需求是什么?
Who(何人):谁是我们的客户?我们的客户有何特点?
When(何时):何时购买?重复购买时间?
Where(何地):客户在哪里购买?线上线下?客户分布地区在哪?
How(如何做):客户的支付方式是什么?
How much(何价):客户购买花费的时间是多少?交通等购买成本是多少?
▶逻辑树分析法
逻辑树又叫做问题数,演绎树,分解树等,是业务问题、专题分析时最常用的模型。从最高层问题开始,将所有子问题分层向下罗列。
逻辑树要遵守的三个原则:
1、要素化:归纳相同问题成为要素
2、框架化:将各个要素组织结构化,不重复不疏漏
3、关联化:框架内各个要素之间保持相互关联,不独立存在
▶4P营销理论
4P理论主要应用于公司整体经营情况的分析,4P是指Product产品、Price价格、Place渠道、Promotion促销。
举例,公司业务分析:
Product产品:提高什么产品或服务?哪种产品销量最好?与用户需求是否一致?
Price价格:公司销售收入怎样?增长还是减少?用户接受的合理价格是多少?支付方式是什么?
Place渠道:公司在各地区有多少销售渠道?覆盖率如何?用户通过何种渠道购买?公司的渠道政策是否有吸引力?
Promotion促销:投入促销的资源是多少?效果如何?投放多少宣称广告?效果如何?
此外还有用户行为理论,金字塔法,生命周期等,分析法之间可以嵌套使用,组合分析法得出更详尽准确的分析结果。
二、数据收集与来源
数据主要由导入外部数据和自己录入数据两方面来源。一张数据表的制作可以反映出制作者对数据分析的认知水平,如果一张数据表有多处合并单元格,只为了阅读体验满足当下所需,就没有为数据经过时间沉淀后进行数据分析的远见。以下是在Excel里的操作,一个合格的数据表应该满足的条件:数据表由标题行和数据两部分组成,第一行是标题行,第二行起是数据,数据部分不应该有空白行或列,数据表中不能有合并单元格,也就是说,数据表是以一维形式存在,如下图:
三、数据处理
数据处理包括数据清洗,加工和抽样。数据加工使用到的Excel技巧有字段的分列,合并,字段匹配或分组(vlookup函数)等,数据抽样使用的是rand()函数,这里只记录我在工作中需要用到的数据清洗的内容。数据清洗是为了使数据简洁、完整、正确。清除掉重复数据,填充缺失的数据,检测有逻辑错误的数据。
清除重复数据书中介绍了函数法(countif函数)、高级筛选法、条件格式法、数据透视表法、删除重复项等方法,高级筛选法和删除重复项是我工作中需要用到的方法,记录如下。
高级筛选法:选择区域范围,数据选项卡下,排序和筛选的高级选项,“将筛选结果复制到其他位置”,勾选“选择不重复的记录”,OK。
删除重复项:菜单操作,选择范围,数据选项卡,数据工具,删除重复项
当数据缺失10%以下的时候,可以接受数据,进行缺失处理。处理缺失值有四种方法:
1、 用样本平均值
2、 用回归模型、判别模型等统计模型算出来的值去替代,需要专业分析软件
3、 删除缺失值,使样本数量减少
4、 保留缺失值,在分析中排除
填充空白单元格的方法:先定位空白单元格,F5键,定位条件,空值,填充缺失值,按Ctrl+Enter一次性输入空白单元格。
当缺失值是错误符形式存在时,使用查找替换功能。Ctrl+F查找,Ctrl+H 替换,Ctrl+G 定位。
当数据存在逻辑错误时,使用IF函数检查错误(略),或使用条件格式检查错误。在条件格式选项选择其他规则,输入=OR(B2=1,B2=0)=FALSE,意为B2既不是1也不是0时突出显示单元格。
四、数据分析
数据分析的作用是对现状的分析,原因的分析以及预测分析。现状分析对应的基本方法是对比法,原因分析对应的基本方法是细分法,如下图
●工作中常用到的分析法:
▶对比分析法
对比分析分为静态比较和动态比较两类,静态比较也是横向比较,同一时期,不同部门、单位、地区、国家等之间的比较,动态比较是纵向比较,不同时期同一部门、单位、地区、国家之间的比较。对比分析可用总量,相对数,平均数做比较。与去年同期叫同比,与上个月对比称环比。
▶分组分析法
通常与对比法结合使用,分组目的是为了方便对比。分组分析的关键是确定组数与组距。数据分组中,一个组的最小值是下限,最大值是上限,上下限的差为组距,上下限的平均数为组中值。各单位数据变动均匀,适用等距分组,变动不均匀,用不等距分组。
分组步骤:
1、确定组数
2、确定组距,组距=(最大值-最小值)/组数
3、分组汇总分析
▶矩阵关联分析法
也称象限图分析法,非常强大实用的分析工具,提供给决策者非常重要的参考依据,直观简洁有力。如下图(图片来源网络)
●数据分析工具
当然是Excel中的数据透视表工具啦!前面要求数据表是一维数据表,不能合并单元格,都是为了可以使用数据透视表的功能。数据透视表的一般功能这里就不说了,在《谁说菜鸟不会数据分析》中,有个数据透视表运算的知识点,之前工作中没用到过,在此记录一下,非常实用。
在数据透视表上右键,值显示方式,列汇总的百分比,或者其他需要的计算选项,如图,将箱数求和项显示为占比。
五、数据展现
将分析结果用图表的形式展现出来,表格展现数据时可以使用条件格式,突出显示单元格,也可使用迷你图(插入菜单下的迷你图)展示数据。书中介绍了不同分析图的制作方法,其中有些美化分析图的原则,非常受启发,使用之后可以提升图表的专业感和阅读体验。美化图表是围绕简约、整洁、对比的原则进行的。图表的配色谨慎使用红黄绿色,因为红黄绿的颜色具有指示作用,禁止,警告和正确的含义。
1、 去掉不必要的背景填充
2、 去掉无意义的颜色分类
3、 去掉装饰性的渐变色、图片
4、 去掉网格线,边框
5、 删除不必要的图例、坐标轴,不使用倾斜标签
6、 以上不能去掉的元素尽量淡化
7、 数字和英文使用Arial字体
8、 突出需要强调的数据元素(颜色突出,箭头标注,饼图的缺口)
六、数据分析报告
数据分析报告要规范,数据指标要关键指标,数据要谨慎,分析和展现要创新。分析报告分为专题分析报告,综合分析报告和日常数据的通报。
日常报告的特点是进度性、具有规范结构和时效性。规范的结构包括,反映计划执行的基本情况,分析完成、未完成的原因,总结成绩、经验,找出存在的问题,突出措施、建议。
数据分析报告是“总分总”的结构,开篇包括标题页、目录、前言(分析背景、目的、思路),正文为具体分析过程与结果,结尾要有结论,建议,也可加附录(参考资料,数据来源,专业名称解释等,每个内容要对应编号)。
在实际工作中具体问题要具体分析,一定要深刻理解业务,才能完成基于业务的分析。
一边读《谁说菜鸟不会数据分析》,一边跟着操作演练,开拓了数据分析的思路,规范化了数据录入,为日常的报表提供了更详实的依据,生成报表的过程通过数据透视表也更加有效率,分析角度更多元,使报表更加立体全面,等不及要到七月初提供给领导一份改进的数据分析报告!