//读书总结
数据分析那些事:
1.什么是数据分析以及数据分析的三大作用
2.数据分析的六部曲:首先是明确分析目的和思路,然后是数据收集,第三步是将收集回来的数据进行处理,第四步是根据分析出的结果通过图表的方式展现出来,最后一步是撰写数据分析报告。
3.认识常见的数据分析误区,明白数据分析师的要求和基本素质,了解如何成为一个合格的数据分析师
4.数据分析中经常用到的指标和术语,除掌握最基本的平均数、百分比等概念以外,还需要将容易混淆的指标进行明确区分,避免在以后阐述分析结果时出现错误。
-->数据分析心法:
(1)学习:先了解,后深入;先记录,后记忆;先理论,后实践;先模仿,后创新;
(2)方法:先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手;
(3)分析:先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议;
下面进行详细讲述://入门
1.数据分析是干什么的,具体要怎么做?
简单来说,数据分析就是对数据进行分析;专业说法,数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化的开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
数据也称观测值,是通过实验、测量、观察、调查等方式获取的结果,常常以数量的形式展现出来。
数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。
数据分析类别:
· (1)验证性数据分析侧重于验证已有假设的真伪证明。
· (2)探索性数据分析侧重于在数据之中发现新的特征,属于高级数据分析,常见的分析方法有相关分析、因子分析、回归分析等。
· (3)描述性数据分析,即常用的初级数据分析,常见的分析方法有对比分析法、平均分析法、交叉分析法等。
2.数据分析的作用?
日常工作中做的日常通报、专题分析等,都是数据分析具体工作的体现,要对数据分析的目的及工作有清晰的认识,才能更好的开展数据分析。
-->在企业的日常经营分析中,数据分析主要有三大作用:
· (1)现状分析:一般通过日常通报(日报、周报等)来完成,告诉你过去发生了什么。
第一,告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明企业整体运营是好了还是坏了,好的程度如何,坏的程度又到哪里。 第二,告诉你企业各项业务的构成,让你了解企业各项业务的发展及变动情况,对企业运营状况有更深的了解。
·(2)原因分析:一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析,告诉你某一现状为 什么发生。
第一阶段现状分析后,对企业的运营情况有了基本了解,但不知道运营情况具体好在哪里,差在哪里,是什么原因引起的,这就需要开展原因分析,以进一步确定业 务变动 的具体原因。
·(3) 预测分析:一般通过专题分析来完成,通过在制订企业季度、年度等计划时进行,告诉你将来会发生什么。
在了解企业运营现状后,有时还需要对企业未来发展趋势作出预测,为制订企业运营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。
3.数据分析六部曲:
如何开展数据分析工作?-----主要包括6个既相对独立又互有联系的阶段。分别是:明确分析目的和思路、数据收集、数据处理、数据分析、数据展现、报告撰写等六部。
(1)明确分析目的:在开展数据分析之前,要想想为什么要开展数据分析?通过这次数据分析要解决什么问题?以明确数据分析的目标为前提。
菜鸟与数据分析师的最主要区别就在于目的是否明确。数据分析师的目标就很明确,一切都是以解决问题为中心,会思考这张图是否能有效的表达观点,如果没有,需要怎样调整,而不会像菜鸟一样思考用什么分析方法、作多少张图表、需要多少文字说明、报告写多少页等问题上纠结。
(2)确定分析思路:在分析目的明确后,就要梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
只有明确了分析目的,分析框架才能跟着确定下来,最后还要确保分析框架的体系化,使分析结果具有说服力。体系化即逻辑化,就是先分析什么,后分析什么,使得各个分析点之间具有逻辑联系。如何使分析框架体系化呢?就是以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,这样才能确保数据分析维度的完整性,分析结果的有效性及正确性。
营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等。而管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等。
例:互联网行业PEST分析框架:
(3)数据收集:是按照确定的数据分析框架,收集相关数据的过程,为数据分析提供了素材和依据。
一般数据来源主要有以下几种方式:
数据库(公司自己内部业务数据库)+公开出版物(统计年鉴或报告)+互联网(搜索需要的数据)+市场调查(收集用户的想法和需求数据)
说明:市场调查就是指运用科学的方法,有目的、有系统的收集、记录、整理有关市场营销的信息和资料,分析市场情况,了解市场现状及其发展趋势,为市场预测和营销决策提供客观、正确的数据资料,以弥补其他数据收集方式的不足。
(4)数据处理:是指对收集到的数据进行加工整理,形成适合数据分析的样式。
数据处理的基本目的是从大量的、杂乱无章、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据。数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。一般拿到手的数据都需要进行一定的处理才能用于后续的数据分析工作。
(5)数据分析:是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。掌握各种数据分析方法的基础上,熟悉主流数据分析软件的操作(Excel、SPSS Statistics等)。
在确定数据分析思路的阶段,数据分析师应当为需求分析的内容确定适合的数据分析方法,等到真正进入进行数据分析阶段时,就能驾驭数据,从容的进行分析和研究了。
-->说明:
数据分析与数据处理的区别:数据处理是数据分析的基础,通过数据处理,将收集到的原始数据转换为可以分析的形式,并且保证数据的一致性和有效性。
数据分析与数据挖掘的关系:数据分析与数据挖掘的本质是一样的,都是从数据里面发现关于业务的知识。数据挖掘其实是一种高级的数据分析方法,即从大量的数据中挖掘出有用的信息,是根据用户的特定要求,从数据中找出所需的信息,以满足用户的特定需求。一般数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式和规律。
(6)数据展现:用图表说话,一般数据是通过表格和图形的方式呈现的。
常用的数据图表包括饼图、柱状图、条形图、折线图、散点图、雷达图等,或对其进一步加工处理变为图形(金字塔图、矩阵图、漏洞图、帕累托图等)。数据分析师在展现结果的时候一定要保证绝大部分人的理解是一致的。 记住:能用图说明问题的就不用表格,能用表格说明问题的就不用文字。
(7)报告撰写:是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整的呈现出来,供决策者参考。
一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。
另外,数据分析报告需要有明确的结论,因为最初就是为寻找或者求证一个结论才进行分析的。
最后,好的分析报告一定要有建议或解决方案。作为决策者,需要的不仅是找出问题,更重要的是建议或解决方 案,以便他们在决策时作参考。
4.数据分析的三大误区:一定要注意
·分析目的不明确,为分析而分析:应该围绕分析目的(了解现状、找出业务变动原因、预测发展等)而进行分析。
·缺乏业务知识,分析结果偏离实际:需要多从业务方面进行分析,不应停留在数据表面要思考数据背后的事实真相。
·一味追求使用高级分析方法,热衷研究模型:围绕业务发现问题并能简单有效解决问题才是数据分析的最终目的。
5.数据分析师的职业要求:
五懂:
· 懂业务(熟悉行业知识、公司业务和流程)
· 懂管理(搭建数据分析框架,针对结论提出有指导意义的分析建议)
· 懂分析(基本分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏洞图分析法、综合评论分析法、因素分析法、矩阵关联分析法等;高级分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等)
· 懂工具(常用的数据分析工具:Excel、Access、SPSS、SAS,建议用好Excel分析工具)
· 懂设计(运用图表有效表达数据分析师的分析观点,使分析结果一目了然,如图形的选择、版式的设计、颜色的搭配等都需要掌握一定的设计原则)
6.数据分析师的五大基本能力和素质:
· 态度严谨负责:保持中立,不受其他因素影响而改变数据,客观评价企业在发展过程中存在的问题,为决策层提供有效的参考依据。
· 好奇心强烈:积极主动的发现和挖掘隐藏在数据内部的真相:为什么是这样的结果,为什么不是那样的结果,导致这个结果的原因是什么,为什么结果不是预期的那样等等,提出无数为什么,只有这样才有突破点。
· 逻辑思维清晰:需要对事实有足够的了解,同时也需要真正理清问题的整体以及局部的结构,在深度思考后,理清结构中相互的逻辑关系,只有这样才能真正客观地、科学地找到商业问题的答案。
· 擅长模仿学习:模仿学习是快速提高学习成果的有效方法。模仿主要是指参考、借鉴他人优秀的分析思路和方法,非“照搬”,领会他人方法的精髓,理解其分析原理,透过表面达到实质。
· 勇于创新:通过模仿可以借鉴他人的成功经验,但模仿的时间不宜过长,且建议每次模仿后都要进行总结,提出可以改进的地方,甚至要有所创新,不断总结分析方法、分析思路、分析流程,在总结中前行。
6.几个常用的指标和术语
(1)平均数:一组数据的算术平均值,即全部数据累加之后除以数据个数。它的特点是将总体内各单位的数量差异抽象化,代表总体的一般水平,掩盖了总体内各单位的差异。
(2)绝对数和相对数:绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也可以表现为在一定时间、地点条件下数量增减变化的绝对数。而,相对数是指由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。
相对数=比较数值(比数)/ 基础数值(基数)
(3)百分比与百分点:百分比是相对数,也称百分率/百分数,表示一个数是另一个数的百分之几,%表示,分母都是100,即都以1%作为度量单位。
百分点是指不同时期以百分数的形式表示的相对指标的变化幅度,1个百分点=1%。
(4)频数与频率:频数是绝对数,指一组数据中个别数据重复出现的次数,频率是相对是,是每组类别次数与总次数的比值,代表某类别在总体中出现的频繁程度,百分数表示,所有组的频率加和等于100%。
(5)比例与比率:都是相对数。比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构,部分:总体; 比率是指不同类别数值的对比,反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
(6)倍数与番数:都是相对数。倍数是一个数A除以另一个数B所得的商C(A是B的C倍)。注意:倍数一般表示数量的增长或上升幅度,不适用于表示数量的减少或下降。番数是指原来数量的2的N次方倍,翻一番为原来数量的2倍(2^1)。
(7)同比与环比:同比是指与历史同时期进行比较得到的数值,反映事物发展的相对情况(10年12月与09年12月相比)。环比是指与前一个统计期进行比较得到的数值,反映事物逐期发展的情况(10年12月与10年11月相比)。
以上内容都是数据分析入门的基本功,一定要认真复习、加深理解。
-->如何判断数据分析师正处于分析流程的哪个阶段?
·手托腮帮,沉思痛苦状-------------在思考分析思路
·手放键盘上不动,表情呆滞-------------在数据处理
·鼠标在飞快移动--------------在用数据透视表做分析
·不断交替点击鼠标左右键-------------在画图表
·断断续续敲击键盘,时而移动鼠标-----------在写PPT分析报告