数据分析方法三大作用即现状分析、原因分析、预测分析,这三大作用分别通过 对比、细分、预测三大基本方法。
任何事物既有共性又有个性特征,只有通过对比,才能分辨出事物的性质、变化、发展、与其他事物的异同等个性特征。
1、定义
对比分析,是指将两个或以上的数据进行比较 ,分析差异,从而揭示事物发展变化情况和规律性。
2、指标与维度
数据分析需要对指标从不同的维度进行对比分析,才能得出有效的结论。
1)指标
指标是用于衡量事物发展程度的单位或方法,它还有一个在IT领域常用的名字,称为度量。
指标需要经过计数、加和、平均等汇总计算方式得到,并需要在一定的前提条件下进行汇总计算,如时间、地点、范围,这就是常说的统计口径与范围。
指标可分为绝对数指标和相对数指标,绝对数指标是反映规模大小的指标,而相对数指标主要用来反映质量的高低。所以,分析一个事物的发展程度可从数量(quantity)和质量(quality)这两个方面的指标进行对比分析,简称QQ模型,也称为QQ模型分析法。
第一个Q,就是数量,也就是我们常说的绝对数指标,例如收入、用户数等,主要用来衡量事物发展的规模大小情况
第二个Q,就是质量,也就是我们常说的相对数指标,例如利润率、留存率等,主要用来衡量事物发展的质量高低情况。
质量又可分为广度和深度两个角度。
广度是指群体覆盖的范围,例如:留存率、渗透率、付费率等
深度是指群体参与的深度,例如:人均消费额、人均GDP、人均收入、人均在线时长
例如,在分析业务时,先分析业务是否达到一定规模,若规模足够大,可再分析质量高低。若质量不高则可从提升质量的角度入手,收入与利润率、用户数与留存率等组合分析都是QQ模型的经典应用。
2)维度
指标用于衡量事物发展程度,程度是好是坏,需要通过不同维度进行对比,才能知道好坏。
维度是事物或现象的某种特征,也就是我们常说的分析角度,如产品类型、用户类型、地区、时间等都是维度。
同级类别对比:
同级类别对比,称为横比,如不同国家人口数、GDP的对比。
不同时期对比:
时间是常用的、特殊的维度,时间上的对比,称为纵比。本月与上月数据对比为环比,本月与去年同月数据对比为同比,每月数据与某一固定月数据对比为定基比。
除了横比与纵比外,还可与业务目标进行对比,与行业的平均水平、标杆进行对比。
与目标对比:
实际完成值与目标对比。
行业内对比:
与行业内标杆企业、竞争对手或行业的平均水平进行对比。
还有其他对比分析的维度。
根据数据类型划分,维度可分为定性维度和定量维度。
数据类型为字符型数据,就是定性维度,它是事物的固有特征属性,如产品类型、用户类型、地区都是定性维度。
数据类型为数值型数据,就是定量维度,如收入、消费、年龄等,一般需要对定量维度进行数值分组处理,再进行对比等分析。
3、注意事项
1)只有通过事物发展的数量、质量两大方面的指标,从横比、纵比角度进行全方位的对比,才能够全面了解事物发展的情况与规律。
2)指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量。例如600美元与3000人民币无法直接比较
3)对比的指标类型必须一致,无论绝对数指标、相对数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。例如2010年广州的GDP值和深圳的GDP增长率无法对比,因为两种指标类型不一样。
分组分析法,是指根据分组字段,将分析对象划分成不同的部分,以对比分析各组之间的差异的一种分析方法。
分组的目的是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,以便进一步进行各组之间的对比分析。
分组类型主要有两类:定性分组和定量分组。
定性分组:是按事物的固有属性划分的,如性别、学历、地区等属性,定性分组一般看结构,也就是结构分析。
定量分组:即数值分组,根据分析目的将数值型数据进行等距或非等距分组,定量分组一般看分布,也就是分布分析。
结构分析法,是在分组的基础上,计算各组成部分所占的比重,进而分析总体内部构成结构。这个分组主要是指定性分组,定性分组一般看结构,它的重点在于占整体的比重。例如用户的性别结构、公司的产品结构等。
结构相对指标(比例)的计算公式为:
结构相对指标(比例)=(总体某部分的数值/总体总量)×100%
市场占有率是结构分析的一个经典应用。
市场占有率=(某种商品销售量/该种商品市场销售总量)×100%
市场占有率高说明企业运营状况好,竞争能力强,在市场上占据有利地位,所以评价一家企业运营状况是否良好,不仅要了解客户数、收入等绝对数值指标是否增长,而且还要了解其在行业内的比重是否维持稳定或也在增长,若比重下降,说明竞争对手增长快,即企业在退步,要提高警惕,出台相应政策。
结构分析主要使用饼图进行数据展现,若成分较少,可考虑用圆环图,若成分较多,如10个以上,考虑使用树状图。
分布分析法,是根据分析目的,将数值型数据进行等距或不等距分组,研究各组分布规律的一种分析方法。
分布分析法也是在分组基础上进行的,这个分组主要是指定量分组,定量分组一般看分布。分布分组的重点在于查看数据的分布情况,其横坐标轴不能改变顺序,即不能按数值大小进行排序。分布分组应用广泛,例如,用户消费分布、用户收入分布、用户年龄分布。
定量分组分析的关键在于确定组数和组距。
除了等距分组还可以不等距分组,取决于所分析对象的性质特点。在各单位数据变动比较均匀的情况下适合采用等距分组,在各单位数据变动不均匀的情况下可适合采用不等距分组,数据分析师根据需要进行选择。
还有一种特殊的分布分析,就是时间分布分析。例如,用户注册时段分布、用户购买时段分布、产品月销售分布等。
交叉分析法,通常用于分析两个或两个以上分组变量之间的关系,以交叉表的形式进行变量间关系的对比分析。交叉分析的原理就是从数据的不同维度,综合进行分组细分,以进一步了解数据的结构、分布特征。
交叉分析的分组变量,可以是定量分组与定量分组进行交叉,也可以是定量分组与定性分组进行交叉,还可以是定性分组与定性分组进行交叉。
交叉分析的维度,建议不超过2个,维度越多,分得越细,就越没有重点,所以在选择几个维度的时候需要根据分析的目的决定。
二维交叉表其实就是二维表,下面给出一个二维交叉表。
根据客户活跃程度和交易金额贡献,进行用户价值细分的一种客户细分方法。RFM分析法其实是交叉分析在客户价值细分领域的一个经典应用。RFM分析法由三个指标组成,分别为R(recency)近度、F(frequency)频度、M(monetary)额度组成。
高表示高于该指标的平均值,低表示低于该指标的平均值。
使用RFM分析法,需要满足以下三点假设:
(1)假设最近有过交易行为的客户,再次发生交易的可能性要高于最近无交易的客户**(R)**
(2)假设交易频率较高的客户比交易频率较低的客户更有可能再次发生交易行为**(F)**
(3)假设过去所有交易总金额较多的客户,比交易总金额较少的客户,更有消费积极性**(M)**
1、矩阵
矩阵分析,是指将事物的两个重要属性(指标)作为分析的依据,进行关联分析,找出解决问题的一种分析方法,也称矩阵关联分析,简称矩阵分析法。
矩阵以属性A为横轴,属性B为纵轴,组成一个坐标系,在两坐标轴上分别按某一标准(可取平均值、经验值、行业水平等)进行象限划分,构成四个象限。将要分析的每个对象对应投射到这四个象限内,进行交叉分类分析,直观地将两个属性的关联性表现出来,进而进行每一个对象在这两个属性上的表现。
矩阵关联分析法在解决问题和资源分配时,可为决策者提供重要参考依据,先解决主要矛盾,再解决次要矛盾。
2、改进难易矩阵
若企业存在较多短板,而自身拥有资源(如人力、物力等)有限,只能先集中有限资源对某个短板进行改造,这时可在原有两个指标的基础上,增加一个指标维度,例如改进难易程度。
改进难以程度这个指标可以采用专家访谈获取多位业内专家对各个指标改进难易程度的评价,最后综合各专家的评价以确定最终指标的改进难易程度。
图中气泡面积的大小代表着改进的难易程度,气泡越大,改进难度越大。
通过对实践活动的总结,逐步形成了一系列运用多个指标对多个参评单位进行评价的方法,称为多变量综合评价分析方法,简称综合评价分析法。
综合评价分析法的基本思想是将多个指标转化为一个能够反映综合情况的指标来进行分析评价。例如不同国家的经济实力,不同地区的社会发展水平等。
综合分析法特点:
针对数量类的指标,可使用结构分解法进行指标变化的原因分析。
结构分解法采用金字塔形结构,可使业务结构的层次更分明、条理更清晰,简单明了地表达了各业务结构之间的关系。
例子:
公司4月收入比3月下降10%,原因何在?
原因:4月品牌2的收入比3月下降22%,地区对收入下降没明显影响。
针对质量类的综合性指标,可以使用因素分解法进行指标变化的原因分析。
因素分解法把综合性指标分解为各个原始因素,主要用于分析有明确数量关联关系的各因素之间的变动对综合指标变动量的影响程度,从而确定影响指标变化的原因。
因素分析法的具体操作步骤如下。
(1)确定指标有哪些因素构成
(2)确定各因素与指标的关系,如加减乘除或函数等
(3)测定、分析因素对指标变动的影响方向和程度
原因分析:
漏斗图分析法是以漏斗的形式展现分析过程及结果,也就是从业务流程角度进行对比分析,通过各环节变化查找指标变化的原因。
预测分析法是根据客观对象的已知信息,运用各种定性和定量的分析理论与方法,对事物未来发展的趋势和水平进行判断和推测的一种活动。
定性预测靠经验
定量用数学工具
预测分析的结果需要符合业务发展规律,相关的预测分析技术,如趋势分析法、回归分析、时间序列等方法得到的预测结果仅仅作为参考,需要根据相关的运营策略、资源配置等情况决定是否修正预测结果,并不是直接采用它们的预测结果。
给出了excel预测的步骤
这部分讲了3个数据透视表的操作的重要内容:
1、数据透视表创建三步法
举例:销售额相关的6个问题(数据透视表的简单运用)
2、数据透视表3个小技巧
百分比计算
同比、环比计算
数据分组统计(用组合命令)
3、多选题分析
品牌认知度相关的4个数据透视表问题(数据透视表的简单运用)
涉及到利用分组命令对年龄分组或者用vlookup函数实现年龄分组