我之前做过很多关于数据分析方法、数据模型的分享,但是最近很多人跟我说,有些方法和模型只是空有其表,实际上做出来之后很难分析出什么结果,比如波士顿矩阵、RFM模型等等。
很多人在做数据分析时都会犯一个毛病,那就是把数据给孤立了,不去找合适的参考指标和对比系,而是盯着最后的某个分析结果,这是很难找到数据价值的。
那么为什么会出现这种情况呢?是因为很多人都没有完全领悟数据分析的基础方法和思维,比如对比、溯源、细分,就开始套用各种分析模型,分析出的结果自然没有任何的意义。
所以最近我将开始一个新的专题——《数据分析基础方法与思维》,从基础出发,不断练习。今天我们就从对比分析法开始讲起。
说起对比法,可能很多人都觉得不值一哂,但其实对比法并不像是你想象的那么简单。
什么是对比分析法?
我们都知道大数据有一个特点——相对性,就是说数据之间都是有差异的,而对比分析正是利用相对性找到数据的变化特点和发展趋势,简单来说就是找差异,以及找出影响这种差异的原因、优化差异的方法。
怎么找呢?一般来说是需要比较两个或者多个具有关联的数据,可以是比较多少、比较大小、比较快慢等等。但是这些数据必须要基于统一的指标,最好是在更多的维度下进行对比。
省份是维度,能力是指标
比如说,老板让你分析一下今年企业的发展情况,你拉表之后发现销售额比去年增长了10%,净利润比去年增长了5%,成本消耗比去年降低了3%。销售额、净利润、成本消耗就是对比的指标,我们不能拿销售额的数据去对比成本数据,这就是指标的统一。
有了这些指标就可以说明企业发展很好了吗?不,假如同行业的其他企业销售额都增长了80%,那么该企业的发展其实是很差的。因为我们只有今年、去年的时间维度,忽略了与竞争对手的横向维度,因此我们要尽可能的多找维度。
简单来说,对比法就是建立一个参考系,通过不同的维度和指标来找到数据的差异点。
对比法的步骤?
1、拆分影响因素,排除无关因素。
在我们进行数据分析之前,要先对影响因素进行拆分,如果要对比APP的拉新效果,就要将因素拆分为访问量、点击量、注册量等等,这些被拆分出来的因素就是我们要对比的指标。
同时也要排除掉无关的因素,比如APP某几天浏览量的下降,可能是因为平台全面限流导致的,这样的因素会影响我们对数据变化的判断,不能帮助我们找到产品缺陷,因此要排除出去。
2、多维度对比,一般分为四种。
时间维度:同时期对比或者上一时期的对比,包括环比、同比。
空间维度:比如不同城市的对比、不同行业的对比、不同国家的对比。
计划维度:比如与计划值、平均值、中间值的对比,多为差异对比。
3、保持一致性。
在对比分析时,我们要保证对象的一致性、数据来源的一致性、维度与指标的一致性。我们不能那自己的产品去对比用户,同时也要注意不同来源的数据有可能是不同的,比如财务数据里的“净利润”与销售数据的“净利润”可能并不是相同的,定义不同,数据自然也会不同。
对比法的分类?
1、纵向对比
纵向对比就是跟自己的某个指标进行对比,比如同比、环比。
同比
同比就是对比相同时期的数据,例如“3月销售额比去年同期上涨50%”,其就是用今年3月份的销售额与去年3月份的销售额进行对比,运用同比主要是为了消除淡季、旺季的影响。
同比增长率公式为:(本期发展水平-去年同期发展水平)/去年同期发展水平*100%
同比在对比分析法中经常被用到的,用来比对今年与往年同时期的发展速度情况,但是不能滥用,一定要考虑同比的价值。
比如说今年3月销售额的同期对比是否真的有意义?比如,如果去年第二季度的数据低谷是因为某种原因(市场政策等外力因素)造成的,那么该月份的同比数据就是毫无意义的,相反还会造成第二季度“虚假增长”的假象。
环比
环比就是对比上一个时期的数据,例如“3月销售额环比增长50%”,其就是用今年3月份的销售额数据与2月份进行对比,运用环比主要是为了表现相邻发展时期的数据变动情况,比如日环比、周环比、月环比、季环比、年环比。
环比增长率公式为:(本期数据-上期数据)/上期数据*100%
同样的环比也不能滥用,为了消除季节的影响,我们在使用环比时往往会加入季节调整模型,对原始统计数据进行加工处理,而因为季节模型中参数确定方法的差异,得到的环比统计结果也会有所不同,这也正是环比统计工作的难点所在。
2、横向对比
横向对比就是将自己与他人进行对比,比如行业对比、产品对比。
比如开头我们讲到的例子,年增长10%并不能说明企业的发展就是好的,而要考虑到整个行业的整体发展情况,如果整体发展都在50%以上,那么你的企业发展反而是落后的。
一般来说,横向对比需要对比多个指标、一个维度,而且要注意保证单一变量。比如说,对比两个APP产品的上线效果,当我进行浏览量对比时,要确保其他变量不变,比如上线时间、用户数量等等,这样才能找到对象之间的差异点。
总结
数据分析必须在业务中灵活应用才有意义,对比法同样也是如此。灵活巧用对比分析,最关键地是要理解参考系的建立,也就是指标与维度,并且遵循对比分析法的原则,这是数据分析中最为基础的内容。