我们都知道没有对比的分析是没有意义的。例如我的网站2019年7月浏览量26W,这个孤立值没有任何参考价值,只是单纯的一个数字。因为26W到底是高还是低呢,效果到底是好还是不好,没有一个参考的标准。
假如6月份的浏览量是19.5W,那么7月份比6月份的浏览量增长了6.5万,环比增长率为34%左右。正常情况下,当看到网站浏览量环比增长了34%时,我们会暗自欣喜,因为从6月到7月网站向好的方向发展。
ps:7月与6月相比,就是我们通常说的环比,环比增长率=(本期数据-上期数据)/上期数据。通常环比为日环比、周环比、月环比、年环比等。这里是月环比的示例。
但是,画风一转,请看下面一图,2019年7月份相比2018年的7月份浏览量数据居然是下降的,下降率为50%左右。看到这样的情况,我们开始慌了~
ps:2019年7月与2018年7月相比,就是我们通常说的同比,同比增长率=(本期数据-上期数据)/上期数据。通常同比包括:某年、某月、某周与上一年同期数据对比。
这就是对比分析法的奥妙,从不同的维度对比分析,可能分析出的结果大相径庭,所以我们需要尽可能全方位的从多个角度进行数据分析及原因查找。
通过了解,原来在2018年7月时,网站在线举办了一个投票活动,活动为网站带了了不错的效果,2018年时7月份环比6月份增长了182%。而在2019年7月份没有举办过任何活动,2019年7月份同比2018年7月浏览量下降。
对比分析法基本概念
对比分析法,它是数据分析中一种最基础的分析方法。对比分析法就是将两个或者两个以上的数据进行比较,进而发现数据之间的差异和规律。对比分析包括绝对对比和相对对比。
绝对对比指绝对数据之间的比较,例如用户数、浏览量、访问量、下单量、注册量等。
相对对比指相对数据之间的比较,例如转化率、留存率、沉默率、下单率、注册率等。
从不同的对比视角,可以归纳为如下常见的对比场景:
时间对比:同比、环比、变化趋势等
空间对比:不同城市对比、不同类别对比、不同渠道对比等
用户对比:新用户与老用户对比、登录用户与未登录用户对比、高粘用户与低粘用户对比、活跃用户与不活跃用户对比等
转化对比:不同渠道转化对比、不同类别转化对比、不同活动转化对比等
竞品对比:推广方式对比、功能对比、用户体验对比、产品定位对比、营收对比等
前后变化对比:活动前与活动后对比、推广前与推广后对比、改版前与改版后对比、新功能上线前与上线后对比等
......
对于不用的指标如何进行对比?
首先介绍一下数据标准化公式:
数据标准化最直观的优点就是更加清晰的可视化展示数据变化规律,例如下图左边是没有标准化之前网站从第一周到17周每一天的浏览量,右图是将浏览量数据标准化后,右图很显然看出如下趋势变化规律(1)前7周网站的浏览量相比8周后的浏览量低;(2)周六日明显低于平时。
接下来分析师还需要结合其他维度找一下这两个时间段的浏览量比较低的原因是正常还是异常。
不同指标对比
对比不同单位指标,由于量纲本身的不同,数据直接进行对比没有意义,这时需要对各项数据先进行数据标准化,去除量纲因素,再做对比分析。举个例子:通过活跃用户数与次均时长评价不同渠道的质量,从而选择最优的渠道进行推广。没有标准化前,两个指标的单位不同,例如渠道1用户数最多,但是次均时长不是最长,而渠道3用户活跃数最少,但是次均时长确实最长,那么这三个渠道到底哪个质量更高呢?
下面对两组数据按照标准化公式分别计算,并把标准化结果按照平均数合并,如下图所示
从图中很明显看出渠道1标准化后均值最大,说明渠道1的质量最优(这里采用的均值合并,当然合并时权重设定需要结合实际业务,比如对于内容型产品,业务认为次均时长更重要,则将次均时长的权重设置的大一些,具体多大需要数据验证)。