之前提到的对比、平均、分组和交叉的分析思路,都是在单一指标下分析的方法。而综合指标评价法是建立在复杂数据情况下,将多个指标的转化为一个综合指标对某一特征进行总体评价,如人民的幸福程度、人才评价、用户活跃程度等,这种方法经常出现在行业报告中。
极光数据在2019年8月19日发布的APP流量价值评估报告中,就用到了综合指标分析方法。首先构造了流量价值这个综合指标,然后从四个维度:用户规模、流量质量、用户特征和产品特性分别选取相应指标。
权重是如何确定的、具体值是多少,我们就不得而知了,只能看到它的分析结果,下面的截图是分析结果的一部分,一二线城市流量价值较高。
综合指标分析说白了其实是我们自己造一个指标,但也不是凭空捏造,要说明具体来由及相关逻辑计算方法,即权重分配,整个过程符合常规逻辑即可。
步骤:
找出要进行综合评价的所有相关指标,确定指标有几个原则需要注意:
【逻辑树模型】
在确定指标的过程中,其实我们用到了一个数据分析的思维方法,或者叫一个数据分析模型,那就是逻辑树。逻辑树模型是将一个问题层层分解,找到末端原因所在的一个方法,因其长的像一个树状的结构,所以叫逻辑树。如我们设置人才优秀程度的评定方法,第一层从基础能力、沟通能力、创新能力等5个方面来评价,第二层将涉及这几个方面的指标相互独立地罗列出来,逻辑树的关键在于找到末端原因
当确定好需要哪些指标以后,就将反映指标的数据填充进去。将每个人的相应指标下的打分结果(0-100分)填充进去。我们还可以直接求和计算其得分,图片中红色背景填充的为top3项。
依据历史经验,我们将赋予每个指标相应的权重,如下图所示,基础能力5%的权重,执行力35%的权重等,权重相加应为100%
对每行数据计算其加权后的值,再相加就得到了一个综合值,即图片中的权重得分。注意加权值的计算方式:
加权值=原值x权重
加权以后的综合值和不加权的值有什么区别呢,我们同样把加权以后的得分前3项标红了,可以看出来原本得分排名第三的李四因为在加权以后排不上前三了,区别就在于权重。
上述人才优秀程度评定的例子是建立在数据在同一区间,也就是所有的打分都是在0-100分之间,图片所示的是更多的情况下,数据范围各不一致,假设我们要分析一个网站某一天的用户活跃程度,通过用户登陆网站次数、主流时间(秒)和点击量三个指标来得到一个综合值。
Step1:数据标准化
如果不进行数据标准化,那么量纲较大的指标对结果的影响就大,量纲较小的指标对结果的影响就小,这种影响是应该消除的,所以,数据标准化,即将数据按比例缩放到一个特定的区间,便于后续比较和分析,常用的数据标准化的方法有0-1标准化和Z-score标准化。
0-1标准化,也叫离差标准化,是通过对一组数据最大最小值的线性变换处理,使之落在[0,1]区间内,对于一组数据{x1,x2,…,xn},其0-1标准化后得到的新值的公式为:
其中,min为该组数据的最小值,max为该组数据的最大值,yi为标准化后的新值。
先对登陆次数进行标准化
同样对驻留时间和点击量进行0-1标准化。
Step2:计算加权后的综合值
权重的确定方法就不细展开了,这里只是提供一种做法,当把登陆次数、驻留时间和点击量都标准化以后,就可以分配权重并得到一个新的综合值了。
Step3:结果分析
对结果进行降序排列,就可以得到综合指标最高的top10的用户ID了,从而进行贴心的维护~
方法不难,能用是真。最后,多看行业分析报告,能提高在分析方法上的觉悟能力。
我是可乐,更多精彩内容欢迎关注公众号:可乐的数据分析之路