留存数据分析思路

        留存率是互联网数据分析的重要指标,也是产品经理或产品运营最关注的指标之一。留存率指标有个好处,由于是量化的指标,因此留存率受外部因素影响较小,一般波动幅度较小。留存率的统计一般会按照时间的跨度按(日,周,月)来统计,但是无论哪种跨度,都遵循相同的规律。下面展示一个留存数据:





       上面是留存趋势图,下面是一个衰减幂函数的图像,大家是不是看这两个趋势有些相似,正常的留存曲线我们一般可以近似成一个幂函数图像或者指数函数图像,不同的是我们看到的留存率趋势图是离散的数据,因为留存率的统计都是1日(周、月)之后的整数。


所以说一个产品的留存率由两个参数 ab决定,而这两个值则是我们优化产品的两个基本思路,它们分别代表了

a是幂函数下降的起点值,在留存率趋势来说就是我们常说的次日(周,月)留存率,下面我们以C来代表这个值。

b 是幂指数衰减的趋势,代表留存率的衰减速度,我们以R来代表这个值。

C 值和 R 值的计算,一般有两种方法,一种是通过拟合算法得来(离散的excel就能不错的拟合)。另一种通过反算,用 C1,C2,C3,…Cn来表示1,2,3,...n日(周,月)的留存率,C =C1R = average( log2(C2/C1),log3(C3/C1),…,logn(Cn/C1) )。

根据已知的1月31日留存数据,我们通过模型计算出来这款产品留存的趋势模型是:留存率= 37.6x^(-0.4274), (其中C=37.6,R=-0.4274)

这里投了一下小懒,一般来说不用某天的数值计算模型,应该用一段时间的数据计算,这一段时间也非常的讲究,要通过自己跟据时间的业务进行选择。

有人说自己的产品留存率趋势不是按照这个模型衰减的,数值上是可能有些波动,但产品的留存衰减一定是满足衰减幂函数模型的,如果你的产品衰减不遵循这个模型,一定是产品中掺杂了很多非正常的噪声,这个时候你就要高度警惕了。

PS:反算是比较容易的一种方法,想要更精细的模型可以用拟合的方法,你可以根据自身产品的关键的时间节点来将数据分段拟合,你会发现模型更加的精准,相对的你要的数据就更多。

你可能感兴趣的:(留存数据分析思路)