4、线上数据挖掘

你可能在工作中碰到过类似的问题:

1)这个季度需要提升阅读用户比例,但是又不知道从何入手

2)目前我们业务的留存率太低了,需要通过一些优化来提升留存率,做做数据分析

3)下个季度整体的产品方向需要确定,具体是以哪个方向为核心呢


如果当你遇到以上问题,你的反应是从数据中去寻找答案的话,说明你的产品思维中已经融入了数据驱动的思想,而不再是抓瞎式的出功能需求了。这很好。

但随即你会发现,这要比你线上验证一个功能这样的数据分析工作,要痛苦得多。原因是因为无论是验证一个线上的功能效果,它是一个清晰的命题。你做了什么,你希望用户有什么行为,最后有什么数据表现,这些假设都是你在设计功能时都想好了的。你只需要去分析与验证就行。而数据挖掘式的工作,它本身并没有那么清晰的假设,也就是说,你需要在分析的过程中把整套数据分析的流程都走若干遍,而且其中很可能大多数的结果,是无法验证你的假设的(假设是错误或部分错误的)。所以做数据挖掘时,你需要不断建立构思,又不断否定自己,再重新建立新的假设,过程就会很痛苦。甚至有时候你会觉得分析无从下手。

所以这就回到之前第一部分说的,需要你的业务理解力。

那么业务理解力,理解的是什么呢?理解的是:

1)你业务的增长公式

2)业务的价值链

3)用户的场景

拿直播业务举例。直播业务本质上是让内容与用户匹配,随后产生用户付费。而付费产生的收入,又平台、主播、公会等均分。而整体业务的公式是:流水=DAU x 付费率 x 客单价。于是你就知道了,作为一个产品如果需要提升流水,我们需要想尽办法提升DAU,付费率和客单价。

有了这个公式,你再去对比其他竞品在类似环节的数据,你就知道自己需要在哪个环节做优化了。当然很多人会说,我们没有竞品的数据怎么办?竞品的数据你可以从网上搜,上市公司的财报有时候会披露一部分,或者去结实一些同业的同行,打听一下,都可以。

而当你得知自己业务是付费率相对比较低的时候,怎么去提升呢?这时你需要模拟一个新用户从启动app,到产生付费行为整个过程,可能会有哪些流程的拆解。比如用户会逛推荐页,我们需要有各种方法让他被一个主播吸引并且点进去;而为了提升他喜欢这个主播的概率,我们需要做个性化推荐;而当他观看直播内容超过多少分钟后,可以对其进行免费或低门槛付费道具的引导等等等等。

说完理论,我们回到具体的数据分析。其实对于绝大多数的产品而言,数据分析工作面对的对象,往往是一个不那么大的问题,但有时就是无从着手。比如,需要分析app内的货币体系是否健康。其实对这个问题进行拆解之后你会发现,需要回答这个问题,你需要先知道以下几点:

1)什么是健康的经济体系?

2)整个体系相关的流程,如果用数据来表示的话,会涉及到哪些业务数据?

3)现在这些数据有没有统计?如何提取?

4)数值多少算健康?


1)什么是健康的经济体系?

这是整个问题思考的关键。你需要先对该体系有一个深入的思考。它的作用到底是为了什么?如果没有这些的话会是什么样?你希望用户去做什么?如果你是用户,面对这套体系,会怎么做?等等

随后你可以开始用大白话来描述健康的经济的特征,比如用户最终是为了用货币来进行抽奖、兑换现金券、或购买道具,那当他每获得100金币之后,他会消耗多少?分别用来做什么?如果用户消耗了大部分的金币,那么他有没有为了获得金币,再次去完成金币发行所需要的任务?如果有,那这些都完成后,他是不是又会开启下一个循环,有没有因为这个循环让用户更活跃了?把这些问题和环节用结论的形式来表达就是:

a)用户会从获得的金币中消耗绝大部分金币用到……场景

b)为了再次获得货币,用户能持续完成系统给他的活跃任务

c)这样的循环对用户是否可持续,对整体活跃是否有提升


2)关联的业务流程的数据表达

比如消耗/产出的比例,比如每消耗m货币,用户会获得什么,而获得的东西是否让用户觉得值得从而持续发生行为,这可以用功能的留存来体现;而因为这些,用户会不会想再获得该货币,从而去完成更多你希望他完成的事情,这可以用任务的完成比例来体现


3)数据提取与统计

这一个步骤就需要你对业务数据的统计有比较清晰的了解。所谓数到用时方恨少,很多业务数据当你需要进行分析的时候,你才会发现啊呀,我没投递统计。所以功能在设计的时候,需要尽可能提前想好统计的数据与维度,至少保留生日志,以便实在不行,能从头开始统计。到这一步结束,你应该已经能看到所有相关流程的数据了。


4)数值多少算健康

这其实是很多面对该问题的产品的痛点。实际上这个问题不是绝对的,也不需要马上回答。消耗/产出=50%健康么?如果不健康,那70%健康么?如果在分析的一开始就确定一个阈值的话,那本质上和拍脑袋没什么区别。但是好在你是按照4步的方法在走,于是你其实已经还原了,什么样的经济体系是健康的白话表述,数据表征。你需要的是去看每个环节实际的折损情况。所以这个问题的答案其实是动态的。可能你每周都需要去监控这些数据,可能每周都在变化。真正重要的,不是最终多少比例才是健康的数字,而是你能知道为了变得更健康,你需要从哪个环节去优化。等你需要优化的环节数据已经不再是短板的时候,再重新评估,哪里是新的短板。持续这样做分析与优化,不久你就会发现,你希望的消耗的数值与用户的留存正在不断地变好。而变好之后的是健康的么?是,也可以不是。因为它可以更健康。


回到数据挖掘的问题。总结下来,数据挖掘实际上就是在知道业务的价值链、增长公式后,去不断还原用户在不同场景下使用的环节数据,寻找短板,给出优化建议。

你可能感兴趣的:(4、线上数据挖掘)