hello,大家好,我是蛋蛋。前一篇文章中,总结了一些基础的直播热门列表排序方法。在具体策略上线后,又遇到了一些流量集中导致的问题,在解决问题过程中,也发现一些比较有意思的东西,在这里先总结下,方便自己review也和大家分享下。
如何看待平台的流量集中?
最初的列表排序主要依据的是直播间的用户数及留存等因素,加上一些运营策略,诸如置顶,pgc内容优先等,上线后基本可以满足挑选出质量较高主播的目标。但随着用户量的增长,头部集中的问题就慢慢显现出来了,大部分用户集中在少数几个人的直播间里,其它的直播很难被看到,也就是大家常说的“马太效应”。如下图所示,人数多的直播间都在靠前位置。
但是到底如何看待这种流量集中呢?这个时候我们还是可以从成本和收益的角度来考虑,直播的曝光其实就是我们平台的成本,相应的转化,比如,点击,评论,关注,礼物等就是平台的收益。我们可以套用计算广告中的一个数据,每一千次曝光带来的收益
RPM (Revenue Per Mille impressions,千次曝光收益)
利用RPM来作为主播曝光价值的衡量指标。然后根据流量集中的直播间在这个数据上的表现,来判断出目前平台中流量集中的好坏。
据此,我们看了下平台排序Top直播间的RPM,特别是一些置顶直播间的RPM,结果发现远远低于平台均值。这就说明了,我们的头部主播已经被过度曝光了,我们给他的曝光没能换回相应的收益。由此可以判断,流量集中已经给我们的平台带来了问题,我们的流量没有得到最有效率的利用。
如何解决流量集中?
通过前面的分析,我们知道我们的头部主播的RPM是低于平台均值的。这也从侧面说明了我们的用户对于头部主播的喜爱没有我们预想中的那么理想,于此同时用户的人均进房间数也在增长,说明,很多用户在不停的寻找主播,我们的头部主播可能已经让他们感到腻了。基于此,一方面修改之前的运营策略,尽量控制置顶行为,取消pgc内容优先的规则等;另一方面在产品逻辑上我们能自然想到的办法就是:
控制头部主播的曝光,增加中尾部主播的曝光
实现这个办法的策略有很多。最初我们采用了特别粗暴简单的一种:随机抽取。我们将平台的主播按照已有的评分进行排序,之前的排序策略是所有人都会看到这个排序中所有的主播,当然这种情况下,大部分人都只会看到排名比较靠前的主播。因此,我们将这个排序分成若干段,从定义上将主播分为了大主播,中主播,中小主播,小主播等几个级别。然后从这几个级别的主播中随机抽取部分组成一个用户的列表。这样达到的状态是每个人都会增大几率看到各种类型的主播,特别是本来很靠后的主播;同时又因为从每一种主播中随机抽取,从而使的本来被所有人都能看到的大主播,变成了只有部分人可以看到,这就起到了限制大主播曝光的作用。我们可以定义几个衡量这种流量分散效果的指标
- 有人看过的直播间比例(有人看过的直播间数/所有直播间数)
- 第一个人进直播间的平均耗时
策略上线后,整个平台有人看过的直播间比例大幅增长,第一个人进直播间的平均耗时也缩短了不少。从这些数据看,我们达到了流量分散的效果。现在回头看,当时胆子有点大,一下子把流量分得这么散,还是完全没有考虑控制的,仅凭灰度试验时的部分留存,使用时长等基本数据作为依据,最后整体RPM居然有所提升,也是运气不错。
怎么才能更合理?
这样粗暴的流量分散后,的确解决了头部过度集中的问题,但是我们的目标不是把流量分开,这只是手段,目标还是优化千次曝光的收益(RPM),去尽可能的提高整体RPM均值。让流量分配的更为合理。
为此,我们觉得所有的主播都应该存在一个合理曝光的值,这个合理的曝光正好保证他所能带来的RPM是最大的,和现实社会中对应上就是,范冰冰这样的大明星就该拥有较大的曝光,因为她能hold住,一个小网红可能就会少一点,然后一个普通邻家小妹子可能有几个附近的曝光就可以了。因此,我们可以建立一个主播所对应的合理曝光量,那么问题就转化为如何确定一个主播的合理曝光量。
对于主播合理曝光量的确定,可以采用增量测试的办法,所有来平台开播的主播都给予一个基础的流量曝光,然后可以得到一个考核的指标,就像考试一样,给一个分数,如果分数不错,那么就再增加曝光,如果依然表现不错就继续增量上涨,如果表现一般或不行后就停止流量的增加。以此来动态确定一个主播的合理曝光量。
一个主播的合理曝光量确定后,就需要合适的办法去达到这样的曝光,方法可以有很多种,这里简单介绍一种思路,学过控制理论的人都知道,闭环控制最基础的是得到一个反馈量,有了反馈后才能通过控制算法确定控制输出。在这里可以简单套用这种反馈的思路。如下图所示,
合理的曝光量为u,y为实际已有的曝光量,e为实际曝光和合理曝光的差值,我们可以把这个差值融入到直播间在列表排序的分值中去,这样,没达到合理曝光量的直播间差值e就会很大,该直播间在排序中就会靠前,如果达到了合理曝光量,甚至超过了,那么误差e为零或负值,就会降低原有的排序值,降低排序,从而减少了曝光。
总结&后记
上述主要解释了如何判断流量集中的好坏,以及在流量集中造成不好影响时,如何进行流量的分散以及如何合理的分配流量。具体可操作的方式有很多,至于何种好,还是看其对流量最核心优化目标RPM的提升,在具体操作中,也需要通过不停的灰度试验去调节相关的参数。而且上述的所有思路都是在没有考虑个性推荐,假设所有流量是无差别的基础下做的。想必到这,大家也会觉得,个性推荐是提升RPM,合理分配流量的下一步。的确,个性推荐就引出了下一个话题,如何精准的实现流量分配。在这里就不多说了,具体的后面再总结。
其实对于内容的流量分配已经被研究了很久了,特别是在广告领域。也有很多可以参考的书和文章,也在这里贴给大家,供大家参考
《计算广告学》https://book.douban.com/subject/26596778/
相关视频:http://study.163.com/course/introduction/321007.htm#/courseDetail