2015年12月30日的Netflix最新paper

1. 商业目标

商业目标:“演出和电影”的“生产商和渠道分发商”。

商业模式:收取会员费。

技术价值:认为个性化和推荐技术每年给NetFlix节省10亿美金。

2. 关注指标

总体指标:0.65亿会员、每天1亿小时的观影时长,也就是平均每个人观影时长超过1个小时。

优化指标:新客存留率、老客流失率、老客存留率。

3. 推荐策略

整体来说,推荐需要把握很重要的两点:推荐结果+推荐理由。也就是找到觉得用户感兴趣的东西,而且要让用户明白为什么推荐给他。

3.1 Personalized Video Ranker:PVR

也就是我们常用的RTP。

3.2 Top-N Video Ranker

也就是热门视频,通常我们用做补足逻辑。

3.3 Trending Now

短暂的实时突发趋势,几分钟或者几天内的趋势。

3.4 Continue Watching

继续观看动作分解:1)接着观看,2)重看,3)不感兴趣。根据用户日志信息学习一个Continue Watching策略模型,将接着观看和重看的结果推荐给用户。

3.5 Video-Video Similarity

也就是看了又看,自解释性强。

3.6 Evidence

Netflix将推荐理由展示提高到了一个高度,使用一个evidence selection算法来进行UI展示,包括推荐展示文字和展示图片来吸引用户。

4. 多策略融合

在推荐系统里面,多策略需要融合是一个不争的事实,很多公司已经通过做多策略融合拿到了很好的效果。但是,多策略的融合问题至今为止一直没有一个公认的最优解法。如何在兼顾Recall、Precision和多样性(也是为了考虑Recall)的情况下将多个推荐策略融合在一起展示给用户。

参考文章:http://shiyanjun.cn/archives/1429.html

1. 加权的混合:用线性公式将几种不同的推荐按照一定权重组合起来,具体权重的值需要在测试数据集上反复试验,从而达到最好的推荐结果。

2. 切换的混合:其实对于不同的情况,推荐策略可能会有很大的不同,那么切换的混合方式,就是允许在不同的情况下,选择最为合适的推荐机制结果。

3. 分区的混合:采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户。

4. 分层的混合:采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐。

在这篇文章里面,Netflix自己号称多年磨一剑,找到了一个Page Generation的算法。该算法自动的生成推荐页面,并且考虑推荐结果和用户的相关性以及整个页面的多样性,并且已经在2015年度完成了上线。

Page Generation算法内容且听下回分解。

http://techblog.netflix.com/2015_04_01_archive.html

5. 尚未解决的技术问题

Presentation Bias

会员冷启动问题

会员账号共享问题

Evidence Selection算法还不够好。

6. 其他有意思的点

在Netflix系统里面,推荐流量占比达到80%,而搜索仅占了20%。甚至,在搜索流量下也会出推荐结果,放在搜索展示结果后面供用户选择。

A/B测试时,会区分老客和新客分别做。因为考虑到老客对已有系统的习惯可能会抵触,而新客却没有这个问题,所以他们更加倾向于使用新客来做实验。但是,因为新客的数量和日志质量问题,新客的实验结果可能会存在统计意义上的问题。

你可能感兴趣的:(2015年12月30日的Netflix最新paper)