Facebook的神秘武器:A/B测试和离站数据

很多人都以为 Facebook 已经没以前那么 cool 了。

然而 Mark Zuckerberg 并不想让你有这样的想法。他们周三宣布了刚 过去季度的财报,看来他们的在用户中的好感度还是维持得不错的。Zuckerberg 透露,平均每天,Facebook 的 12.8 亿名用户中的 63% 都要 至少登陆网站一次。而在财报发布前过去的一个星期中,有 6 天至少 50% 的用户登陆了 Facebook。

那么,是什么让 Facebook 反而变得更流行了,而不是我们以为的“更无聊”了呢?

因为 Facebook 正在学习你的喜好,并且在为了你而变得更好。

尽管 Facebook 一直在 提取你的数据信息来进行更精准的广告投放,至少他们也在利用机器学习来了解你的喜好,了解哪些好友的帖子是你打开应用时更想要看到的。广告商是 Facebook 想要吸引的人,但只有巩固更高的用户活跃度才能为 Facebook 带来广告或是其他方面的收入。

失用户者,失天下。

那么 Facebook 是如何学会我们的喜好的呢?Facebook 的 news feed 产品团队领导 Will Cathcart 表示,答案并不简单,而是存在于算法、机器学习,乃至更宽泛的互联网中。

Facebook 2006 年推出了 news feed,然而一年后推出了“ 赞”(like)按钮——有了赞,Facebook 才开始基于你和你朋友以及朋友的朋友的喜好,学习倒你可能喜欢看到什么样的帖子。从 8 年前,到现在,news feed 已经从简单的时间逻辑排列的帖子列表,逐渐演化成了机器学习的产物(为什么我的 feed 还是 James Franco 在刷屏?坑爹!)。在这个 feed 中,所有的帖子按照时间顺序,并基于你可能的喜好程度进行排列。News Feed 的最终目标,举个例子,你打开页面的时候能够先看到你的大学室友生了个宝宝,而不是你远方表哥的天天酷跑成绩。

曾几何时,Facebook 中的点赞,以及其他的分享、评论,甚至只是点击,都被作为 Facebook 重要的用户活跃度指标。然而,Cathcart 表示,这个逻辑并不严谨。工作人员逐渐发现了越来越多的弊端:一张搞笑的 Imgur 图片,可能会在发送数分钟内收获几千个赞,而一篇富有深度的乌克兰局势分析,可能会因为机器学习的短处,不能获得较高的权重,而大大减少被人们浏览到的机会。最终的结果就是:人们的 feed 上充斥着垃圾内容,而并非人们真正“like”的故事。

这还不是最烂的事。Facebook 的用户还会发现,成千上万人们点赞的帖子,却是其他人们讨厌的帖子。比如那些用引人瞩目的标题,诱导别人点赞或分享的无聊文章,或是干脆使用假标题和图片,实际内容却是含有病毒或垃圾广告的网站。而 Facebook 却并未为这类内容设计一个“讨厌”(Dislike)按钮。Facebook 引以为豪的算法,并不能学习哪些内容是令用户感到厌烦的……直到一年之前,Facebook 才 正视自己内容质量严重下滑的问题。

Facebook的神秘武器:A/B测试和离站数据_第1张图片

Facebook 上的诱导行为

这并不是 Facebook 一家的问题,而是所有采用算法、机器学习来进行功能级决策的社交网站,乃至所有互联网公司所面临的问题。该怎样解决?有人认为,在机器学习的基础上,加入一定程度真人的干预会有效果。但 Facebook 的 news feed 规模太庞大了,机器学习的工作量已经大到人类无法干预的程度。因而,Facebook 只能另辟蹊径,直接对算法下手。目前 Facebook 的答案是开始收集其他形式的用户信息,用于为机器提供更加人性化的指导——比过去的赞、分享、评论和点击更实用,更高级。

在这些新形式的用户信息提取工作中,有三类目前帮助了 Facebook 重新界定算法。它们分别为调查(Survey)、A/B 测试以及一项以前令人更捉摸不透的数据——离站数据(Off-site Data):哪些帖子令用户点击之后离开 Facebook、离开了多久、回来之后用户进行了什么操作。

调查能够直接让 Facebook 提取到最关键的,别的提取方式无法提取到的信息;而 A/B 测试将 Facebook 进行的每一项算法微调都进行完整的测试。根据 Cathcart 的介绍,目前的规则是这样的:每当 Facebook 的工程师对算法进行一次微调之后,Facebook 都会单独针对这次调整将算法应用于一组用户进行测试,而每次调整进行的测试中的测试对象都不相同。Cathcart 透露,最多的时候甚至有 1000 种左右的不同版本的 Facebook 面向不同的用户运行。 Facebook 从所有测试对象中提取信息,来了解哪些算法优化真正改善了情况,而哪些优化没有产生效果。

最近,Facebook 测试了一系列用于 纠正“诱导点赞”行为的算法优化。使用诱导点赞行为的人,会在帖子的标题、图片、视频甚至是正文中使用诱导性的画面或词语,利用用户的从众心态来诱导点赞,而这些帖子的发送者因此能够提高在用户 feed 中的权重。Cathcart 表示,Facebook 目前的进展良好,已经“很快见到垃圾内容的点赞减少,而给深度的文章和正常内容的点赞增多。”

而对于离站数据,Cathcart 进行了更清晰的解释: “假设你是一名每次看到纽约时报发送的帖子,都要点进去的人;不仅点进去,还在当前页面离开了 Facebook 前往纽约时报,并且驻足了一段时间,然后回到了 Facebook 中;Facebook 就能够因此判定纽约时报的内容对你来说权重应该调整的更高,即便你并没有为该条内容点赞。

同时,Facebook 也在对于”点赞“这个动作进行更加细致的区分。Facebook 将要在点赞的时间上下功夫:用户是看到文章先点赞再点进去看,还是看完了文章回来再点的赞,在未来将会有更明显的区别。很多人看到一个帖子,只是被唬人的题目或者好看的头图而吸引点了个赞。如果只有很少一部分的人在看过文章之后回来点了赞或者分享,这很有可能说明这篇文章并不值得分享。

业内曾经有一部分人士认为,Facebook 最近对于算法的“优化”,实则 调低了竞争对手网站的内容权重,而相应提升了自己以及伙伴的内容权重。Cathcart 否认了这一观点,他坚称,Facebook 的算法内并不包含任何主观的评分系统,而是按照用户的喜好程度和操作行为进行权重的判定。举个例子,假如用户看到 A 网站的文章就点进去看,看到 B 网站的文章过了一会才去看,Facebook 就会在这种行为出现的更多之后,相应调整权重,让 A 的文章出现率更高。

归根究底, 在每一次用户登录的同时,Facebook 的后台都在计算并考虑为用户呈现什么样的内容,并且隐藏什么样的内容,即便这条内容是最新发出的。而Twitter 则确实做好了一个“时间线”的工作,用户想要看到更优质的内容,只能自己关注别人的时候多加注意了。因此,现在我们或许能够回答本文最一开始的问题:为什么 Facebook 反而变得更流行了?Twitter 这个当年西南偏南大会的当红炸子鸡,用户活跃度却 略显萎靡。不论我们如何努力,如何自满地认为我们能比算法做得更好,事实上我们当中的大部分人并没有时间面对着电脑或手机屏幕,翻阅多达数千条的 Facebook 留言,只为找到更重要的那条信息。Facebook 有点像一个过渡负责的母亲,但我们却开始更加思念和依赖亲人的爱。

后话:

扯远点,如果哪天 Facebook 能够将我们在 Facebook 上“喜欢”的东西,和我们在真实生活中真正喜欢的东西区分开来,或许那天开始我们会真正的开始“喜欢”Facebook 这个令人又爱又恨的东西。

图片:Facebook、《社交网络》;原文: Slate








你可能感兴趣的:(测试,Facebook,武器)