推荐系统的五大挑战

2009年,大批喜欢推荐系统的工程师们在阿姆斯特朗举行会议,探讨如何建立一个高效的推荐系统。下面是工程师们总结的推荐系统的5大挑战,我们一一阐述。

1.数据匮乏

为了有效的产生推荐,也许推荐系统面临的最大挑战是其需要大量的数据。那些在推荐方面做得较好的企业,比如Google、Amazon、Netflix和Last.fm,恰好是那些拥有大量用户数据的企业,这不能说是个巧合。如下图所示,一个好的推荐系统首先需要项目(item)数据(来自目录或表单),然后神奇的推荐算法才能工作。推荐系统使用的项目和用户的数据越多,推荐准确的概率就越大。然而,这就变成了“先有鸡还是先有蛋”的问题;为了得到更好的推荐,你需要大量的数据;有了较好的推荐结果,你才能获得大量的用户数据。

2.变化的数据

Paul(一家做智能推荐的CEO)指出,系统总是钟情于老的事物,而在显示新事物方面却存在着很大的困难。拿一个具有时尚特征的资源来说,用户的过去行为并不是很有用,因为潮流总是在变化的。显然,如果推荐系统不能赶上潮流的变化趋势,那么推荐系统的推荐算法就会变得很困难。大部分追求潮流的人们,都依赖于他们那些追求潮流的朋友和家人向他们推荐的衣服。在这种情况下,基于内容的推荐算法是不能工作的,因为有太多的产品属性代表潮流,每一个属性对于不同的用户在不同的时间的重要性程度是不同的。David(某专家)指出,也许社会化推荐系统可以解决这类问题。

3.变化的用户偏好

Paul同时指出,当我们浏览一个电子商务网站时,今天有个特定的偏好,而明天可能就会又一个不同的偏好。一个典型的例子如下:一天我可能在亚马逊上为我自己浏览最新的图书,而第二天我却在亚马逊上为我的妹妹寻找一份生日礼物。在用户偏好这个话题上,推荐系统有可能会给用户打上错误的标签。

4.无法预测的项目

我们知道,在Netflix百万大奖竞赛中,古怪的电影存在着很大的问题,用户对这类电影表现出偏激的喜欢或憎恨,比如《大人物拿破仑》(Napoleo n Dynamite)。这类项目的推荐是非常困难的,因为用户对它们的反应是多样化的和无法预测的。在音乐领域,这类项目是非常普遍的。你能猜到一个用户同时喜欢Metallica和Carpenters的音乐吗?我怀疑Last.fm作出这样的推荐的能力。

5.推荐系统是复杂的

上面提到的也仅是推荐系统的表面现象,事实上推荐系统是非常复杂的。如下图所示是一个最简单的推荐系统用到的变量。可以看出,即使是最简单的推荐系统,其使用的变量也是非常多的。

迄今为止,也仅有少数公司可以向用户提供满意的个性化推荐服务,比如Amazon、Netflix,Google也算是其中一个。尽管成功的案例很少,数以百计的站点及应用也在不断的寻找神奇算法去向用户提供高质量的推荐服务。

当然,推荐系统还存在着许多其它的问题。比如,一些推荐系统只能进行简单的大众化的推荐,另一些推荐系统不能足够的支持长尾,而只能推荐明显的项目等等。


转载来自点点实验室

你可能感兴趣的:(推荐系统)