推荐系统浅谈系列(五) - 上下文信息

本文是在《推荐系统实践》(项亮)的基础上总结,主要介绍上下文信息在推荐系统中的作用。

0.上下文信息
推荐系统中的上下文信息是指用户访问推荐系统的时间、地点、心情等。
举例1,当用户在中关村打开一个美食推荐系统时,如果这个推荐系统推荐的餐馆都是中关村附近的,显然推荐结果更加令用户满意。
举例2,用户上班时和下班后的兴趣会有区别,用户在平时和周末的兴趣会有区别
举例3,用户在不同的心情下会选择不同的音乐

本文主要介绍时间上下文和地点上下文,让推荐系统能够准确预测用户在某个特定时刻及特定地点的兴趣。

1.时间上下文信息
1.1时间信息对用户兴趣的影响
该影响表现在下面几个方面:

  • 用户兴趣是变化的,这里提到的用户兴趣变化是因为用户自身原因发生的变化。比如,以为程序员随着工作时间的增加,逐渐从阅读入门书籍过渡到阅读专业书籍。要预测用户现在的兴趣就应该关注用户最近的行为,因为最近的行为最能体现他现在的兴趣。

  • 物品也是有生命周期的,不同系统的物品具有不同的生命周期,比如新闻的生命周期很短暂,而电影的生命周期相对较长。当决定在某个时刻给某个用户推荐某个物品时,需要考虑该物品在该时刻是否已经过时。比如,我们给一个NBA迷推荐10年前的某个NBA新闻显然是不太合适的(除去一些特殊情况外)

  • 季节效应,主要反映了时间本身对用户兴趣的影响。比如人们夏天更爱吃冰淇淋,冬天更爱吃火锅。另外,节日也是一种季节效应:每年圣诞节,人们都会去购物

1.2推荐系统的实时性
用户兴趣是不断变化的,其变化体现在用户不断增加的新行为中。一个实时的推荐系统需要能够实时响应用户新的行为,让推荐列表不断变化,从而满足用户不断变化的兴趣。

实现推荐系统的实时性除了对用户行为的存取有实时性要求,还要求推荐算法本身具有实时性,而推荐算法本身的实时性意味着:

  • 实时推荐系统不能每天都给所有用户离线计算推荐结果,然后在线展示昨天计算出来的结果。所以,要求在每个用户访问推荐系统时,都根据用户这个时间点前的行为实时计算推荐列表
  • 推荐算法需要平衡考虑用户的近期行为长期行为,即要让推荐列表反应出用户近期行为所体现的兴趣变化,又不能让推荐列表完全受用户近期行为的影响,要保证推荐列表对用户兴趣预测的延续性。

以亚马逊网的推荐系统为例,它就是一个实时的推荐系统
搜索找到关于MongoDB的一本书,单机Liked按钮。重新回到亚马逊网得推荐系统页面,就会发现推荐列表变化了,多了一本Mahout in Action,单机 fix this recommendation,可以看到亚马逊网推荐这本书的理由:因为我刚刚为MongoDB:The Definitive Guide 单击了Liked.

推荐系统浅谈系列(五) - 上下文信息_第1张图片
推荐系统实时性举例

1.3推荐算法的时间多样性
推荐系统每天推荐结果的变化程度被定义为推荐系统的时间多样性。时间多样性高的推荐系统中用户会经常看到不同的推荐结果。
提高推荐结果的时间多样性需要分两步解决:

  • 首先,需要保证推荐系统能够在用户有了新的行为后及时调整推荐结果,使推荐结果满足用户最近的兴趣;
  • 其次,需要保证推荐系统在用户没有新的行为时也能经常变化一下结果,具有一定的时间多样性

如果用户没有行为,如何保证给用户的推荐结果具有一定的时间多样性呢?一般思路:

  • 在生成推荐结果时加入一定的随机性。比如从推荐列表前20个结果中随机挑选10个结果展示给用户,或者按照推荐物品的权重采样10个结果展示给用户
  • 记录用户每天看到的推荐结果,然后在每天给用户进行推荐时,对他前几天看到过很多次的推荐结果进行适当地降权
  • 每天给用户使用不同的推荐算法。可以设计很多推荐算法,比如协同过滤算法、内容过滤算法等,然后在每天用户访问推荐系统时随机挑选一种算法给他进行推荐

2.地点上下文信息
不同地区的用户兴趣有所不同,用户到了不同的地方,兴趣也会有所不同。
举例:在中关村逛街逛累了,希望寻找美食时,你可能会考虑几个因素,包括距离、价位、口味和口碑,而在这些因素里,最重要的因素可能是距离。因此,很多基于位置的服务(LBS)软件都提供了推荐附近餐馆和商店的功能。

推荐系统浅谈系列(五) - 上下文信息_第2张图片
左:大众点评 右:美团

2.1用户兴趣和地点相关的特征

  • 兴趣本地化,不同地方的用户兴趣存在着很大的差别,不同国家和地区用户的兴趣存在着一定的差异性
    项亮一书中,通过对Lastfm数据集的研究得到了不同国家用户对歌手兴趣的差异,如下图:
推荐系统浅谈系列(五) - 上下文信息_第3张图片
英、美、德三国用户对歌手的兴趣
  • 活动本地化,一个用户往往在附近的地区活动。在项亮一书中,分析数据集得到的结论是45%的用户其活动范围半径不超过10英里,75%的用户其活动半径不超过50英里。因此,在基于位置的推荐中我们需要考虑推荐地点和用户当前地点的距离,不能给用户推荐太远的地方

暂时写到这~~


                                         微信公众号: 
                          产品新人学习路 ( i-pm-road),欢迎交流
                                          (๑•ᴗ•๑)
推荐系统浅谈系列(五) - 上下文信息_第4张图片
产品新人学习路 ( i-pm-road)

你可能感兴趣的:(推荐系统浅谈系列(五) - 上下文信息)