利用上下文信息——《推荐系统实践》读书笔记(五)

一、书籍介绍

《推荐系统实践》项亮编著,陈义、王益审校,人民邮电出版社。

本篇读书笔记主要针对该书的第五章内容-利用上下文信息。

二、结构概览

利用上下文信息——《推荐系统实践》读书笔记(五)_第1张图片

三、主要内容

上下文(context)信息包括用户访问推荐系统的时间、地点、心情等。——用户当下所处的环境。比如说根据心情推歌。

1.时间上下文信息

(1)什么是时间效应

a)用户兴趣可能会随着时间不同而变化。

b)物品本身有生命周期。比如新闻的生命周期很短,音乐的生命周期很长。

c)季节效应:冬天吃火锅,夏天吃冰棍。

(2)系统时间特性的分析

添加时间上下文内容后,推荐系统从一个静态系统变成了一个时变的系统,用户行为数据也变成了时间序列,包含时间信息。

(3)推荐系统的实时性

实时的推荐系统要能够实时响应用户新的行为,当用户有所行为后,推荐列表不断变化,满足用户不断变化的兴趣。

如亚马逊:用户的显性反馈行为都会导致推荐列表的变化。

对推荐系统的要求:

a)对用户行为的存取具有实时性。

b)推荐算法本身具有实时性:实时计算推荐列表;算法需要平衡考虑用户的近期行为和长期行为。

(4)推荐算法的时间多样性

时间多样性高的推荐系统用户会经常在不同时间看到不同的结果。在不损失精度的情况下要提高推荐结果的时间多样性。

时间多样性的解决可以有两步:a)用户在有新行为后调整推荐结果,让结果满足用户最近的兴趣;b)用户没有新的行为也能够变化结果。

对于b),有几种思路。

*在生成推荐结果的过程中加入一定的随机性,随机挑选部分。

*对用户看到过的内容降权。

*每天使用不同的算法。

(5)算法

a)给用户推荐历史上最热门的物品

b)时间上下文相关的ItemCF算法

首先我们回顾一下ItemCF算法,主要是利用用户行为计算物品之间的相似度,然后根据推荐用户历史行为的物品中的相似物品。

增加时间信息后:

*用户在相隔很短的时间内喜欢的物品具有更高的相似度(针对物品之间相似度的计算)

*用户近期行为比用户很久之前的行为,更能体现用户现在的兴趣,优先给用户推荐近期行为相似的物品。

c)时间上下文相隔的UserCF算法

同样,UserCF算法是给用户推荐和她兴趣相似的其他用户喜欢的物品。

增加时间信息:

*不同用户在表达出对物品喜欢的时间距离越近,表明用户间的兴趣相似度更大。

*给用户推荐和他兴趣相似的用户最近喜欢的物品。因为时间越近,越能代表当下的兴趣。

(6)时间段图模型

在图模型中添加一个物品时间段节点集合和用户时间段节点集合。

2.地点上下文信息

不同地区,可能兴趣也会不同。

LARS的推荐系统:首先将物品分为有空间属性和没有空间属性的物品;其次,将用户也分为有空间属性(带有现在地址的)、没有空间属性的。由此将数据集分成带有空间属性的数据集。在地点上下文的推荐,可以考虑两个方面,第一,不同地方的用户兴趣存在者很大的差别,因此在推荐系统中要考虑用户的空间位置。第二,用户往往在附近的地区活动。因此不能给用户推荐太远的地方。

四、思考与总结

时间、地点可以认为是已经验证过的影响兴趣推荐的上下文信息。因此我们可以在已有的推荐算法中加入时间、地点的因素。对于一些未验证的因素,我们还需先验证,然后和已有的算法相结合。

延伸阅读:

推荐系统冷启动问题——《推荐系统实践》读书笔记(三)

利用用户数据——《推荐系统实践》(二)

利用用户标签数据——《推荐系统实践》读书笔记(四)

你可能感兴趣的:(利用上下文信息——《推荐系统实践》读书笔记(五))