利用上下文信息——《推荐系统实践》读书笔记（五）

一、书籍介绍

《推荐系统实践》项亮编著，陈义、王益审校，人民邮电出版社。

本篇读书笔记主要针对该书的第五章内容-利用上下文信息。

二、结构概览

三、主要内容

上下文（context）信息包括用户访问推荐系统的时间、地点、心情等。——用户当下所处的环境。比如说根据心情推歌。

1.时间上下文信息

（1）什么是时间效应

a）用户兴趣可能会随着时间不同而变化。

b）物品本身有生命周期。比如新闻的生命周期很短，音乐的生命周期很长。

c）季节效应：冬天吃火锅，夏天吃冰棍。

（2）系统时间特性的分析

添加时间上下文内容后，推荐系统从一个静态系统变成了一个时变的系统，用户行为数据也变成了时间序列，包含时间信息。

（3）推荐系统的实时性

实时的推荐系统要能够实时响应用户新的行为，当用户有所行为后，推荐列表不断变化，满足用户不断变化的兴趣。

如亚马逊：用户的显性反馈行为都会导致推荐列表的变化。

对推荐系统的要求：

a）对用户行为的存取具有实时性。

b）推荐算法本身具有实时性：实时计算推荐列表；算法需要平衡考虑用户的近期行为和长期行为。

（4）推荐算法的时间多样性

时间多样性高的推荐系统用户会经常在不同时间看到不同的结果。在不损失精度的情况下要提高推荐结果的时间多样性。

时间多样性的解决可以有两步：a）用户在有新行为后调整推荐结果，让结果满足用户最近的兴趣；b）用户没有新的行为也能够变化结果。

对于b），有几种思路。

*在生成推荐结果的过程中加入一定的随机性，随机挑选部分。

*对用户看到过的内容降权。

*每天使用不同的算法。

（5）算法

a）给用户推荐历史上最热门的物品

b）时间上下文相关的ItemCF算法

首先我们回顾一下ItemCF算法，主要是利用用户行为计算物品之间的相似度，然后根据推荐用户历史行为的物品中的相似物品。

增加时间信息后：

*用户在相隔很短的时间内喜欢的物品具有更高的相似度（针对物品之间相似度的计算）

*用户近期行为比用户很久之前的行为，更能体现用户现在的兴趣，优先给用户推荐近期行为相似的物品。

c）时间上下文相隔的UserCF算法

同样，UserCF算法是给用户推荐和她兴趣相似的其他用户喜欢的物品。

增加时间信息：

*不同用户在表达出对物品喜欢的时间距离越近，表明用户间的兴趣相似度更大。

*给用户推荐和他兴趣相似的用户最近喜欢的物品。因为时间越近，越能代表当下的兴趣。

（6）时间段图模型

在图模型中添加一个物品时间段节点集合和用户时间段节点集合。

2.地点上下文信息

不同地区，可能兴趣也会不同。

LARS的推荐系统：首先将物品分为有空间属性和没有空间属性的物品；其次，将用户也分为有空间属性（带有现在地址的）、没有空间属性的。由此将数据集分成带有空间属性的数据集。在地点上下文的推荐，可以考虑两个方面，第一，不同地方的用户兴趣存在者很大的差别，因此在推荐系统中要考虑用户的空间位置。第二，用户往往在附近的地区活动。因此不能给用户推荐太远的地方。

四、思考与总结

时间、地点可以认为是已经验证过的影响兴趣推荐的上下文信息。因此我们可以在已有的推荐算法中加入时间、地点的因素。对于一些未验证的因素，我们还需先验证，然后和已有的算法相结合。

利用上下文信息——《推荐系统实践》读书笔记（五）

你可能感兴趣的:(利用上下文信息——《推荐系统实践》读书笔记（五）)