推荐系统实战(项亮)-好的推荐系统

1.什么是推荐系统

推荐系统,自动联系用户和信息的一种工具。
推荐系统目的:解决信息过载问题

搜素引擎&推荐系统:
搜素引擎:需要用户有明确需求
推荐系统:不需要用户有明确需求,通过分析用户的历史行为给用户建模。

推荐系统分类:社会化推荐、基于内容的推荐、基于协同过滤的推荐
联系用户和信息的常用方式:利用好友、用户历史兴趣记录、用户的注册信息

2.个性化推荐系统的应用

推荐系统在应用中,主要通过分析大量用户行为日志,给用户提供不同的个性化页面展示
推荐系统应用构成:前台展示页面、后台日志系统、推荐算法系统

2.1电子商务-亚马逊
  • 个性化推荐
    • 根据Facebook好友喜欢的物品进行推荐
    • 推荐与用户之前喜欢的商品相似的商品
  • 相关商品推荐
    • 购买过该商品的用户经常购买的商品
    • 浏览过该商品的用户经常购买的商品
2.2 电影和视频网站

NetFelix:基于物品/信息的推荐,推荐与用户之前喜欢的电影相似的电影。
YouTube:基于物品/信息的推荐,推荐与用户之前喜欢的视频相似的视频。

2.3 个性化音乐网络电台

Pandora:基于内容推荐,推荐与用户之前喜欢的音乐在基因上相似的音乐。
Las.fm:给用户推荐和他有相似听歌爱好的其他用户喜欢的歌曲。

2.4 社交网络

data:用户之间的网络关系,用户的偏好信息
利用社交网络信息给用户推荐本站(电影,音乐等)各种物品。
社交网站本身利用社交网络信息给用户推荐其他用户在社交网中的会话。
社交网站本身利用社交网络信息给用户推荐好友

2.5 个性化阅读

goole reader:推荐关注的用户分享的文章
zite:收集用户对文章的偏好信息。
Digg:计算用户之间的兴趣相似度,推荐相似兴趣的用户喜欢的文章。

2.6 基于位置的推荐

基于位置的推荐往往会 社交网络结合。
Foursquare:给用户推荐好友在附近的行为。

2.7 个性化邮件

Tapestry :通过分析用户的历史行为和习惯对邮件进行重新排序。
谷歌:通过分析用户的历史行为,找到用户感兴趣的邮件,专门展示。

2.8 个性化广告,计算广告学
  • 上下文广告
  • 搜索广告
  • 个性化广告

3. 推荐系统评测

3.1 推荐系统实验方法
1)、离线实验
2)、用户调查
3)、在线实验
3.2 评测指标
3)、覆盖率

覆盖率,描述一个推荐系统对物品长尾的发觉能力。
定义:

  • 推荐系统能够推荐出来的物品占总物品集合的比例。
  • 通过研究物品在推荐列表中出现次数的分布描述推荐系统发现长尾的能力。若分布比较平缓,则说明推荐系统的覆盖率高;若分布比较陡峭,则说明推荐系统的覆盖率低。
    • 信息熵,表示混乱程度。信息熵越大,推荐系统覆盖率越低;信息熵越小,推荐系统覆盖率越高。
    • 基尼系数,衡量一个国家/地区居民收入差距的指标。基尼系数范围为[0,1],基尼系数越趋于0,推荐系统覆盖率越高;基尼系数约趋于1,推荐系统覆盖率越低。

马太效应:强者更强,弱者更弱。
判断推荐算法是否具有马太效应:G2>G1
   G1:初始用户行为中计算出来的物品流行度的基尼系数。
   G2:推荐列表中计算出的物品流行度的基尼系数。

5)、新颖性

实现方法:最简单的方法,把那些用户之前在网站中对其有过行为的物品从推荐列表中过滤掉。
评价方法:推荐结果的平均流行度。

你可能感兴趣的:(推荐系统实战(项亮)-好的推荐系统)