A Singular Value Decomposition Approach For
Recommendation Systems
说明:这是一篇来自土耳其中东技术大学的2010年的硕士论文,主要讲述了在推荐系统中应用SVD方法。
这篇文章可以到http://download.csdn.net/detail/yuzhongchun/8078769下载。
Chapter 2 Recommender Systems
2.1 Definition of a Recommender-System (RS)
推荐系统包括两个基本部分:用户的偏爱信息,决定一个用户是否对一个物品感兴趣的方法
2.1.1 Recommendation Process
推荐处理过程如下图:
2.2 Recommendation Techniques
推荐技术可以分为如下图所示的5种:
2.2.1 CollaborativeRecommendation
可以分为基于内存的算法(Memory-basedAlgorithms)和基于模型的算法(Model-basedAlgorithms)。
2.2.1.1 Memory-basedAlgorithms
主要的基于内存的方法有:
Ø User-basedApproaches
基于用户的推荐算法
Ø Item-basedApproaches
基于物品的推荐算法
这两种方法是协同过滤算法中的常见算法,关键在于相似度的计算。
2.2.1.2 Model-basedAlgorithms
基于模型的算法使用评分集合作为训练集来学习一个模型,用这个模型去预测评分。基于模型的方法往往要花费比较多的时间去构建和更新模型。基于模型的推荐常用很多的学习技术包括神经网络,隐语义索引和贝叶斯网络。
2.2.2 Content-based Recommendation
基于内容的推荐时信息过滤研究的结果和继续。
2.2.3 Demographic Recommendation
基于统计的推荐旨在根据个人属性对用户进行分类,然后根据统计分类进行推荐。基于统计的推荐的优点在于它不需要用户评分的历史数据,而这些信息是协同过滤和基于内容的推荐所必须的。
2.2.4 Utility-base Recommendation
基于效用的推荐根据每个物品的效用的计算为用户做推荐,关键性的问题是怎么去为每个用户创建一个效用函数。基于效用的推荐优点是它可以把非物品属性,比如卖家的可靠性和产品的实用性,分解成效用计算。
2.2.5 Knowledge-basedRecommendation
基于知识的推荐试图根据用户的需要和偏爱的推理来推荐。基于知识的推荐有两个功能知识:
Ø 一个物品怎样满足一个用户的需求;
Ø 给出一个可能的推荐能够满足一个需求的原因。
2.3 Hybrid Recommendation Systems
混合推荐系统
RobinBurke的”Hybrid Recommender System: Survey andExperiments”(2002)是一篇有关不同混合推荐算法设计方案的著名调研报告。它给出了各种推荐算法的分类标准。本文即是参考这篇文章讲述的混合推荐。
Ø Weighted: 加权式混合,通过计算两个或多个推荐系统结果分数的加权和,将它们组合在一起。
Ø Switching: 切换式混合,需要一个权威者根据用户记录或推荐结果的质量来决定在哪种情况下采用哪种推荐系统。
Ø Mixed: 交叉式混合,在用户交互界面这个层面上将不同推荐系统的结果组合在一起,各种方法所得到的结果被一起呈现。
Ø Feature Combination: 特征组合的混合方案,使用不同推荐技术的特征进行推荐。
Ø Cascade: 串联混合,将一组推荐方法按顺序排列,后面的推荐方法对前面的推荐结果做优化。
Ø Feature Augmentation: 特征补充的混合方案
Ø Meta-level: 分级混合,一种推荐方法构建的模型被主推荐方法用来生成推荐结果。
总结:
第二章节主要介绍了推荐系统的基本知识,包括什么是推荐系统,推荐系统的处理流程和推荐系统的常用技术;重点介绍了推荐系统的常用技术。
下表是根据论文内容和其它资料整理的的一个大致的分类:
协同过滤推荐 |
基于内存的推荐 |
基于用户的最近邻推荐 |
基于物品的最近邻推荐 |
||
基于模型的推荐 |
矩阵分解、LSA、pLSA、LSI、PCA(主成分分析)、LFA(Latent Factor Model)、LDA、Topic Model |
|
基于内容的推荐 |
||
基于知识的推荐 |
||
混合推荐 |
整体式混合设计 |
特征组合的混合方案 |
特征补充的混合方案 |
||
并行式混合设计 |
交叉式混合 |
|
加权式混合 |
||
切换式混合 |
||
流水线混合设计 |
串联混合 |
|
分级混合 |
下表来自《程序员》杂志2013精华版:
|
基于内存(启发式算法) |
基于模型 |
基于内容 |
TF-IDF 聚类 最大熵 相似性度量 |
贝叶斯分类器 决策树 神经网络 专家系统 知识推理 |
协同过滤 |
K近邻 聚类 链接分析 关联规则 相似性度量 |
贝叶斯分类 决策树 神经网络 矩阵分解 概率模型 图模型 Boosting Topic Model 回归分析 |
混合式 |
线性组合 投票机制 meta-heuristics |
Ensemble 统一推荐框架 |