数据挖掘学习笔记8-推荐算法

一、基于内容的推荐(根据商品内容进行推荐)
二、协同推荐(根据用户的好友评价进行推荐)
tf-idf:
tf——term frequency词频 频率
idf——inverse document frequency 在其他文档中出现的频率
数据挖掘学习笔记8-推荐算法_第1张图片
三、向量空间模型
将文档转换为向量,两篇文档的相似度就可以用向量的夹角余弦表示(1的时候相似度最大,0的时候相似度最小)
难点:同义词、多义词难以识别
解决方法:做矩阵分解,类似pca,将原本的空间压缩(保留特征值大的几项),去掉冗余信息、噪点。
LSA:
数据挖掘学习笔记8-推荐算法_第2张图片
四、pagerank
其中一种算pagerank的方法是根据指向自己的链接的外向链接数以及该链接的pagerank值确定(rank=Σ(ranki)/outbound num i)
数据挖掘学习笔记8-推荐算法_第3张图片
五、协同过滤
基于用户:
利用和自己最接近(相关)的用户信息来预测缺失的信息
数据挖掘学习笔记8-推荐算法_第4张图片
r是该用户已知的平均分
基于商品:
用商品和商品之间的相关性来预测
基于模型:
把打分矩阵转化为分类问题,将打分当做标签
阅读材料:

你可能感兴趣的:(数据挖掘,推荐算法,机器学习)