基于隐语义模型的推荐算法的原理

隐语义模型(LFM)和LSI,LDA,Topic Model其实都属于隐含语义分析技术,是一类概念,他们在本质上是相通的,都是找出潜在的主题或分类。
这些技术一开始都是在文本挖掘领域中提出来的,近些年它们也被不断应用到其他领域中,并得到了不错的应用效果。

LFM算法的核心是将user-item(M*N)矩阵分为俩个矩阵P(M*F),Q(F*N):

  • P矩阵反映了用户对于各个类别的兴趣
  • Q矩阵反映了物品属于各个类别的比重

其中F是我们推测的隐分类的个数

如何将原矩阵分为P,Q两个矩阵?

这里写图片描述

本质来说,这是一个最优化问题:
这里写图片描述

前面部分是平方损失,而后面的部分是正则化项(防止过拟合)
至于求解的方法,就是降低损失函数,一般最常用的是梯度下降,具体求解网上有很多解释,再次不做赘述

而推荐方法就是计算最终PQ矩阵的乘积,然后将其中用户没有行为评分较高的物品推荐给他

这里有个疑问是,为什么我只是对原先的矩阵进行拟合,就能够为我推荐新的物品?

因为我们原先的操作已经对我们的喜好有了一定的描述,对于没有行为物品我们也对它都由一个隐藏的评估,用机器学习的视角看,这就是模型的参数选择问题,通过拟合已知数据,我们就能够预测未知数据

你可能感兴趣的:(实训)