【推荐算法学习笔记一】Memory-Based Collaborative Filtering

基于显示反馈(explicit feedback)的推荐

问题描述

假设我们将用户的显示反馈记录在一个矩阵(评分矩阵)中:

【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第1张图片

矩阵中的数字代表用户对物品的评分,?表示缺失值。这是一个预测评分的问题,我们需要通过群体智慧来预测?中的值

集体智慧假设

  • User-based CF:

在过去有相同品味的用户们在未来也很有可能具有相似的品味。

  • Item-based CF:

一个用户很有可能喜欢与他过去喜欢的物品相似的物品

符号定义

【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第2张图片
【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第3张图片
相似度


皮尔森相关系数----Pearson correlation coefficient (PCC)

user_u和user_w之间的相似度:

【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第4张图片

调整后的余弦相似度----Adjusted Cosine similarity

item_k和item_j 之间的相似度:

【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第5张图片


两种相似度的取值范围都是[-1,1]。-1为负相关,1为正相关。


邻居选择过程

  • User-based CF

最近的Top-K 邻居:

【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第6张图片
  • Item-based CF
最近的Top-K 邻居:

【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第7张图片

  • 可能存在的问题

    对于user和item来说,可能邻居不够K个(以user_u为例,就是买过自己买过的物品的其他user数量不足K个),这时候将会用到整个邻居集,这种情况下,靠邻居的信息来计算并没有那么可靠。


预测评分公式 (Prediction Rule)

User-based CF

    user_u对item_ j的预测评分为:【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第8张图片


Item-based CF

     user_u对item_ j的预测评分为:【推荐算法学习笔记一】Memory-Based Collaborative Filtering_第9张图片


在预测公式中,所有的数值都是预计算好的,没有需要学习的参数。

其他的一些细节想到再补充。

本文内容来自SZU 潘老师的课件。

你可能感兴趣的:(推荐算法)