UserCF和ItemCF终极对比

说是终极对比,明确告诉你,就是在炒作!本文内容主要是我看了项亮的《推荐系统实践》一书,之前对于UserCF和ItemCF也是用的模模糊糊,这次好好整理了一下,加上自己一些总结和心得。

UserCF

推荐和当前用户相似度高的N个用户产生过行为的物品给当前用户;

这些物品是当前用户没有行为过而其他N个用户行为过的物品的前M个;

余弦相似度改进:在分子中除了考虑两个用户共同行为的物品,还考虑到这个物品被多少个用户行为过。
这里写图片描述
加入时间因子:

  • 相似度计算:用户u和用户v对物品i产生行为的时间越远,那么这两个用户的兴趣相似度就会越小。
    这里写图片描述
  • 预测阶段:和当前用户相似的其他用户最近行为过得物品更容易得到推荐。
    这里写图片描述

优缺点:

  • 群体/个体:更依赖于当前用户相近的用户群体的社会化行为
  • 计算代价:适用于用户数较少的场合
  • 适用场景:时效性强,用户个性化兴趣不太显著的场合
  • 冷启动:新加入的物品能很快进入推荐列表
  • 实时性:用户新的行为不一定导致推荐结果的变化

ItemCF

推荐和当前用户历史上行为过的物品相似的物品给当前用户;

对于当前用户历史航行为过的每一个物品,推荐和每一个物品相似度高的前N个物品给当前用户;

余弦相似度改进:在分子中除了考虑这两个物品是否同时被用户行为过,还考虑该用户一共行为过的物品的数量。
这里写图片描述
物品相似度的归一化:将相似度矩阵按照最大值归一化,可以提高推荐的准确率,还可以提高推荐的覆盖率和多样性。

加入时间因子:
- 相似度计算:在原先余弦相似度基础上,同一个用户对两个物品行为的时间距离越近,相似度越大。
这里写图片描述
- 预测阶段:和当前时间距离近的用户作用过的物品相似的物品更容易得到推荐。
这里写图片描述
优缺点:

  • 群体/个体:更侧重用户自身的个体行为
  • 计算代价:适用于物品数较少的场合
  • 适用场景:长尾物品丰富,用户个性化需求强烈的场合
  • 冷启动:新加入的用户能很快得到推荐
  • 可解释性:强
  • 实时性:用户新的行为一定导致推荐结果的变化

你可能感兴趣的:(机器学习)