Pearson相关系数、余弦相似度、修正余弦相似度

  • Pearson相关系数刻画变量间线性关系的强弱。
  • 余弦相似度,指通过计算两个向量的夹角余弦值来评估它们的相似度。
  • 修正余弦相似度,指中心化(减去平均值)后再求余弦相似度。
1. 从数学角度看,给定向量X和Y, Pearson相关系数和修正余弦相似度的计算是相同的,它们的关系参考下面的链接:
               https://www.cnblogs.com/tracer-dhy/p/5808323.html
2. 目前很多文档中提到Pearson相关系数修正余弦相似度的计算有差异,这主要是指当它们被应用到协同过滤问题中求用户的相似性时,计算上有一些不同,主要差异在于 心化方式不同。关于这一点,下面的链接有非常详细的阐述:
               http://wulc.me/2016/02/22/《Programming%20Collective%20Intelligence》读书笔记(2)--协同过滤/

你可能感兴趣的:(数据科学)