对pearson相关系数以及协方差矩阵的理解

之前一直从公式中理解,今天看到这个回答,用两个向量夹角余弦来理解感觉发现了新世界

https://segmentfault.com/q/1010000000094674

*********************************************************************

其二, 按照大学的线性数学水平来理解, 它比较复杂一点,可以看做是两组数据的向量夹角的余弦.

皮尔逊相关的约束条件

从以上解释, 也可以理解皮尔逊相关的约束条件:

  • 1 两个变量间有线性关系
  • 2 变量是连续变量
  • 3 变量均符合正态分布,且二元分布也符合正态分布
  • 4 两变量独立

在实践统计中,一般只输出两个系数,一个是相关系数,也就是计算出来的相关系数大小,在-1到1之间;另一个是独立样本检验系数,用来检验样本一致性.

**************************************************************************


对协方差理解,其中对标准差解释非常到位,其实就是所有值到平均值距离的平均值

http://www.cnblogs.com/chaosimple/p/3182157.html

你可能感兴趣的:(数据挖掘,特征工程)