pearson相关系数

概述:

pearson相关系数用于比较两组变量是否线性相关,比如{a1,a2,a3,a4}与{b1,b2,b3,b4}他们都是同增加或者同减少,那么他们就是相关的。

取值:

相关系数的取值为-1<r<1,为0时表示不相干,正数的时候为正相关,负数的时候为负相关,如下所示:


pearson相关系数_第1张图片
 |r|取值与相关程度的关系如下所示:


pearson相关系数_第2张图片
适用条件:

1、两变量均应由测量得到的连续变量。

2、两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。

3、变量必须是成对的数据。

4、两变量间为线性关系。

计算方法:


pearson相关系数_第3张图片
 

其中
为x取值的平均值

因为样本和总体存在误差,因此对样本计算的结果还要进行假设检验

 

用途:

1.两组观察值是否有关系

2.两用户的两组评分那么他们是否相似
 

 

 

你可能感兴趣的:(PEAR)