Pearson’s product moment correlation/皮尔逊(森)积矩相关系数

相关系数:


相关系数士一种用以衡量俩对随机变量(bivariate random variables)的关系的度量。一般用来度量俩随机变量x和y 的相关度(measure of correlation)必须满足下列条件:


  1. 相关度数值应该 介于-1 和 +1 之间
  2. 若随机变数 x 的较大值倾向于 y 较大值配对,且 x 的较小值倾向于 y 较小值配对, 则其相关测度值应该为正值,若此配对越密切,则其值应该越接近+1。
  3. 若随机变数 x 的较大值倾向于 y 较小值配对,且 x 的较小值倾向于 y 较大值配对, 则其相关测度值应该为负值,若此配对越密切,则其值应该越接近-1。
  4. 若随机变数 x 的值似乎与y值随机配对,则其相关测度值应该接近于0。此时俩随机变量x与y 无关 

皮尔森相关系数:


统计学中,皮尔逊积矩相关系数(英语:Pearson product-moment correlation coefficient,又称作 PPMCC或PCCs, 文章中常用r或Pearson's r表示)用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。


在自然科学领域中,该系数广泛用于度量两个变量之间的相关程度。它是由卡尔·皮尔逊弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来的。这个相关系数也称作“皮尔森相关系数r”。


皮尔逊相关系数是一种度量两个变量间相关程度的方法。它是一个介于 1 和 -1 之间的值,其中,1 表示变量完全正相关, 0 表示无关,-1 表示完全负相关。




Pearson’s product moment correlation/皮尔逊(森)积矩相关系数_第1张图片




Pearson’s product moment correlation/皮尔逊(森)积矩相关系数_第2张图片


or:





公式:【可以看出该系数即为我们非常熟悉的一元线性回归中的测定系数“R2”的开方值】

使用条件:样本来自正态总体

统计检验:可以用t 统计量对总体相关系数为0的原假设进行检验。若t 检验显著,则拒绝原假设,即两个变量是线性相关的;若t 检验不显著,则不能拒绝原假设,即两个变量不是线性相关的。【本质上是一元回归中的回归参数显著性检验】

R语言实现:

> n <- 10
> x <- rnorm(n)
> y <- rnorm(n)

> cor(x,y)
[1] -0.4132864

> cor.test(x,y)

Pearson's product-moment correlation
data: x and y
t = -1.2837, df = 8, p-value = 0.2352
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.8275666 0.2924366
sample estimates:
cor
-0.4132864

上面给出了相关系数的可信度区间和P-value。





你可能感兴趣的:(Statistics/统计)