皮尔逊相关系数的计算过程

皮尔逊相关系数计算过程备忘。

首先记录下3个公式:

1、皮尔逊相关系数公式:
2、协方差公式:
3、标准差公式: s=sqrt(((x1-x)^2 +(x2-x)^2 +......(xn-x)^2)/n)。x为x1~xn的均值(也叫做期望值E[X])

本例中使用维基百科中的例子:例如,有5个国家的国民生产总值分别为 10、20、30、50 、80 亿美元。 假设这5个国家 (顺序相同) 的贫困百分比分别为 11%、12%、13%、15%、18%(使用0.11、0.12、0.13、0.15、0.18) 。皮尔逊相关系数计算过程如下:

1、先计算分子XY变量的协方差,我使用E[XY]-E[X]E[Y]公式进行计算:

10*0.11= 1.1
20*0.12= 2.4
30*0.13= 3.9
50*0.15= 7.5
80*0.18= 14.4
E[XY]= (1.1 + 2.4 + 3.9 + 7.5 + 14.4) / 5 = 5.86

 

E[X]=(10+20+30+50+80)/5=38

E[Y]=(0.11+0.12+0.13+0.15+0.18)/5=0.138

计算得出协方差cov(X,Y)结果为5.86-38*0.138=0.616

2、然后计算分母X和Y的标准差

上面已经得出X和Y的均值(期望值E[X],E[Y])分别为38和0.138。

计算X标准差:

(10-38)^2= 784
(20-38)^2= 324
(30-38)^2= 64
(50-38)^2= 144
(80-38)^2= 1764
σX sqrt((784 + 324 + 64 + 144 + 1764) / 5) = 24.81935...

计算Y标准差:

(0.11-0.138)^2= 0.000784
(0.12-0.138)^2= 0.000324
(0.13-0.138)^2= 0.000064
(0.15-0.138)^2= 0.000144
(0.18-0.138)^2= 0.001764
σY sqrt((0.000784 + 0.000324 + 0.000064 + 0.000144 + 0.001764) / 5) = 0.024819...

计算得出σXσY结果为24.81935...*0.024819...=0.616

3、最终得到皮尔逊相关系数0.616/0.616=1,XY正相关

你可能感兴趣的:(相关性,算法)