R中方差,协方差,相关系数

提到方差,一个命令var()。

方差定义用来度量随机变量和其数学期望(即均值)之间的偏离程度。

> a = sample(10)
> a
 [1]  4  2  9  3  6 10  8  5  7  1
 > var(a)
[1] 9.166667

是协方差。协方差定义用于衡量两个变量的总体误差,即描述两个变量之间的相对于各自的期望值的变化趋势。方差是协方差的一种特殊情况,即两个变量是同一个变量的情况。

> b = matrix(sample(20),4,5)
> b
     [,1] [,2] [,3] [,4] [,5]
[1,]   10   12    8   17   20
[2,]    4   11    6    3   19
[3,]   15    1    2   13   16
[4,]    7   14    9    5   18
> cov(b)
           [,1]       [,2]      [,3]       [,4]      [,5]
[1,]  22.000000 -21.666667 -9.333333  23.333333 -5.000000
[2,] -21.666667  33.666667 17.500000 -13.666667  7.833333
[3,]  -9.333333  17.500000  9.583333  -4.166667  3.916667
[4,]  23.333333 -13.666667 -4.166667  43.666667  0.500000
[5,]  -5.000000   7.833333  3.916667   0.500000  2.916667

协方差和相关系数又存在很大的区别。相关系数定义研究变量之间线性相关程度的量,即主要反映两个变量之间的线性关系,正相关或者负相关,通过相关系数R反映 (R值得范围-1~1)。所谓正相关,即R>0,即两变量同向变化,R越接近1,相关性越强;反之,则为负相关。当然R=0时,也就没啥关系啦。


你可能感兴趣的:(R)