[梳理]协方差、方差、相关系数

1. 定义:

两个随机变量X与Y。

1.1 协方差Cov(X, Y)

用来衡量两个随机变量的相关程度,定义式:

Cov(X,Y)=E{ [ X-E(X) ] [ Y-E(Y) ] }

当Cov(X,Y)>0时,称X与Y正相关;
当Cov(X,Y)=0时,称X与Y不相关;
当Cov(X,Y)<0时,称X与Y负相关;

1.2 方差Var(X)

用来衡量随机变量X的离散程度,定义式

Var(X) = Cov(X,X)

Var(X)越大, 离散程度越大。

标准差,即为方差开根号,作用同方差。

1.3 相关系数Corr(X,Y)

用来衡量两个随机变量的相关程度,与方差相比,相关系数的值在-1~1之间,定义式:

Corr(X,Y) = Cov(X,Y)/(X的标准差*Y的标准差)

Corr(X,Y)=0,则称X与Y不相关。不相关是指X与Y没有线性关系,但也有可能有其他关系,比如平方关系、立方关系等;
Corr(X,Y)=1,则称X与Y完全正相关;
Corr(X,Y)=-1,则称X与Y完全负相关;

你可能感兴趣的:(python,数理统计等)