协方差及相关性

协方差(covariance)

用于衡量两个随机变量的联合变化程度;
如果两个随机变量不是独立变量,两个变量会存在一定程度的关联性,
协方差及相关性_第1张图片
协方差及相关性_第2张图片

如下图所示,如果协方差大于零,说明两个随机变量是正相关,如果协方差小于零,说明两个随机变量是负相关。如果两个随机变量没有强的相关性,那协方差接近零。如果两个随机变量存在很强的相关性,协方差也有可能接近零。
协方差及相关性_第3张图片
如下图所示,如果随机变量X和Y协方差很大,那这两个随机变量一定会存在很强的相关性吗?
协方差及相关性_第4张图片

计算协方差的另一种形式

协方差及相关性_第5张图片
协方差及相关性_第6张图片

如果两个变量是独立的,那协方差为零,如果协方差为零,不代表两个随机变量是独立的。

相关系数(correlation coefficient)

定义如下:
协方差及相关性_第7张图片
如下图所示,如果Y是X的线性方程,当a小于零时,Y和X的协方差小于零,则相关系数为-1,说明Y和X具有很强的负相关关系;当a大于零时,Y和X的协方差大于零,则相关系数为1,说明Y和X具有很强的正相关关系。
协方差及相关性_第8张图片
如下面的例子,协方差很大,然而相关系数为0.3,这说明了随机变量X和Y存在一定的线性关系,但是这种线性关系并不强。
协方差及相关性_第9张图片

你可能感兴趣的:(概率学基础,概率论)