征服统计学07|什么是协方差?什么是相关系数?

本文介绍协方差和相关系数

本文目录

协方差

协方差描述变量之间关系

协方差VS相关系数

方差VS协方差

相关系数

相关系数量化相关性的强度​

p值及数据量衡量相关系数

Reference


协方差

协方差描述变量之间关系

  • 协方差(Covariance)主要用于描述变量之间的以下三类关系

征服统计学07|什么是协方差?什么是相关系数?_第1张图片

正相关关系,例如上图,同一细胞中Gene X表达量与Gene Y表达量成正相关。

征服统计学07|什么是协方差?什么是相关系数?_第2张图片

此时协方差为正。

征服统计学07|什么是协方差?什么是相关系数?_第3张图片

负相关关系,例如上图,同一细胞中Gene X表达量与Gene Y表达量成负相关。

征服统计学07|什么是协方差?什么是相关系数?_第4张图片

此时协方差为正。 

征服统计学07|什么是协方差?什么是相关系数?_第5张图片

征服统计学07|什么是协方差?什么是相关系数?_第6张图片
无相关关系,此时Gene X表达量与Gene Y表达量无趋势关系。

征服统计学07|什么是协方差?什么是相关系数?_第7张图片

此时协方差为零。


协方差VS相关系数

  • 协方差(Covariance)另一个作用在于辅助其它统计计算,如相关系数(correlation)。

征服统计学07|什么是协方差?什么是相关系数?_第8张图片

如上图,协方差可描述变量的相关性类别(正/负/无相关性),但对数据的取值范围非常敏感,不能用于描述变量之间的相关性程度(若正相关,正相关斜率为多大等);

而相关系数对数据取值范围不敏感,可用来描述变量之间的相关性程度。


方差VS协方差

方差为协方差的一种特殊模式,描述某个变量与本身之间的关系,由下图公式可非常容易理解。

征服统计学07|什么是协方差?什么是相关系数?_第9张图片


相关系数

征服统计学07|什么是协方差?什么是相关系数?_第10张图片

相关系数计算公式如上图,依赖两变量协方差及各变量的方差,这也回答了上一节所说的协方差辅助计算相关系数。

相关系数量化相关性的强度

征服统计学07|什么是协方差?什么是相关系数?_第11张图片

弱相关性对应较小的相关系数。

征服统计学07|什么是协方差?什么是相关系数?_第12张图片

强相关性对应较大的相关系数。

征服统计学07|什么是协方差?什么是相关系数?_第13张图片

征服统计学07|什么是协方差?什么是相关系数?_第14张图片

征服统计学07|什么是协方差?什么是相关系数?_第15张图片

征服统计学07|什么是协方差?什么是相关系数?_第16张图片

相关系数值域在[-1,1]之间,-1表示最强负相关,1表示最强正相关,0表示不相关。

p值及数据量衡量相关系数

征服统计学07|什么是协方差?什么是相关系数?_第17张图片

收集的数据越多,p值越小,推测出的相关系数越可信


Reference

  • https://www.bilibili.com/video/BV1iJ411R7zf?p=6
  • https://www.bilibili.com/video/BV1iJ411R7zf?p=7

你可能感兴趣的:(统计学精进,统计学,数学,生物信息学)