python统计分析——协方差和pearson相关系数

参考资料:用python动手学统计学

使用数据见代码:

dic={
    "x":[18.5,18.7,19.1,19.7,21.5,21.7,21.8,22.0,23.4,23.8],
    "y":[34,39,41,38,45,41,52,44,44,49]
}
cov_data=pd.DataFrame(dic)

变量x、y的协方差Cov(x,y)的计算公式如下:

\mathrm{Cov}(x,y)=\frac{1}{N}\sum_{i=1}^{N}(x_{i}-\mu_x)(y_{i}-\mu_{y})=\frac{1}{N-1}\sum_{i=1}^{N}(x_{i}-\bar{x})(y_{i}-\bar{y})

协方差的含义:

协方差大于0:一个变量取值越大,另一个变量的取值也越大;

协方差小于0:一个变量取值越大,另一个变量的取值越小;

协方差等于0:两个变量不相关。

numpy.cov()函数可计算出x和y的协方差矩阵。

当指定ddof=0时,计算总体的协方差

python统计分析——协方差和pearson相关系数_第1张图片

当指定ddof=1时,计算样本协方差

python统计分析——协方差和pearson相关系数_第2张图片

       在协方差矩阵中,左上到右下的对角线上分别是x和y的标准差,左下到右上的对角线上分别是x和y的标准差。

 pearson相关系数

\rho _(x,y)=\frac{\mathrm{Cov}(x,y)}{\sigma_{x}\sigma_{y}}

python实现方法:

方法1:dataframe.corr()

python统计分析——协方差和pearson相关系数_第3张图片

方法2:series.corr()

python统计分析——协方差和pearson相关系数_第4张图片

方法3:numpy.corrcoef()

python统计分析——协方差和pearson相关系数_第5张图片

你可能感兴趣的:(python)