方差、协方差、期望、相关系数等概念集合

首先说明一下,本文是本人在复习方差等相关知识的过程中,通过网络上的相关讲解,进行个人总结后得到的,并非个人原创,在此发布只是为了作为一个学习记录与大家分享。

1.期望

      试验中可能出现的值及其概率的乘积,即是数学期望

   1)离散型

   离散型随机变量的一切可能的取值Xi与对应的概率p(Xi)乘积之和称为该离散型随机变量的数学期望(若该求和绝对收敛),记为E(X)。它是简单算术平均的一种推广,类似加权平均。

方差、协方差、期望、相关系数等概念集合_第1张图片                                                      

   2)连续型

      设连续性随机变量X的概率密度函数为f(x),若积分绝对收敛,则称积分的值为随机变量的数学期望,记为E(X)。

方差、协方差、期望、相关系数等概念集合_第2张图片

期望的一些性质:

a.E(C)=C

b.E(CX)=CE(X)

c.E(X+Y)=E(X)+E(Y)

d.当X和Y相互独立时,E(XY)=E(X)E(Y)

2.方差

     方差用于反映观察值与平均值之间的偏离程度,通过方差可以看出一组数据的离散程度

 

     求方差时,首先需要先求出数据的平均值,然后再求解方差,公式如上!

3.标准差

      标准差即方差开平方

4.协方差

        协方差用于衡量两个变量的总体误差;

        如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

       如果X与Y是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足E[XY]=E[X]E[Y]。

 

5.相关系数

方差、协方差、期望、相关系数等概念集合_第3张图片

       其中的Var(x)就是方差D(x),这是方差的两种表示方式

       相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同。

       当然也可以将相关系数看作随机变量标准化后的协方差

         1)当相关系数ρ=1时,随机变量X和Y之间存在线性关系,且为正线性相关

      2)当相关系数ρ=−1时,两者之间为负线性关系

     3)|ρ|≤1,线性相关性随着|ρ|的减小而减小。当|ρ|=0时,两者之间就不存在线性关系了

      注意:

      当|ρ|=0,随机变量X和Y是不线性相关的,但不能代表两者相互独立,    

      他们之间可能存在别的相关关系;但当X和Y相互独立时,它们的相关系

      数|ρ|=0。可以说,|ρ|=0是X和Y相互独立的必要不充分条件。

      但是,当随机变量(X,Y)服从二维正态分布时,则X和Y不相关等价于两者

      相互独立

你可能感兴趣的:(数据分析)