均值、方差、标准差、协方差详解及MATLAB实现

一、平均数、方差、标准差、协方差、协方差矩阵的概念

1、平均数

  1. 含义:反映数据集中趋势的一项指标
  2. 计算公式:指在一组数据中所有数据之和再除以数据的个数
    在这里插入图片描述

2、方差

  1. 含义:衡量随机变量及其数学期望(即均值)之间的偏离程度
  2. 计算公式:各个数据与数学期望之差的平方之和,再除以这组数据的个数。
    在这里插入图片描述
    即为:
    均值、方差、标准差、协方差详解及MATLAB实现_第1张图片

3、标准差

  1. 含义:反映一个数据集的离散程度,平均数相同的两组数据,标准差未必相同。
  2. 计算公式:方差的算术平方根(很多帖子写错了,是算术平方根)。
    均值、方差、标准差、协方差详解及MATLAB实现_第2张图片
    标准差与方差的关系:方差=标准差的平方

4、协方差

  1. 含义:衡量两个变量之间的变化方向关系,即衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
  2. 计算公式:
    均值、方差、标准差、协方差详解及MATLAB实现_第3张图片
    这里的x,y是两组数据Data1(x)和Data2(y),是二维的,也就是说两组数据之间存在某种关系。

5、协方差矩阵

  1. 含义:协方差矩阵可用来表示多维随机变量的概率密度,从而可通过协方差矩阵达到对多维随机变量的研究
  2. 计算公式:
    均值、方差、标准差、协方差详解及MATLAB实现_第4张图片

二、实际举例

eg:现有两组数据x,y,每组数据有6个,所以x,y分别有自己的均值、方差、标准差,而两组数据之间存在某种关系,所以就存在协方差cov(x,y)。
均值、方差、标准差、协方差详解及MATLAB实现_第5张图片

1、平均数的计算

很容易两组数据x,y的均值分别为:
在这里插入图片描述
在这里插入图片描述

2、方差的计算

两组数据x,y的方差分别为:
均值、方差、标准差、协方差详解及MATLAB实现_第6张图片
均值、方差、标准差、协方差详解及MATLAB实现_第7张图片

3、标准差的计算

两组数据x,y的标准差计算公式为:
均值、方差、标准差、协方差详解及MATLAB实现_第8张图片
均值、方差、标准差、协方差详解及MATLAB实现_第9张图片

4、协方差的计算

两组数据x,y的协方差计算公式为:
均值、方差、标准差、协方差详解及MATLAB实现_第10张图片

5、协方差矩阵

均值、方差、标准差、协方差详解及MATLAB实现_第11张图片

三、特别注意

以上的数据x,y都是总体,如果是样本的话,因为不是总体,在计算方差、标准差和协方差时,经过校正计算公式分母必须时n-1。
如:

  1. 方差:
    均值、方差、标准差、协方差详解及MATLAB实现_第12张图片
  2. 标准差:
    均值、方差、标准差、协方差详解及MATLAB实现_第13张图片
  3. 协方差:
    均值、方差、标准差、协方差详解及MATLAB实现_第14张图片
    在统计工作中,平均数(均值)和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。
    均值、方差、标准差、协方差详解及MATLAB实现_第15张图片

你可能感兴趣的:(概率论,机器学习,线性代数)