方差,协方差,标准差和均值标准差等各种差

3 方差

3.1 英文名称

variance

3.2 所属学科

概率论和统计

3.3 实际用途

概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。标准差、方差越大,离散程度越大。反之,离散程度越小。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。

3.4 历史

“方差”(variance)这一词语率先由罗纳德·费雪(Ronald Fisher)在其论文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance》中提出。

3.5 定义

是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。

3.6 公式

设 X 是一个随机变量,若 E{[XE(X)]2}

存在,则称 E{[XE(X)]2} 为 X 的方差,记为 D(X),Var(X)或 DX,其中 E(X)指的是对 X 的预期值,而 X 是实际值。即 D(x)=E{[XE(X)]2}

称为方差。这里E{}只能理解为一个记号,真正的公式在这里:

s2=1n1i=1n(xix¯)2(1)

右边的求和公式可以转换成更容易计算的形式:

i=1n(xix¯)2=i=1n(x2i2xiSumn+Sum2n2)=i=1nx2ii=1n2xiSumn+i=1nSum2n2=i=1nx2i2i=1nxiSumn+i=1nSum2n2=i=1nx2i2SumSumn+Sum2n=i=1nx2iSum2n(2)
  • 说明
    • x¯=Sumn

i=1n
    • 可以提取出来

用newlisp计算,实现代码如下:

; variance of a data vector X
(define (var X)
  (div (sum-d2 X) (sub (length X) 1)))
; sum of sqared differenses of X to mean of X
(define (sum-d2 X)
  (sub (sum-sq X) (div (mul (sum X) (sum X)) (length X))))

调用代码如下:

> (module "stat.lsp")
(lambda (stat:lst) (append (join (map string stat:lst) "\r\n") "\r\n"))
> (setf a '(1 2 3 1 4 5 7))
(1 2 3 1 4 5 7)
> (stat:var a)
4.904761904761905

4 标准差

(均方差)

4.1 英文名称

Standard Deviation

4.2 实际用途

由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。

4.3 公式

σ=D(x)(3)

4.4 计算

newlisp 调用如下:

> (stat:sdev a)
2.214669705568283

5 协方差

5.1 英文名称

covariance

5.2 简介

从直观上来看,协方差表示的是两个变量总体误差的期望。方差是两个变量为同一个变量时的特殊的协方差。两个不同参数之间的方差就是协方差,若两个随机变量X和Y相互独立,则E[(X-E(X))(Y-E(Y))]=0,因而若上述数学期望不为零,则X和Y必不是相互独立的,亦即它们之间存在着一定的关系。

5.3 公式

Cov(X,Y)=E[(XE(X))(YE(Y))](4)

[]内部的乘法式子变换一下

=E[XYXE(Y)E(X)Y+E(X)E(Y))](5)

将E[…]内部的都提取出来

=E[XY]E[XE(Y)]E[E(X)Y]+E[E(X)E(Y))](6)

E[..E(Y)] 这种计算方法是把E(Y)看成一个常数,可以提取到E外面,变成E[Y]E[…], 同理,E[E(X)E(Y))] => E(X)E(Y)

=E[XY]E[X]E[Y]E[X]E[Y]+E[X]E[Y](7)

所有E()都统一写成E[]

=E[XY]2E[X]E[Y]+E[X]E[Y](8)
=E[XY]E[X]E[Y](9)

5.4 计算性质

协方差的性质:

  1. Cov(X,Y)=Cov(Y,X)
  2. Cov(aX,bY)=abCov(X,Y), (a,b是常数)
  3. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

6 均值的标准误差

6.1 公式

σmean=σn(10)

你可能感兴趣的:(#,数学基础)