机器学习|随机变量的方差(离散型、连续型)|10mins入门|概统学习笔记(九)

随机变量的方差

  • 背景:随机变量的数学期望体现了随机变量取值的平均水平,而随机变量的方差度量了随机变量取值在其中心附近(数学期望)的离散程度

  • 定义:设X是一个随机变量,若 E [ ( X − E ( X ) ] 2 < ∞ E[(X-E(X)]^2<\infty E[(XE(X)]2<,则称
    D ( X ) = E [ X − E ( X ) ] 2 D(X)=E[X-E(X)]^2 D(X)=E[XE(X)]2
    为X的方差。采用平方是为了保证一切差值 X − E ( X ) X-E(X) XE(X)都起正面的作用。

    方差的算术平方根 D ( X ) \sqrt{D(X)} D(X) 称为标准差。

  • 意义:

    • 若X的取值比较集中,则方差较小;反之,则方差较大
    • 若方差 D ( x ) = 0 D(x)=0 D(x)=0,则r.v X以概率1取常数值
  • 实质:方差是随机变量X的函数 g ( X ) = [ X − E ( X ) ] 2 g(X)=[X-E(X)]^2 g(X)=[XE(X)]2的数学期望
    D ( X ) = { ∑ k = 1 ∞ [ x k − E ( X ) ] 2 p k , X 为 离 散 型 ∫ − ∞ ∞ [ x k − E ( X ) ] 2 f ( x ) d x , X 为 连 续 型 D(X)= \begin{cases} \sum_{k=1}^\infty[x_k-E(X)]^2p_k,\quad X为离散型 \\ \int_{-\infty}^\infty[x_k-E(X)]^2f(x)dx,\quad X为连续型 \end{cases} D(X)={k=1[xkE(X)]2pk,X[xkE(X)]2f(x)dx,X
    当X为离散型时, P ( X = x k ) = p k P(X=x_k)=p_k P(X=xk)=pk

    当X为连续型时, X X X~ f ( x ) f(x) f(x)

  • 计算方差的简化方式

    D ( X ) = E ( X 2 ) − [ E ( X ) ] 2 D(X)=E(X^2)-[E(X)]^2 D(X)=E(X2)[E(X)]2

    证明:
    D ( X ) = E [ X − E ( X ) ] 2 = E { X 2 − 2 X E ( X ) + [ E ( X ) ] 2 } = E ( X 2 ) − 2 [ E ( X ) ] 2 + [ E ( X ) ] 2 = E ( X 2 ) − [ E ( X ) ] 2 D(X)=E[X-E(X)]^2\\=E\{X^2-2XE(X)+[E(X)]^2\} \\=E(X^2)-2[E(X)]^2+[E(X)]^2 \\=E(X^2)-[E(X)]^2 D(X)=E[XE(X)]2=E{X22XE(X)+[E(X)]2}=E(X2)2[E(X)]2+[E(X)]2=E(X2)[E(X)]2

  • 方差的性质

    1. 设C是常数,则 D ( C ) = 0 D(C)=0 D(C)=0

    2. 若C是常数,则 D ( C X ) = C 2 D ( X ) D(CX)=C^2D(X) D(CX)=C2D(X)

    3. X 1 X_1 X1 X 2 X_2 X2独立,则

      D ( X 1 + X 2 ) = D ( X 1 ) + D ( X 2 ) D(X_1+X_2)=D(X_1)+D(X_2) D(X1+X2)=D(X1)+D(X2)

      可推广为:若 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn相互独立,则

      D [ ∑ i = 1 n X i ] = ∑ i = 1 n D ( X i ) D[\sum_{i=1}^nX_i]=\sum_{i=1}^nD(X_i) D[i=1nXi]=i=1nD(Xi)

      D [ ∑ i = 1 n C i X i ] = ∑ i = 1 n C i 2 D ( X i ) D[\sum_{i=1}^nC_iX_i]=\sum_{i=1}^nC_i^2D(X_i) D[i=1nCiXi]=i=1nCi2D(Xi)

你可能感兴趣的:(概统,机器学习,概率论)