机器学习|随机向量函数的分布(离散、连续卷积公式)|15mins入门|概统学习笔记(七)

随机向量函数的分布

  • 背景:当随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn的联合分布已知时,如何求出它们的函数 Y i = g i ( X 1 , X 2 , . . . , X n ) , i = 1 , 2 , . . . , m Y_i=g_i(X_1,X_2,...,X_n),i=1,2,...,m Yi=gi(X1,X2,...,Xn),i=1,2,...,m的联合分布

  • 离散型分布的情形:

    若X、Y独立, P ( X = k ) = a k , k = 0 , 1 , 2 , . . . ,   P ( Y = k ) = b + k , k = 0 , 1 , . . . P(X=k)=a_k,k=0,1,2,..., \space P(Y=k)=b+k,k=0,1,... P(X=k)=ak,k=0,1,2,..., P(Y=k)=b+k,k=0,1,...,求 Z = X + Y Z=X+Y Z=X+Y的概率函数

    P ( Z = r ) = P ( X + Y = r ) = ∑ i = 0 r P ( X = i , Y = r − i ) = ∑ i = 0 r P ( X = i ) P ( Y = r − i ) = a 0 b r + a 1 b r − 1 + . . . + a r b 0 P(Z=r)=P(X+Y=r)=\sum_{i=0}^rP(X=i,Y=r-i)=\sum_{i=0}^rP(X=i)P(Y=r-i) \\ =a_0b_r+a_1b_{r-1}+...+a_rb_0 P(Z=r)=P(X+Y=r)=i=0rP(X=i,Y=ri)=i=0rP(X=i)P(Y=ri)=a0br+a1br1+...+arb0

    此即离散卷积公式

  • 连续型分布的情形

    设X和Y的联合密度为 f ( x , y ) f(x,y) f(x,y),求 Z = X + Y Z=X+Y Z=X+Y的密度

    解: Z = X + Y Z=X+Y Z=X+Y的分布函数是:
    F Z ( z ) = P ( Z ≤ z ) = P ( X + Y ≤ z ) = ∬ D f ( x , y ) d x d y F_Z(z)=P(Z\leq z)=P(X+Y\leq z)=\iint_Df(x,y)dxdy FZ(z)=P(Zz)=P(X+Yz)=Df(x,y)dxdy
    机器学习|随机向量函数的分布(离散、连续卷积公式)|15mins入门|概统学习笔记(七)_第1张图片
    这里积分区域 D = { ( x , y ) : x + y ≤ z } D=\{(x,y):x+y\leq z\} D={(x,y):x+yz},是直线 x + y = z x+y=z x+y=z左下方的半平面。

    ∴ \therefore
    F Z ( z ) = ∬ x + y ≤ z f ( x , y ) d x d y F_Z(z)=\iint_{x+y\leq z}f(x, y)dxdy FZ(z)=x+yzf(x,y)dxdy
    化为累次积分,得

F Z ( z ) = ∫ − ∞ ∞ [ ∫ − ∞ z − y f ( x , y ) d x ] d y F_Z(z)=\int_{-\infty}^{\infty}[\int_{-\infty}^{z-y}f(x,y)dx]dy FZ(z)=[zyf(x,y)dx]dy

​ 固定z和y,对方括号内的积分作变量代换,令 x = u − y x=u-y x=uy,再交换积分次序,得
F Z ( z ) = ∫ − ∞ ∞ [ ∫ − ∞ z f ( u − y , y ) d u ] d y = ∫ − ∞ z [ ∫ − ∞ ∞ f ( u − y , y ) d y ] d u F_Z(z)=\int_{-\infty}^\infty[\int_{-\infty}^zf(u-y,y)du]dy=\int_{-\infty}^z[\int_{-\infty}^\infty f(u-y,y)dy]du FZ(z)=[zf(uy,y)du]dy=z[f(uy,y)dy]du
​ 由概率密度与分布密度的关系,即得 Z = X + Y Z=X+Y Z=X+Y的概率密度为:
f Z ( z ) = F Z ′ ( z ) = ∫ − ∞ ∞ f ( z − y , y ) d y f_Z(z)=F'_Z(z)=\int_{-\infty}^\infty f(z-y,y)dy fZ(z)=FZ(z)=f(zy,y)dy
​ 由X和Y的对称性, f Z ( z ) f_Z(z) fZ(z)又可写成
f Z ( z ) = F Z ′ ( z ) = ∫ − ∞ ∞ f ( x , z − x ) d x f_Z(z)=F'_Z(z)=\int_{-\infty}^{\infty}f(x,z-x)dx fZ(z)=FZ(z)=f(x,zx)dx
​ 以上两式即是两个随机变量和的概率密度一般公式

​ 特别,当X和Y独立,设(X,Y)关于X,Y的边缘密度分别为 f X ( x ) , f Y ( y ) f_X(x),f_Y(y) fX(x),fY(y),则上述两式化为:
f Z ( z ) = ∫ − ∞ ∞ f X ( z − y ) f Y ( y ) d y f_Z(z)=\int_{-\infty}^{\infty}f_X(z-y)f_Y(y)dy fZ(z)=fX(zy)fY(y)dy

f Z ( z ) = ∫ − ∞ ∞ f X ( x ) f Y ( z − x ) d x f_Z(z)=\int_{-\infty}^{\infty}f_X(x)f_Y(z-x)dx fZ(z)=fX(x)fY(zx)dx

​ 这两个公式被称为卷积公式

  • 若X和Y独立,具有相同的分布 N ( 0 , 1 ) N(0,1) N(0,1),则 Z = X + Y Z=X+Y Z=X+Y服从正态分布 N ( 0 , 2 ) N(0,2) N(0,2)

    及若X和Y独立, X X X$N(\mu_1,\sigma_1^2)$,$Y$ N ( μ , σ 2 2 ) N(\mu,\sigma^2_2) N(μ,σ22),则 Z = X + Y Z=X+Y Z=X+Y~ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) N(\mu_1+\mu_2, \sigma^2_1+\sigma_2^2) N(μ1+μ2,σ12+σ22)

    此结论可以推广到n个独立随机变量之和。

    即有限个正态变量的线性组合任然服从正态分布。

你可能感兴趣的:(概统)