正态分布的密度函数:
f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 \begin{align} f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} \end{align} f(x)=2πσ1e−2σ2(x−μ)2
在进行理论推导之前,我们先通过Matlab数值计算看看两独立正态分布的乘积情况:
如图所示绿色和红色分别代表两个独立的正态分布函数,蓝色为两个分布的乘积。
从蓝色形状可以粗略的看出乘积结果可能为一个幅值被压缩的正态分布,其期望在 [ μ 1 , μ 2 ] [\mu_1,\mu_2 ] [μ1,μ2]之间,但是还需严格的理论推导。
设 N 1 N_1 N1的概率密度函数为 f 1 ( x ) = 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 f_1(x) = \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}} f1(x)=2πσ11e−2σ12(x−μ1)2, N 2 N_2 N2的概率密度函数为 f 2 ( x ) = 1 2 π σ 2 e − ( x − μ 2 ) 2 2 σ 2 2 f_2(x) = \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}} f2(x)=2πσ21e−2σ22(x−μ2)2,则:
f 1 ( x ) f 2 ( x ) = 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 ⋅ 1 2 π σ 2 e − ( x − μ 2 ) 2 2 σ 2 2 = 1 2 π σ 1 σ 2 e − [ ( x − μ 1 ) 2 2 σ 1 2 + ( x − μ 2 ) 2 2 σ 2 2 ] \begin{align} f_1(x)f_2(x) &= \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}} \cdot \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}}\\ &= \frac{1}{2\pi\sigma_1\sigma_2}e^{-[\frac{(x-\mu_1)^2}{2\sigma_1^2}+\frac{(x-\mu_2)^2}{2\sigma_2^2}]} \end{align} f1(x)f2(x)=2πσ11e−2σ12(x−μ1)2⋅2πσ21e−2σ22(x−μ2)2=2πσ1σ21e−[2σ12(x−μ1)2+2σ22(x−μ2)2]
先单独分析指数部分:
令 β = ( x − μ 1 ) 2 2 σ 1 2 + ( x − μ 2 ) 2 2 σ 2 2 = ( σ 1 2 + σ 2 2 ) x 2 − 2 ( μ 1 σ 2 2 + μ 2 σ 1 2 ) x + ( μ 1 2 σ 2 2 + μ 2 2 σ 1 2 ) 2 σ 1 2 σ 2 2 = x 2 − 2 μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 x + μ 1 2 σ 2 2 + μ 2 2 σ 1 2 σ 1 2 + σ 2 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 \begin{align} 令\ \beta&= \frac{(x-\mu_1)^2}{2\sigma_1^2}+\frac{(x-\mu_2)^2}{2\sigma_2^2} \\ &= \frac{(\sigma_1^2+\sigma_2^2)x^2-2(\mu_1\sigma_2^2+\mu_2\sigma_1^2)x+(\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2)}{2\sigma_1^2\sigma_2^2} \\ &= \frac{x^2-2\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2}x+\frac{\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2}{\sigma_1^2+\sigma_2^2}}{\frac{2\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}} \end{align} 令 β=2σ12(x−μ1)2+2σ22(x−μ2)2=2σ12σ22(σ12+σ22)x2−2(μ1σ22+μ2σ12)x+(μ12σ22+μ22σ12)=σ12+σ222σ12σ22x2−2σ12+σ22μ1σ22+μ2σ12x+σ12+σ22μ12σ22+μ22σ12
构造:
β = ( x − μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 ) 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 ⏟ γ + μ 1 2 σ 2 2 + μ 2 2 σ 1 2 σ 1 2 + σ 2 2 − ( μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 ) 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 ⏟ λ \begin{align} \beta = \underbrace{\frac{(x-\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2})^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}}}_{\gamma} + \underbrace{\frac{\frac{\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2}{\sigma_1^2+\sigma_2^2}-(\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2})^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}}}_{\lambda} \end{align} β=γ σ12+σ222σ12σ22(x−σ12+σ22μ1σ22+μ2σ12)2+λ σ12+σ222σ12σ22σ12+σ22μ12σ22+μ22σ12−(σ12+σ22μ1σ22+μ2σ12)2
则 β = γ + λ \beta = \gamma + \lambda β=γ+λ
记:
μ = μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 σ 2 = σ 1 2 σ 2 2 σ 1 2 + σ 2 2 \begin{align} \mu & = \frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2} \\ \sigma^2 &= \frac{\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2} \end{align} μσ2=σ12+σ22μ1σ22+μ2σ12=σ12+σ22σ12σ22
则:
γ = ( x − μ ) 2 2 σ 2 \begin{align} \gamma = \frac{(x-\mu)^2}{2\sigma^2} \end{align} γ=2σ2(x−μ)2
继续化简 λ \lambda λ:
λ = μ 1 2 σ 2 2 + μ 2 2 σ 1 2 σ 1 2 + σ 2 2 − ( μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 ) 2 2 σ 1 2 σ 2 2 σ 1 2 + σ 2 2 = ( μ 1 2 σ 2 2 + μ 2 2 σ 1 2 ) ( σ 1 2 + σ 2 2 ) − ( μ 1 σ 2 2 + μ 2 σ 1 2 ) 2 2 σ 1 2 σ 2 2 ( σ 1 2 + σ 2 2 ) = μ 1 2 σ 1 2 σ 2 2 + μ 2 2 σ 1 2 σ 2 2 + μ 1 2 σ 2 4 + μ 2 2 σ 1 4 − ( μ 1 2 σ 2 4 + μ 2 2 σ 1 4 + 2 μ 1 μ 2 σ 1 2 σ 2 2 ) 2 σ 1 2 σ 2 2 ( σ 1 2 + σ 2 2 ) = σ 1 2 σ 2 2 ( μ 1 2 − 2 μ 1 μ 2 + μ 2 2 ) 2 σ 1 2 σ 2 2 ( σ 1 2 + σ 2 2 ) = ( μ 1 − μ 2 ) 2 2 ( σ 1 2 + σ 2 2 ) \begin{align} \lambda &= \frac{\frac{\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2}{\sigma_1^2+\sigma_2^2}-(\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2})^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}}\\ &= \frac{(\mu_1^2\sigma_2^2+\mu_2^2\sigma_1^2)(\sigma_1^2+\sigma_2^2)-(\mu_1\sigma_2^2+\mu_2\sigma_1^2)^2}{2\sigma_1^2\sigma_2^2(\sigma_1^2+\sigma_2^2)} \\ &= \frac{\mu_1^2\sigma_1^2\sigma_2^2+\mu_2^2\sigma_1^2\sigma_2^2 + \mu_1^2\sigma_2^4 +\mu_2^2\sigma_1^4 -(\mu_1^2\sigma_2^4+\mu_2^2\sigma_1^4+2\mu_1\mu_2\sigma_1^2\sigma_2^2)}{2\sigma_1^2\sigma_2^2(\sigma_1^2+\sigma_2^2)} \\ &= \frac{ \sigma_1^2\sigma_2^2(\mu_1^2-2\mu_1\mu_2+\mu_2^2) } {2\sigma_1^2\sigma_2^2(\sigma_1^2+\sigma_2^2)} \\ &= \frac{(\mu_1-\mu_2)^2}{2(\sigma_1^2+\sigma_2^2)} \end{align} λ=σ12+σ222σ12σ22σ12+σ22μ12σ22+μ22σ12−(σ12+σ22μ1σ22+μ2σ12)2=2σ12σ22(σ12+σ22)(μ12σ22+μ22σ12)(σ12+σ22)−(μ1σ22+μ2σ12)2=2σ12σ22(σ12+σ22)μ12σ12σ22+μ22σ12σ22+μ12σ24+μ22σ14−(μ12σ24+μ22σ14+2μ1μ2σ12σ22)=2σ12σ22(σ12+σ22)σ12σ22(μ12−2μ1μ2+μ22)=2(σ12+σ22)(μ1−μ2)2
可得两个高斯分布相乘为:
f 1 ( x ) f 2 ( x ) = 1 2 π σ 1 σ 2 e − β = 1 2 π σ 1 σ 2 e − ( γ + λ ) = 1 2 π σ 1 σ 2 e − γ ⋅ e − λ = 1 2 π σ 1 σ 2 e − ( x − μ ) 2 σ 2 ⋅ e − ( μ 1 − μ 2 ) 2 2 ( σ 1 2 + σ 2 2 ) \begin{align} f_1(x)f_2(x) &= \frac{1}{2\pi\sigma_1\sigma_2}e^{-\beta} = \frac{1}{2\pi\sigma_1\sigma_2}e^{-(\gamma + \lambda)} \\ &= \frac{1}{2\pi\sigma_1\sigma_2} e^{-\gamma}\cdot e^{-\lambda} \\ &= \frac{1}{2\pi\sigma_1\sigma_2} e^{- \frac{(x-\mu)^2}{\sigma^2}} \cdot e^{- \frac{(\mu_1-\mu_2)^2}{2(\sigma_1^2+\sigma_2^2)}} \end{align} f1(x)f2(x)=2πσ1σ21e−β=2πσ1σ21e−(γ+λ)=2πσ1σ21e−γ⋅e−λ=2πσ1σ21e−σ2(x−μ)2⋅e−2(σ12+σ22)(μ1−μ2)2
其中
μ = μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 σ 2 = σ 1 2 σ 2 2 σ 1 2 + σ 2 2 \begin{align} \mu & = \frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2} & &\sigma^2 = \frac{\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2} \end{align} μ=σ12+σ22μ1σ22+μ2σ12σ2=σ12+σ22σ12σ22
把常数项综合为 S g S_g Sg, 可得其直观表达式:
f 1 ( x ) f 2 ( x ) = S g ⋅ 1 2 π σ e − ( x − μ ) 2 σ 2 S g = 1 2 π ( σ 1 2 + σ 2 2 ) ⋅ e − ( μ 1 − μ 2 ) 2 2 ( σ 1 2 + σ 2 2 ) \begin{align} f_1(x)f_2(x) &= S_g \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{- \frac{(x-\mu)^2}{\sigma^2}} \\ S_g &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}} \cdot e^{- \frac{(\mu_1-\mu_2)^2}{2(\sigma_1^2+\sigma_2^2)}} \end{align} f1(x)f2(x)Sg=Sg⋅2πσ1e−σ2(x−μ)2=2π(σ12+σ22)1⋅e−2(σ12+σ22)(μ1−μ2)2
到此,两个正态分布相乘的分布函数即推导出来,即相乘后的分布函数为一个被压缩或者放大的正态分布, S g S_g Sg 为缩放因子, f 1 ( x ) f 2 ( x ) f_1(x)f_2(x) f1(x)f2(x) 的积分等于 S g S_g Sg,它不一定等于1,但 f 1 ( x ) f 2 ( x ) f_1(x)f_2(x) f1(x)f2(x)的方差和均值性质不变。
有关 S g S_g Sg 对该乘积的影响,请参阅文章 两个高斯分布乘积的理论推导 的后半部分。
直觉中,两个正态随机变量的和似乎应该是两个概率密度函数的和,如下图所示,其结果就近似为两个概率密度的包络线,这其实是大错特错的。
已知两个相互独立的随机变量 X X X 和 Y Y Y,他们的概率密度函数分别为 f X ( x ) ( − ∞ < x < + ∞ ) f_X(x)(-\infty
Z = X + Y Z= X + Y Z=X+Y 的分布函数:
F Z ( z ) = P { X + Y ≤ z } = ∬ x + y ≤ z f ( x , y ) d x d y = ∫ − ∞ + ∞ d x ∫ − ∞ z − x f ( x , y ) d y ( 或 ∫ − ∞ + ∞ d y ∫ − ∞ z − y f ( x , y ) d x ) = ∫ − ∞ z − x d y ∫ − ∞ + ∞ f ( x , y ) d x ( 或 ∫ − ∞ z − y d x ∫ − ∞ + ∞ f ( x , y ) d y ) \begin{align} F_Z(z) &= P\{X+Y \leq z\} \\ &= \iint_{x+y\leq z} f(x, y) dx dy \\ &= \int_{-\infty}^{+\infty}dx \int_{-\infty}^{z-x}f(x,y) dy (或\int_{-\infty}^{+\infty}dy \int_{-\infty}^{z-y}f(x,y) dx ) \\ & = \int_{-\infty}^{z-x} dy \int_{-\infty}^{+\infty} f(x,y) dx (或 \int_{-\infty}^{z-y} dx \int_{-\infty}^{+\infty} f(x,y) dy) \end{align} FZ(z)=P{X+Y≤z}=∬x+y≤zf(x,y)dxdy=∫−∞+∞dx∫−∞z−xf(x,y)dy(或∫−∞+∞dy∫−∞z−yf(x,y)dx)=∫−∞z−xdy∫−∞+∞f(x,y)dx(或∫−∞z−ydx∫−∞+∞f(x,y)dy)
Z = X + Y Z=X+Y Z=X+Y的概率密度函数:
f Z ( z ) = F Z ′ ( z ) = ∫ − ∞ + ∞ f ( x , z − x ) d x ( 或 ∫ − ∞ + ∞ f ( z − y , y ) d y ) \begin{align} f_Z(z) = F'_Z(z) &= \int_{-\infty}^{+\infty} f(x,z-x)dx(或 \int_{-\infty}^{+\infty}f(z-y,y)dy) \end{align} fZ(z)=FZ′(z)=∫−∞+∞f(x,z−x)dx(或∫−∞+∞f(z−y,y)dy)
当 X X X和 Y Y Y相互独立时, f ( x , y ) = f X ( x ) f Y ( y ) f(x,y) = f_X(x)f_Y(y) f(x,y)=fX(x)fY(y),则
f Z ( z ) = ∫ − ∞ + ∞ f X ( x ) f Y ( z − x ) d x 或 f Z ( z ) = ∫ − ∞ + ∞ f X ( z − y ) f Y ( y ) d y \begin{align} f_Z(z) &= \int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dx \\ 或\ \ f_Z(z) &= \int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy \end{align} fZ(z)或 fZ(z)=∫−∞+∞fX(x)fY(z−x)dx=∫−∞+∞fX(z−y)fY(y)dy
(27) (28) 两个公式称为卷积公式,记为 f Z = f X ∗ f Y f_Z = f_X * f_Y fZ=fX∗fY。
设 N 1 N_1 N1的概率密度函数为 f 1 ( x ) = 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 f_1(x) = \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}} f1(x)=2πσ11e−2σ12(x−μ1)2, N 2 N_2 N2的概率密度函数为 f 2 ( x ) = 1 2 π σ 2 e − ( x − μ 2 ) 2 2 σ 2 2 f_2(x) = \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}} f2(x)=2πσ21e−2σ22(x−μ2)2,则根据卷积公式, N = N 1 + N 2 N=N_1+N_2 N=N1+N2 的概率密度 f ( z = x + y ) f(z=x+y) f(z=x+y)为:
f ( z ) = ∫ − ∞ + ∞ f 1 ( x ) f 2 ( z − x ) d x = ∫ − ∞ + ∞ 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 ⋅ 1 2 π σ 2 e − ( z − x − μ 2 ) 2 2 σ 2 2 d x \begin{align} f(z) &= \int_{-\infty}^{+\infty} f_1(x)f_2(z-x) dx \\ &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\cdot \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}}dx \end{align} f(z)=∫−∞+∞f1(x)f2(z−x)dx=∫−∞+∞2πσ11e−2σ12(x−μ1)2⋅2πσ21e−2σ22(z−x−μ2)2dx
记:
f 2 ′ ( x ) = 1 2 π σ 2 e − ( z − x − μ 2 ) 2 2 σ 2 2 = 1 2 π σ 2 e − [ x − ( z − μ 2 ) ] 2 2 σ 2 2 \begin{align} f_2'(x) &= \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}} = \frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{[x-(z-\mu_2)]^2}{2\sigma_2^2}} \end{align} f2′(x)=2πσ21e−2σ22(z−x−μ2)2=2πσ21e−2σ22[x−(z−μ2)]2
不难看出 f 2 ′ ( x ) f_2'(x) f2′(x)对应的随机变量 N 2 ′ ∼ ( z − μ 2 , σ 2 2 ) N_2'\sim(z-\mu_2,\sigma_2^2) N2′∼(z−μ2,σ22)(这里的 f 2 ′ ( x ) f_2'(x) f2′(x)和 N 2 ′ N_2' N2′不需要追问它的实际意义,只是为了帮助理解运用正态分布乘积公式)
f 1 ( x ) ⋅ f 2 ′ ( x ) = S g ⋅ 1 2 π σ e − ( x − μ ) 2 σ 2 其中 S g = 1 2 π ( σ 1 2 + σ 2 2 ) ⋅ e − [ z − ( μ 1 + μ 2 ) ] 2 2 ( σ 1 2 + σ 2 2 ) 则 f ( z ) = ∫ − ∞ + ∞ f 1 ( x ) ⋅ f 2 ′ ( x ) d x = ∫ − ∞ + ∞ S g ⋅ 1 2 π σ e − ( x − μ ) 2 σ 2 d x = S g ⋅ ∫ − ∞ + ∞ 1 2 π σ e − ( x − μ ) 2 σ 2 d x = S g = 1 2 π ( σ 1 2 + σ 2 2 ) ⋅ e − [ z − ( μ 1 + μ 2 ) ] 2 2 ( σ 1 2 + σ 2 2 ) \begin{align} f_1(x)\cdot f_2'(x) &= S_g \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{- \frac{(x-\mu)^2}{\sigma^2}} \\ 其中\ S_g &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}} \cdot e^{- \frac{[z-(\mu_1+\mu_2)]^2}{2(\sigma_1^2+\sigma_2^2)}} \\ 则\ f(z) &= \int_{-\infty}^{+\infty}f_1(x)\cdot f_2'(x) dx\\ &=\int_{-\infty}^{+\infty} S_g\cdot \frac{1}{\sqrt{2\pi}\sigma} e^{- \frac{(x-\mu)^2}{\sigma^2}} dx\\ &=S_g\cdot \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma} e^{- \frac{(x-\mu)^2}{\sigma^2}} dx\\ &= S_g \\ &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}} \cdot e^{- \frac{[z-(\mu_1+\mu_2)]^2}{2(\sigma_1^2+\sigma_2^2)}} \end{align} f1(x)⋅f2′(x)其中 Sg则 f(z)=Sg⋅2πσ1e−σ2(x−μ)2=2π(σ12+σ22)1⋅e−2(σ12+σ22)[z−(μ1+μ2)]2=∫−∞+∞f1(x)⋅f2′(x)dx=∫−∞+∞Sg⋅2πσ1e−σ2(x−μ)2dx=Sg⋅∫−∞+∞2πσ1e−σ2(x−μ)2dx=Sg=2π(σ12+σ22)1⋅e−2(σ12+σ22)[z−(μ1+μ2)]2
也就是 N = N 1 + N 2 ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) N=N_1+N_2 \sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2) N=N1+N2∼N(μ1+μ2,σ12+σ22)。