正态分布的由来

本文并非要涉及数学史,历史上,分布公式是从棣莫弗首先产生,到高斯发扬光大,中间过程曲折,在这里就不详述。本文甚至也不会特意的去用专业术语,目的是从数学的角度上把正态分布给捋一遍,来弥补目前绝大部分与正态分布相关的网络资源在推导方面的不够详尽,让绝大多数的读者能够读懂,在这里不考虑去匹配历史,只考虑数学推导的严密性。
在网上有关正态分布的文章早已有一篇非常优秀的——《正态分布的前世今生》,对于作者在这篇文章中体现出来的专业素养本人是由衷的敬佩。但是它也没有聚焦于正态分布的严密的推导过程。
中心极限定理建立了使独立随机变量之和是渐进正态分布的条件。它在概率论中占有很高的地位,这个地位是由于它悠久的历史,以及它在理论发展过程中起过的和在应用中还在起着富有成果的作用而取得的。本文是基于中心极限定理的,但又不仅仅是,细心的读者可以很容易的感受到这一点。
在概率论中最经典和重要的问题是:
X 1 , X 2 , ⋯   , X n X_{1},X_{2},\cdots ,X_{n} X1,X2,,Xn是独立同分布的随机变量,在 n n n特别大的情况下如果把它们看成是一个统一的整体,如何确定这个整体的内在的分布规律,其中均值和方差分别为: A v e X i = μ , V a r [ X i ] = σ 2 , i = 1 , 2 , ⋯   , n Ave_{X_{i}}=\mu,Var[X_{i}]=\sigma ^{2},i=1,2,\cdots ,n AveXi=μ,Var[Xi]=σ2,i=1,2,,n(这里不限定 X n X_{n} Xn的分布规律)。
我们需要简化命题,把上述 n n n个变量标准化成一个变量 Z n Z_{n} Zn,有助于我们的推导:
W i = X i − μ n σ W_{i}=\frac{X_{i}-\mu }{\sqrt{n}\sigma } Wi=n σXiμ
Z n = ∑ i = 1 n W i = ∑ i = 1 n X i − n μ n σ Z_{n}=\sum_{i=1}^{n}W_{i}=\frac{\sum_{i=1}^{n}X_{i}-n\mu}{\sqrt{n}\sigma} Zn=i=1nWi=n σi=1nXinμ
这里大家很容易的看出涉及到 n n n项和的问题,对于求“和的概率分布”是一件非常麻烦的事情,这里假设 W n W_{n} Wn的概率密度函数为 f W n ( w ) f_{W_{n}}(w) fWn(w),则 Z n Z_{n} Zn的概率密度函数为:
f Z n ( z ) = f W 1 ( w ) ∗ f W 2 ( w ) ∗ ⋯ ∗ f W n ( w ) f_{Z_{n}}(z)=f_{W_{1}}(w)\ast f_{W_{2}}(w)\ast\cdots \ast f_{W_{n}}(w) fZn(z)=fW1(w)fW2(w)fWn(w)
其中,“ ∗ \ast ”代表卷积运算符。
那第一步要做的当然是把这么复杂的问题給简化,自然就想到了用傅里叶变换。傅里叶变换可以极大的简化和的概率分布,把卷积转化为乘法,也即是把“大学数学的问题”转化为“高中数学问题”。
为简化推导过程,这里假设 A v e X i = 0 , V a r [ X i ] = 1 Ave_{X_{i}}=0,Var[X_{i}]=1 AveXi=0,Var[Xi]=1,所以 W i = X i n W_{i}=\frac{X_{i} }{\sqrt{n}} Wi=n Xi。其他情况可以很容易的扩展。设 f X i ( x ) f_{X_{i}}(x) fXi(x) X X X的概率密度函数,对 W W W做傅里叶变换得:
Φ W ( ω ) = ∫ − ∞ ∞ e j ω x n f X ( x ) d x \Phi _{W}(\omega )=\int_{-\infty }^{\infty }e^{\frac{j\omega x}{\sqrt{n}}}f_{X}(x)dx ΦW(ω)=en jωxfX(x)dx

接下来,就是要约掉 f X i ( x ) f_{X_{i}}(x) fXi(x),然后简化 Φ W ( ω ) \Phi _{W}(\omega ) ΦW(ω)。所以把上式展成麦克劳林级数。求得的0点附近的各阶导数如下:
Φ W ( 0 ) ( 0 ) = 1 \Phi _{W}^{(0)}(0)=1 ΦW(0)(0)=1
Φ W ( 1 ) ( 0 ) = ∫ − ∞ ∞ j x n e j ω x / n f X ( x ) d x = 0 \Phi _{W}^{(1)}(0)=\int_{-\infty }^{\infty }j\frac{x}{\sqrt{n}}e^{j\omega x/\sqrt{n}}f_{X}(x)dx=0 ΦW(1)(0)=jn xejωx/n fX(x)dx=0
Φ W ( 2 ) ( 0 ) = ∫ − ∞ ∞ ( j x n ) 2 e j ω x / n f X ( x ) d x = − 1 n \Phi _{W}^{(2)}(0)=\int_{-\infty }^{\infty }\left ( \frac{jx}{\sqrt{n}} \right )^{2}e^{j\omega x/\sqrt{n}}f_{X}(x)dx=-\frac{1}{n} ΦW(2)(0)=(n jx)2ejωx/n fX(x)dx=n1

因此可得
Φ W ( ω ) = 1 − 1 2 n ω 2 + R 2 ′ ( ω ) n n \Phi _{W}(\omega )=1-\frac{1}{2n}\omega ^{2}+\frac{R_{2}^{'}(\omega )}{n\sqrt{n}} ΦW(ω)=12n1ω2+nn R2(ω)
其中
R 2 ′ ( ω ) = − j ω 3 ∫ − ∞ ∞ x 3 e j ζ x / n f X ( x ) d x / 6 R_{2}^{'}(\omega )= -j\omega ^{3}\int_{-\infty }^{\infty }x^{3}e^{j\zeta x/\sqrt{n}}f_{X}(x)dx/6 R2(ω)=jω3x3ejζx/n fX(x)dx/6
因为 Z n = ∑ i = 1 n W i Z_{n}=\sum_{i=1}^{n}W_{i} Zn=i=1nWi,由卷积定理我们可以得到
Φ Z n ( ω ) = [ Φ W ( ω ) ] n \Phi _{Z_{n}}(\omega )=\left [ \Phi _{W} (\omega )\right ]^{n} ΦZn(ω)=[ΦW(ω)]n
等价于
l n Φ Z n ( ω ) = n l n Φ W ( ω ) ln\Phi _{Z_{n}}(\omega )=nln \Phi _{W} (\omega ) lnΦZn(ω)=nlnΦW(ω)
对于任意的 h h h,只要满足 ∣ h ∣ < 1 \left | h \right |< 1 h<1,利用泰勒展开就有
l n ( 1 + h ) = h − h 2 2 + h 3 3 − ⋯ ln(1+h)=h-\frac{h^{2}}{2}+\frac{h^{3}}{3}-\cdots ln(1+h)=h2h2+3h3
对于任意固定的 ω \omega ω,我们让 n n n足够大使得下式成立
∣ − ω 2 2 n + R 2 ′ ( ω ) n n ∣ < 1 \left | -\frac{\omega ^{2}}{2n}+\frac{R_{2}^{'}(\omega )}{n\sqrt{n}} \right |< 1 2nω2+nn R2(ω)<1
Γ ( ω , n ) = − ω 2 2 n + R 2 ′ ( ω ) n n \Gamma (\omega ,n)=-\frac{\omega ^{2}}{2n}+\frac{R_{2}^{'}(\omega )}{n\sqrt{n}} Γ(ω,n)=2nω2+nn R2(ω)
根据上面的结论
l n Φ Z n ( ω ) = n l n [ 1 + Γ ( ω , n ) ] = n [ Γ ( ω , n ) − 1 2 ( Γ ( ω , n ) ) 2 + 1 3 ( Γ ( ω , n ) ) 3 + ⋯   ] ln\Phi _{Z_{n}}(\omega )=nln\left [ 1+\Gamma (\omega ,n)\right ]=n\left [ \Gamma (\omega ,n) -\frac{1}{2}( \Gamma (\omega ,n))^{2}+\frac{1}{3}( \Gamma (\omega ,n))^{3} +\cdots \right] lnΦZn(ω)=nln[1+Γ(ω,n)]=n[Γ(ω,n)21(Γ(ω,n))2+31(Γ(ω,n))3+]
只有 n Γ ( ω , n ) n\Gamma (\omega ,n) nΓ(ω,n)这一项中的 − ω 2 2 -\frac{\omega ^{2}}{2} 2ω2是不带 n n n的,其余的项涉及因子 n − 1 / 2 , n − 1 , n − 3 / 2 , ⋯ n^{-1/2},n^{-1},n^{-3/2},\cdots n1/2,n1,n3/2,
因此有 l i m n → ∞ [ l n Φ Z n ( ω ) ] = − ω 2 2 \underset{n\rightarrow \infty }{lim}\left [ ln\Phi _{Z_{n}}(\omega ) \right ]=-\frac{\omega ^{2}}{2} nlim[lnΦZn(ω)]=2ω2
也就是 l i m n → ∞ [ Φ Z n ( ω ) ] = e − ω 2 / 2 \underset{n\rightarrow \infty }{lim}\left [ \Phi _{Z_{n}}(\omega ) \right ]=e^{-\omega ^{2}/2} nlim[ΦZn(ω)]=eω2/2
这里设 Z n Z_{n} Zn的概率密度函数为: f Z n ( z ) f_{Z_{n}}(z) fZn(z)。我们要假设存在正实数 M M M,使得 f Z n < M f_{Z_{n}}< M fZn<M
所以由勒贝格控制收敛定理,积分和求极限可以交换次序
∫ − ∞ ∞ l i m n → ∞ e j ω z f Z n ( z ) d z = ∫ − ∞ ∞ e j ω z l i m n → ∞ f Z n ( z ) d z = e − ω 2 / 2 \int_{-\infty }^{\infty }\underset{n \to \infty }{lim}e^{j\omega z}f_{Z_{n}}(z)dz=\int_{-\infty }^{\infty }e^{j\omega z}\underset{n \to \infty }{lim}f_{Z_{n}}(z)dz=e^{-\omega ^{2}/2} nlimejωzfZn(z)dz=ejωznlimfZn(z)dz=eω2/2
f Z ( z ) = l i m n → ∞ f Z n ( z ) f_{Z}(z)=\underset{n \to \infty }{lim}f_{Z_{n}}(z) fZ(z)=nlimfZn(z),对上式做傅里叶逆变换,得 f Z ( z ) = 1 2 π e − z 2 2 f_{Z}(z)=\frac{1}{\sqrt{2\pi }}e^{-\frac{z^{2}}{2}} fZ(z)=2π 1e2z2
这即是我们想要的结果,多么漂亮的数学公式!

参考文献

[1] 概率,统计与随机过程 Henry Stark John W.Woods著 罗鹏飞等译

[2] 概率论基础教程 Sheldon M.Ross著 郑忠国 詹从赞译

[3] 概率论基础 严士建 王隽骧 刘秀芳著

[4] 概率论及其应用(第2卷.第2版) 威廉.费勒著 郑元禄译

[5] Wikipedia,the free encyclopedia that anyone can edit.5,035,994 articles in English.

转载请注明出处:http://blog.csdn.net/fourierFeng/article/details/51170039

你可能感兴趣的:(数学算法,随笔,感知数学)