在概率论中, 把有关论证随机变量和的极限分布为正态分布的一类定理 称为中心极限定理 称为中心极限定理 称为中心极限定理。
本文介绍独立同分布序列的中心极限定理。
定理1 设 X 1 , X 2 , . . . X n , . . . X_1, X_2, ...X_n,... X1,X2,...Xn,... 是独立同分布的随机变量序列, 且具有相同数学期望和方差, E ( X i ) = μ , D ( X i ) = σ 2 ( i = 1 , 2 , . . . ) E(X_i)=\mu, D(X_i)=\sigma^2(i=1,2, ...) E(Xi)=μ,D(Xi)=σ2(i=1,2,...), 记随机变量 Y n = Y_n= Yn= ∑ i = 1 n X i − n μ n σ \frac{\sum\limits_{i=1}^{n}X_i-n\mu}{\sqrt{n}\sigma} nσi=1∑nXi−nμ 的分布函数为 F n ( x ) F_n(x) Fn(x), 则对于任意实数 x x x,
lim n → ∞ F n ( x ) = lim n → ∞ P { Y n ⩽ x } = \lim\limits_{n \rightarrow \infty}F_n(x) =\lim\limits_{n \rightarrow \infty}P\{Y_n \leqslant x\} = n→∞limFn(x)=n→∞limP{Yn⩽x}= lim n → ∞ P \lim\limits_{n \rightarrow \infty}P n→∞limP { \{ { ∑ i = 1 n − n μ n σ \frac{\sum\limits_{i=1}^{n}-n\mu}{ \sqrt{n}\sigma} nσi=1∑n−nμ } \} }
= ∫ − ∞ x 1 2 π e − t 2 2 d t = Φ ( x ) =\int_{- \infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt=\Phi(x) =∫−∞x2π1e−2t2dt=Φ(x),
由这一定理可知以下结论:
当n充分大时, 独立同分布的随机变量之和 Z n = ∑ i = 1 n X i Z_n=\sum\limits_{i=1}^{n}X_i Zn=i=1∑nXi的分布近似于正态分布 N ( n μ , n σ 2 ) N(n\mu, n\sigma^2) N(nμ,nσ2).
中心极限定理告诉我们, 不论 X 1 , X 2 , . . . , X n , . . . X_1,X_2, ..., X_n,... X1,X2,...,Xn,...同服从什么分布, 当n充分大时, 其和 Z n Z_n Zn 近似服从正态分布.
考虑 独立同分布的随机变量 X 1 , X 2 , . . . , X n , . . . X_1, X_2,..., X_n,... X1,X2,...,Xn,... 的平均值 X ‾ = 1 n ∑ i = 1 n X i \overline X = \frac{1}{n}\sum\limits_{i=1}^{n}X_i X=n1i=1∑nXi, 有
它的标准化随机变量为 X ‾ − μ σ / n \frac{\overline X - \mu}{\sigma/ \sqrt{n}} σ/nX−μ 即为上述 Y n Y_n Yn, 因此 X ‾ − μ σ / n \frac{\overline X - \mu}{\sigma/ \sqrt{n}} σ/nX−μ 的分布函数即是上述的 F n ( x ) F_n(x) Fn(x), 因而有
lim n → ∞ F n ( x ) = ∫ − ∞ x 1 2 π e − t 2 2 d t = Φ ( x ) \lim\limits_{n \rightarrow \infty}F_n(x) =\int_{- \infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt = \Phi(x) n→∞limFn(x)=∫−∞x2π1e−2t2dt=Φ(x).
由此可见, 当n充分大时, 独立同分布随机变量的平均值 X ‾ = 1 n ∑ i = 1 n X i \overline X = \frac{1}{n}\sum\limits_{i=1}^{n}X_i X=n1i=1∑nXi 的分布近似于正态分布 N N N ( μ , σ 2 n ) (\mu, \frac{\sigma^2}{n}) (μ,nσ2), 这是独立同分布中心极限定理的另一表达形式。
此定理是 定理1 的特殊情况。
设随机变量 Z n Z_n Zn是n次独立重复试验中事件A发生的次数, p是事件A发生的概率, 则对于任意实数 x x x
lim n → ∞ \lim\limits_{n \rightarrow \infty} n→∞limP { \{ { Z n − n p n p ( 1 − p ) ⩽ x \frac{Z_n-np}{\sqrt{np(1-p)}}\leqslant x np(1−p)Zn−np⩽x } \} } = ∫ − ∞ x 1 2 π e − t 2 2 d t = Φ ( x ) =\int_{- \infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt = \Phi(x) =∫−∞x2π1e−2t2dt=Φ(x).
由棣—拉中心极限定理,得到下列结论:
在贝努利试验中, 若事件A发生的概率为p, 设 Z n Z_n Zn为n次独立重复试验中事件A发生的频数, 则当n充分大时, Z n Z_n Zn 近似服从 N ( n p , n p ( 1 − p ) ) N(np, np(1-p)) N(np,np(1−p)).
在贝努利试验中, 若事件A发生的概率为p, Z n n \frac{Z_n}{n} nZn 为n次独立重复试验中事件A 发生的频率, 则当n充分大时, Z n n \frac{Z_n}{n} nZn 近似服从 N ( p , p ( 1 − p ) n ) N(p, \frac{p(1-p)}{n}) N(p,np(1−p)).