大数定律与中心极限定理

大数定律

定义:

X 1 , X 2 , . . . , X n , . . . X_1,X_2,...,X_n,... X1,X2,...,Xn,...为随机变量序列, X X X为随机变量,若对任意的正数 ϵ \epsilon ϵ有: lim ⁡ n → ∞ P ( ∣ X n − X ∣ ⩾ ϵ ) = 0 \lim_{n\to\infty}P(|X_n-X|\geqslant\epsilon)=0 nlimP(XnXϵ)=0 lim ⁡ n → ∞ P ( ∣ X n − X ∣ < ϵ ) = 1 \lim_{n\to\infty}P(|X_n-X|<\epsilon)=1 nlimP(XnX<ϵ)=1则称 X n X_n Xn依概率收敛于 X X X,记为 1 n ∑ i = 1 n x i → p 1 n ∑ i = 1 n E ( X i ) = E ( X ) = X ‾ \frac{1}{n}\sum_{i=1}^{n}x_i\xrightarrow{p}\frac{1}{n}\sum_{i=1}^{n}E(X_i)=E(X)=\overline X n1i=1nxip n1i=1nE(Xi)=E(X)=X X n → p X X_n\xrightarrow{p}X Xnp X

切比雪夫不等式

由于方差 D ( X ) D(X) D(X)是用来描述随机变量 X X X的取值在其数学期望 E ( X ) E(X) E(X)附件的离散程度的,因此,对任意的正数 ϵ \epsilon ϵ,事件 ( ∣ X − E ( X ) ∣ ⩾ ϵ ) (|X-E(X)|\geqslant\epsilon) (XE(X)ϵ)发生的概率应该与 D ( X ) D(X) D(X)有关,而这种关系用数学形式表示出来,就是切比雪夫不等式。

切比雪夫不等式定理
设随机变量 X X X的数学期望 E ( X ) E(X) E(X)与方差 D ( X ) D(X) D(X)存在,则对于任意正数 ϵ \epsilon ϵ,不等式 P ( ∣ X − E ( X ) ∣ ⩾ ϵ ) ⩽ D ( X ) ϵ 2 P(|X-E(X)|\geqslant\epsilon)\leqslant \frac{D(X)}{\epsilon^2} P(XE(X)ϵ)ϵ2D(X) P ( ∣ X − E ( X ) ∣ < ϵ ) ⩾ 1 − D ( X ) ϵ 2 P(|X-E(X)|<\epsilon)\geqslant 1-\frac{D(X)}{\epsilon^2} P(XE(X)<ϵ)1ϵ2D(X)都成立,且这两个不等式称为切比雪夫不等式

切比雪夫不等式的重要意义
切比雪夫不等式给出了在随机变量 X X X的分布未知的情况下,只利用 X X X的数学期望和方差即可对 X X X的概率分布进行估值的方法。

切比雪夫大数定律

切比雪夫大数定律定理
设独立随机变量序列 X 1 , X 2 , . . . X_1,X_2,... X1,X2,...的数学期望 E ( X 1 ) , E ( X 2 ) , . . . E(X_1),E(X_2),... E(X1),E(X2),...和方差 D ( X 1 ) , D ( X 2 ) , . . . D(X_1),D(X_2),... D(X1),D(X2),...都存在,并且方差是一致有上界的,即存在常数 C C C,使得 D ( X i ) ⩽ C , i = 1 , 2 , . . . , n . . . D(X_i)\leqslant C,i=1,2,...,n... D(Xi)Ci=1,2,...,n...
则对于任意的正数 ϵ \epsilon ϵ,有 lim ⁡ n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E ( X i ) ∣ < ϵ ) = 1 \lim_{n\to \infty}P(|\frac{1}{n}\sum_{i=1}^{n}X_i-\frac{1}{n}\sum_{i=1}^{n}E(X_i)| < \epsilon) = 1 nlimP(n1i=1nXin1i=1nE(Xi)<ϵ)=1
切比雪夫大数定律的统计意义
独立随机变量序列 X 1 , X 2 , . . . , X n , . . . X_1,X_2,...,X_n,... X1,X2,...,Xn,...的数学期望与方差都存在,且方差一致有上届,则经过算术平均后得到的随机变量 X ‾ = 1 n ∑ i = 1 n X i \overline X=\frac{1}{n}\sum_{i=1}^{n}X_i X=n1i=1nXi n n n充分大时,它的值将比较紧密地聚集在它的数学期望 E ( X ‾ ) E(\overline X) E(X)附件。

伯努利大数定律

伯努利大数定律是切比雪夫大数定律的一个重要推论
伯努利大数定律定理
n A n_A nA n n n重伯努利试验中事件 A A A发生的次数,又设在每次试验中事件 A A A发生的概率 P ( A ) = p P(A)=p P(A)=p,则对于任意的正数 ϵ \epsilon ϵ,当试验的次数 n → ∞ n\to\infty n时,有 lim ⁡ n → ∞ P ( ∣ n A n − p ∣ < ϵ ) = 1 \lim_{n\to\infty}P(|\frac{n_A}{n}-p|<\epsilon)=1 nlimP(nnAp<ϵ)=1

伯努利大数定律的统计意义
当试验在相同条件下重复进行很多次时,随机事件 A A A的频率 f n ( A ) = n A n f_n(A)=\frac{n_A}{n} fn(A)=nnA,将稳定在事件 A A A的概率 P ( A ) = p P(A)=p P(A)=p附近,即频率收敛于概率。

中心极限定理

中心极限定理是研究独立随机变量和的极限分布为正态分布的命题。

经过科学家长期的观察和总结,发现服从正态分布的随机现象往往是由独立(或弱相依)的随机变量产生的。

这类随机现象往往可视为独立随机变量之和 ∑ i = 1 n x i \sum_{i=1}^{n}x_i i=1nxi,在什么条件下渐进于正态分布的问题。为使问题规范化,数学家们将问题归结为讨论规范和 ∑ i = 1 n x i − E ( ∑ i = 1 n x i ) D ( ∑ i = 1 n x i ) \frac{\sum_{i=1}^{n}x_i-E(\sum_{i=1}^{n}x_i)}{\sqrt{D(\sum_{i=1}^{n}x_i)}} D(i=1nxi) i=1nxiE(i=1nxi)有渐进分布 N ( 0 , 1 ) N(0,1) N(0,1)的条件,并称有此结论的随机序列 { x n } \{x_n\} {xn}服从中心极限定理。即: ∑ i = 1 n x i − E ( ∑ i = 1 n x i ) D ( ∑ i = 1 n x i ) ∼ N ( 0 , 1 ) \frac{\sum_{i=1}^{n}x_i-E(\sum_{i=1}^{n}x_i)}{\sqrt{D(\sum_{i=1}^{n}x_i)}}\sim N(0,1) D(i=1nxi) i=1nxiE(i=1nxi)N(0,1)

独立同分布的中心极限定理(林德贝格-勒维中心极限定理)

{ x n } \{x_n\} {xn}是独立同分布的随机变量序列,且 E ( x i ) = μ , D ( x i ) = σ 2 , i = 1 , 2 , . . . n E(x_i)=\mu,D(x_i)=\sigma^2,i=1,2,...n E(xi)=μD(xi)=σ2i=1,2,...n,则随机变量 Z n = ∑ i = 1 n x i − E ( ∑ i = 1 n x i ) D ( ∑ i = 1 n x i ) = ∑ i = 1 n x i − n μ n σ 2 Z_n=\frac{\sum_{i=1}^{n}x_i-E(\sum_{i=1}^{n}x_i)}{\sqrt{D(\sum_{i=1}^{n}x_i)}}=\frac{\sum_{i=1}^{n}x_i-n\mu}{\sqrt{n\sigma^2}} Zn=D(i=1nxi) i=1nxiE(i=1nxi)=nσ2 i=1nxinμ的分布函数 F n ( x ) F_n(x) Fn(x)收敛于标准正态分布的分布函数 Φ ( x ) \Phi(x) Φ(x).即对于任意的实数 x x x有: lim ⁡ n → ∞ P ( ∑ i = 1 n x i − n μ n σ 2 ⩽ x ) = ∫ − ∞ x 1 2 π e − t 2 2 d t = Φ ( x ) \lim_{n\to \infty}P(\frac{\sum_{i=1}^{n}x_i-n\mu}{\sqrt{n\sigma^2}} \leqslant x)=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt=\Phi(x) nlimP(nσ2 i=1nxinμx)=x2π 1e2t2dt=Φ(x) n n n充分大时,有:

  1. 随机变量 Y n = ∑ i = 1 n x i Y_n=\sum_{i=1}^{n}x_i Yn=i=1nxi近似地服从 N ( n μ , n σ 2 ) = Φ ( b − n μ n σ 2 ) N(n\mu,n\sigma^2)=\Phi(\frac{b-n\mu}{\sqrt{n\sigma^2}}) N(nμ,nσ2)=Φ(nσ2 bnμ)
  2. x ‾ = 1 n ∑ i = 1 n x i \overline x=\frac{1}{n}\sum_{i=1}^{n}x_i x=n1i=1nxi近似服从 N ( μ , σ 2 n ) N(\mu,\frac{\sigma^2}{n}) N(μ,nσ2)

德莫佛-拉普拉斯中心极限定理

设在独立试验序列中,事件 A A A发生的概率为 p p p,随机变量 n A n_A nA表示事件 A A A n n n次试验中发生的次数,即 n A n_A nA服从二项分布,则对任意实数 x x x,有: lim ⁡ n → ∞ P ( n A − n p n p ( 1 − p ) ⩽ x ) = ∫ − ∞ x 1 2 π e − t 2 2 d t = Φ ( x ) \lim_{n\to\infty}P(\frac{n_A-np}{\sqrt{np(1-p)}}\leqslant x)=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt=\Phi(x) nlimP(np(1p) nAnpx)=x2π 1e2t2dt=Φ(x) n n n充分大时,服从二项分布的随机变量 n A n_A nA将近似地服从正态分布,因此当 n n n较大时,可以用正态分布来近似地计算二项分布: P ( a < n A < b ) ≈ Φ ( b − n p n p ( 1 − p ) ) − Φ ( a − n p n p ( 1 − p ) ) P(a<n_A<b)\approx \Phi(\frac{b-np}{\sqrt{np(1-p)}})-\Phi(\frac{a-np}{\sqrt{np(1-p)}}) P(a<nA<b)Φ(np(1p) bnp)Φ(np(1p) anp)

你可能感兴趣的:(#,概率统计)