七月算法-P2 概率论与数理统计(3)

七月算法-P3

  • 概率论与数理统计(3)
    • 切比雪夫不等式
    • 大数定理
      • 大数定理的意义
    • 伯努利定理
    • 中心极限定理
      • 中心极限定理的意义

概率论与数理统计(3)

切比雪夫不等式

设任意变量X的期望为 μ \mu μ,方差为 σ 2 \sigma^2 σ2,对于任意整数 ϵ \epsilon ϵ,有:
P { ∣ X − μ ∣ ≥ ϵ } ≤ σ 2 ϵ 2 P \lbrace |X-\mu| \geq \epsilon \rbrace \leq \frac{\sigma^2}{\epsilon^2} P{Xμϵ}ϵ2σ2
切比雪夫不等式说明,X的方差越小,事件 { ∣ X − μ ∣ < ϵ } \lbrace |X-\mu| < \epsilon \rbrace {Xμ<ϵ}发生的概率越大。即:X取的值基本上集中在期望u附近。

证:
P { ∣ X − μ ∣ ≥ ϵ } = ∫ ∣ x − μ ∣ ≥ ϵ f ( x ) d x ≤ ∫ ∣ x − μ ∣ ≥ ϵ ∣ x − μ ∣ 2 ϵ 2 f ( x ) d x 因为 ∣ x − μ ∣ ≥ ϵ ≤ 1 ϵ 2 ∫ − ∞ + ∞ ( x − μ ) 2 f ( x ) d x = σ 2 ϵ 2 \begin{aligned} P \lbrace |X-\mu| \geq \epsilon \rbrace &= \int_{|x-\mu| \geq \epsilon} f(x) dx \\ & \leq\int_{|x-\mu| \geq \epsilon} \frac{|x - \mu|^2}{\epsilon^2} f(x) dx \quad \quad \text{因为$|x-\mu| \geq \epsilon$} \\ & \leq \frac{1}{\epsilon^2} \int _{-\infty}^{+\infty} (x-\mu)^2f(x)dx \\ &=\frac{\sigma^2}{\epsilon^2} \end{aligned} P{Xμϵ}=xμϵf(x)dxxμϵϵ2xμ2f(x)dx因为xμϵϵ21+(xμ)2f(x)dx=ϵ2σ2

大数定理

设随机变量 X 1 , X 2 . . . X n . . X_1,X_2...X_n.. X1,X2...Xn..相互独立,并且具有相同的期望 μ \mu μ和方差 σ 2 \sigma^2 σ2。作前n个随机变量的平均 Y n = 1 n ∑ i = 1 n X i Y_n=\frac{1}{n}\sum_{i=1}^nX_i Yn=n1i=1nXi,对于任意整数 ϵ \epsilon ϵ,有
lim ⁡ n → ∞ P { ∣ Y n − μ ∣ < ϵ } = 1 \lim_{n \rightarrow \infty} P \lbrace |Y_n -\mu| < \epsilon \rbrace = 1 nlimP{Ynμ<ϵ}=1

证:
样本均值的均值 E ( x ‾ ) = μ E(\overline x) = \mu E(x)=μ
样本均值的方差 V a r ( x ‾ ) = σ 2 n Var(\overline x)=\frac{\sigma^2}{n} Var(x)=nσ2
由切比雪夫不等式得:
P { ∣ x ‾ − μ ∣ ≥ ϵ } ≤ v a r ( x ‾ ) ϵ 2 = σ 2 n ∗ ϵ 2 P \lbrace | \overline x -\mu| \geq \epsilon \rbrace \leq \frac{var( \overline x)}{\epsilon^2} = \frac{\sigma^2}{n* \epsilon ^ 2} P{xμϵ}ϵ2var(x)=nϵ2σ2
所以当 n → ∞ n \rightarrow \infty n, P { ∣ x ‾ − μ ∣ ≥ ϵ } → 0 P \lbrace | \overline x -\mu| \geq \epsilon \rbrace \rightarrow 0 P{xμϵ}0

大数定理的意义

当n很大时,随机变量 X 1 , X 2 . . . X n . . X_1,X_2...X_n.. X1,X2...Xn..的平均值 Y n Y_n Yn在概率的意义下无限接近期望 μ \mu μ

伯努利定理

一次试验中事件 A A A放生的概率为 p p p;重复 n n n次独立试验中,事件 A A A发生了 n A n_A nA次,则 p 、 n 、 n A p、n、n_A pnnA的关系满足:
对于任意整数 ϵ \epsilon ϵ,
lim ⁡ n → ∞ P { ∣ n A n − p ∣ < ϵ } = 1 \lim_{n \rightarrow \infty} P \lbrace |\frac{n_A}{n} - p| < \epsilon \rbrace=1 nlimP{nnAp<ϵ}=1
该定理表明事件A发生的频率 n A / n n_A/n nA/n以概率收敛于事件A的频率 p p p,以严格的数学形似表达了频率的稳定性。

中心极限定理

设随机变量 X 1 , X 2 . . . X n . . X_1,X_2...X_n.. X1,X2...Xn..相互独立,并且具有相同的期望 μ \mu μ和方差 σ 2 \sigma^2 σ2。则随机变量
Y n = ∑ i = 1 n X i − n μ n σ Y_n=\frac{ \sum_{i=1}^n X_i -n\mu }{\sqrt{n} \sigma} Yn=n σi=1nXinμ
的分布收敛到标准正态分布。

中心极限定理的意义

很多随机现象可以看成许多因素的独立影响的综合反应,往往近似服从正态分布。
例如:
城市耗电量:大量用户的耗电量综合。
测量误差:许多观察不到的、微小误差的总和。

你可能感兴趣的:(#,七月算法)