东北大学应用数理统计第三章知识点总结——假设检验

假设检验

一、基本检验

1.1 背景

  • 小概率事件在一次试验中不应该发生
  • 女士品茶例子:是否真的有鉴别能力?
  • 假设检验的任务就是要根据抽取出的样本,来决定是接受零假设,还是拒绝零假设(接受对立假设)

1.2 基本过程

  • 例子:女士品茶、机器是否正常工作 X X X ~ N ( μ , 0.05 ) N(\mu, 0.05) N(μ,0.05)
  • 提出一个统计假设:如果机器正常工作,应该是 μ = 15.1 \mu = 15.1 μ=15.1,反之应该是 μ ≠ 15.1 \mu ≠ 15.1 μ=15.1
  • 选取一个合适的检验统计量(类比第二章,参数估计、区间估计)
    零 假 设 成 立 时 : z = 6 ( X ‾ − 15.1 ) 0.05 → N ( 0 , 1 ) 零假设成立时:z = \frac{\sqrt{6} (\overline{X} - 15.1)}{\sqrt{0.05}} \to N(0,1) z=0.05 6 (X15.1)N(0,1)
  • 利用零假设成立时检验统计量的的分布构造出一个小概率事件
    P { 6 ∣ X ‾ − 15.1 ∣ 0.05 > μ α / 2 } = α P\{ \frac{\sqrt{6} |\overline{X} - 15.1|}{\sqrt {0.05}} > \mu_{\alpha/2} \} = \alpha P{0.05 6 X15.1>μα/2}=α
  • 代入样本观察值,如果使得这个小概率事件发生,就否定零假设而去接受对立假设。否则说明样本没有提供否定零假设的显著性证据,因此应该接受零假设。

1.3 相关概念

  • 显著性水平(检验水平)(默认为 α = 0.05 \alpha = 0.05 α=0.05
  • 接受域、拒绝域(否定域)
  • 显著水平对于 H 0 H_0 H0的保护, α \alpha α越小越不容易否定零假设
  • 零假设、对立假设
  • 两类检验错误:第一类错误(拒真),第二类错误(采假)
  • 功效函数: β ϕ ( θ ) = P θ { 否 定 零 假 设 H 0 } , θ ∈ Θ \beta_\phi(\theta) = P_\theta \{ 否定零假设H_0 \}, \theta \in \Theta βϕ(θ)=Pθ{H0},θΘ
    例:
    β ϕ ( μ ) = P μ { X ‾ > C } = 1 − Φ ( n ( C − μ ) σ 0 ) \beta_\phi(\mu) = P_\mu \{ \overline{X} > C \} = 1 - \Phi(\frac {\sqrt{n}(C - \mu)} {\sigma_0}) βϕ(μ)=Pμ{X>C}=1Φ(σ0n (Cμ))
    C = X ‾ = μ 0 + μ α σ 0 n C = \overline{X} = \mu_0 + \frac{\mu_\alpha \sigma_0} {\sqrt{n}} C=X=μ0+n μασ0
    β ϕ ( μ ) = 1 − Φ ( n ( μ 0 − μ ) σ 0 + μ α ) = Φ ( n ( μ − μ 0 ) σ 0 − μ α ) \beta_\phi(\mu) = 1 - \Phi(\frac {\sqrt{n}(\mu_0 - \mu)} {\sigma_0} + \mu_\alpha) = \Phi(\frac {\sqrt{n}(\mu - \mu_0)} {\sigma_0} - \mu_\alpha) βϕ(μ)=1Φ(σ0n (μ0μ)+μα)=Φ(σ0n (μμ0)μα)
  • 检验第一类错误
    β ϕ ( μ ) = Φ ( n ( μ − μ 0 ) σ 0 − μ α ) \beta_\phi(\mu) = \Phi(\frac {\sqrt{n}(\mu - \mu_0)} {\sigma_0} - \mu_\alpha) βϕ(μ)=Φ(σ0n (μμ0)μα)
  • 检验第二类错误
    β ϕ ( μ ) = 1 − Φ ( n ( μ − μ 0 ) σ 0 − μ α ) \beta_\phi(\mu) = 1 - \Phi(\frac {\sqrt{n}(\mu - \mu_0)} {\sigma_0} - \mu_\alpha) βϕ(μ)=1Φ(σ0n (μμ0)μα)
  • p − p- p值( p − v a l u e p-value pvalue):零假设成立时得到所观测数据或者更为极端数据的概率

1.4 注意事项

  • 样本量不变的情况下,无法同时减小第一类错误、第二类错误
  • 先使 α \alpha α尽可能小,减小第一类错误
  • 提高样本容量 n n n,减小第二类错误

二、重要参数检验(只构造水平为 α \alpha α的检验,不讨论犯第二类错误的概率)

2.1 正态总体参数的检验(均值、方差、成对数据)

1、一个总体的均值的检验
(1)方差已知 σ 0 2 \sigma_0^2 σ02( μ \mu μ检验),   n ( X ‾ − μ ) σ 0 \, \frac{\sqrt{n}(\overline{X}-\mu)}{\sigma_0} σ0n (Xμ)~ N ( 0 , 1 ) N(0,1) N(0,1)

  • a .   H 0 :   μ = μ 0   ⇔   H 1 :   μ ≠ μ 0 a. \, H_0: \, \mu = \mu_0 \, \Leftrightarrow \, H_1: \, \mu \ne \mu_0 a.H0:μ=μ0H1:μ=μ0
    n ∣ X ‾ − μ 0 ∣ σ 0 > μ α / 2 \frac{\sqrt{n}|\overline{X}-\mu_0|}{\sigma_0} > \mu_{\alpha/2} σ0n Xμ0>μα/2
  • b .   H 0 :   μ ≤ μ 0   ⇔   H 1 :   μ > μ 0 b. \, H_0: \, \mu \le \mu_0 \, \Leftrightarrow \, H_1: \, \mu > \mu_0 b.H0:μμ0H1:μ>μ0
    n ( X ‾ − μ 0 ) σ 0 > μ α \frac{\sqrt{n}(\overline{X}-\mu_0)}{\sigma_0} > \mu_{\alpha} σ0n (Xμ0)>μα
  • c .   H 0 :   μ ≥ μ 0   ⇔   H 1 :   μ < μ 0 c. \, H_0: \, \mu \ge \mu_0 \, \Leftrightarrow \, H_1: \, \mu < \mu_0 c.H0:μμ0H1:μ<μ0
    n ( X ‾ − μ 0 ) σ 0 < − μ α \frac{\sqrt{n}(\overline{X}-\mu_0)}{\sigma_0} < -\mu_{\alpha} σ0n (Xμ0)<μα

(2)方差 σ 0 2 \sigma_0^2 σ02未知( t t t检验),   n ( X ‾ − μ ) S \, \frac{\sqrt{n}(\overline{X}-\mu)}{S} Sn (Xμ)~ t ( n − 1 ) t(n-1) t(n1)

  • a .   H 0 :   μ = μ 0   ⇔   H 1 :   μ ≠ μ 0 a. \, H_0: \, \mu = \mu_0 \, \Leftrightarrow \, H_1: \, \mu \ne \mu_0 a.H0:μ=μ0H1:μ=μ0
    n ∣ X ‾ − μ ∣ S > t α / 2 ( n − 1 ) \frac{\sqrt{n}|\overline{X}-\mu|}{S} > t_{\alpha/2}(n-1) Sn Xμ>tα/2(n1)
  • b .   H 0 :   μ ≤ μ 0   ⇔   H 1 :   μ > μ 0 b. \, H_0: \, \mu \le \mu_0 \, \Leftrightarrow \, H_1: \, \mu > \mu_0 b.H0:μμ0H1:μ>μ0
    n ( X ‾ − μ ) S > t α ( n − 1 ) \frac{\sqrt{n}(\overline{X}-\mu)}{S} > t_{\alpha}(n-1) Sn (Xμ)>tα(n1)
  • c .   H 0 :   μ ≥ μ 0   ⇔   H 1 :   μ < μ 0 c. \, H_0: \, \mu \ge \mu_0 \, \Leftrightarrow \, H_1: \, \mu < \mu_0 c.H0:μμ0H1:μ<μ0
    n ( X ‾ − μ ) S < − t α ( n − 1 ) \frac{\sqrt{n}(\overline{X}-\mu)}{S} < -t_{\alpha}(n-1) Sn (Xμ)<tα(n1)

2、两个总体均值差的检验
(1)方差 σ 1 2 、 σ 2 2 \sigma_1^2、\sigma_2^2 σ12σ22未知( μ \mu μ检验),   ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 \, \frac {(\overline{X} - \overline{Y})-(\mu_1 - \mu_2)} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} n1σ12+n2σ22 (XY)(μ1μ2)~ N ( 0 , 1 ) N(0,1) N(0,1)

  • a .   H 0 :   μ 1 − μ 2 = δ   ⇔   H 1 :   μ 1 − μ 2 ≠ δ a. \, H_0: \, \mu_1 - \mu_2 = \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 \ne \delta a.H0:μ1μ2=δH1:μ1μ2=δ
    ∣ X ‾ − Y ‾ − δ ∣ σ 1 2 n 1 + σ 2 2 n 2 > μ α / 2 \frac {|\overline{X} - \overline{Y} - \delta|} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} > \mu_{\alpha/2} n1σ12+n2σ22 XYδ>μα/2
  • b .   H 0 :   μ 1 − μ 2 ≤ δ   ⇔   H 1 :   μ 1 − μ 2 > δ b. \, H_0: \, \mu_1 - \mu_2 \le \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 > \delta b.H0:μ1μ2δH1:μ1μ2>δ
    X ‾ − Y ‾ − δ σ 1 2 n 1 + σ 2 2 n 2 > μ α \frac {\overline{X} - \overline{Y} - \delta} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} > \mu_{\alpha} n1σ12+n2σ22 XYδ>μα
  • c .   H 0 :   μ 1 − μ 2 ≥ δ   ⇔   H 1 :   μ 1 − μ 2 < δ c. \, H_0: \, \mu_1 - \mu_2 \ge \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 < \delta c.H0:μ1μ2δH1:μ1μ2<δ
    X ‾ − Y ‾ − δ σ 1 2 n 1 + σ 2 2 n 2 < − μ α \frac {\overline{X} - \overline{Y} - \delta} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} < -\mu_{\alpha} n1σ12+n2σ22 XYδ<μα

(2)方差 σ 1 2 、 σ 2 2 \sigma_1^2、\sigma_2^2 σ12σ22未知但相等( t t t检验),   ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 \, \frac {(\overline{X} - \overline{Y})-(\mu_1 - \mu_2)} {S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} Swn11+n21 (XY)(μ1μ2)~ t ( n 1 + n 2 − 2 ) t(n_1+n_2-2) t(n1+n22)
S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2} Sw2=n1+n22(n11)S12+(n21)S22

  • a .   H 0 :   μ 1 − μ 2 = δ   ⇔   H 1 :   μ 1 − μ 2 ≠ δ a. \, H_0: \, \mu_1 - \mu_2 = \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 \ne \delta a.H0:μ1μ2=δH1:μ1μ2=δ
    ∣ X ‾ − Y ‾ − δ ∣ S w 1 n 1 + 1 n 2 > t α / 2 ( n 1 + n 2 − 2 ) \frac {|\overline{X} - \overline{Y} - \delta|} {S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} > t_{\alpha/2}(n_1 + n_2 - 2) Swn11+n21 XYδ>tα/2(n1+n22)
  • b .   H 0 :   μ 1 − μ 2 ≤ δ   ⇔   H 1 :   μ 1 − μ 2 > δ b. \, H_0: \, \mu_1 - \mu_2 \le \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 > \delta b.H0:μ1μ2δH1:μ1μ2>δ
    X ‾ − Y ‾ − δ S w 1 n 1 + 1 n 2 > t α ( n 1 + n 2 − 2 ) \frac {\overline{X} - \overline{Y} - \delta} {S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} > t_{\alpha}(n_1 + n_2 - 2) Swn11+n21 XYδ>tα(n1+n22)
  • c .   H 0 :   μ 1 − μ 2 ≥ δ   ⇔   H 1 :   μ 1 − μ 2 < δ c. \, H_0: \, \mu_1 - \mu_2 \ge \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 < \delta c.H0:μ1μ2δH1:μ1μ2<δ
    X ‾ − Y ‾ − δ S w 1 n 1 + 1 n 2 < − t α ( n 1 + n 2 − 2 ) \frac {\overline{X} - \overline{Y} - \delta} {S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} < -t_{\alpha}(n_1 + n_2 - 2) Swn11+n21 XYδ<tα(n1+n22)

3、一个总体的方差的检验
(1)均值 μ 0 \mu_0 μ0已知( χ 2 \chi^2 χ2检验), n ( X ‾ − μ 0 ) σ \frac{\sqrt{n}(\overline{X}-\mu_0)}{\sigma} σn (Xμ0)~ N ( 0 , 1 )   o r   ∑ k = 1 n ( X k − μ 0 ) 2 σ 2 N(0,1) \, or \, \sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma^2} N(0,1)ork=1nσ2(Xkμ0)2 ~ χ 2 ( n ) \chi^2(n) χ2(n)

  • a .   H 0 :   σ 2 = σ 0 2   ⇔   H 1 :   σ 2 ≠ σ 0 2 a. \, H_0: \, \sigma^2 = \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 \ne \sigma_0^2 a.H0:σ2=σ02H1:σ2=σ02
    ∑ k = 1 n ( X k − μ 0 ) 2 σ 0 2 > χ α / 2 2 ( n )        o r       ∑ k = 1 n ( X k − μ 0 ) 2 σ 0 2 < χ 1 − α / 2 2 ( n ) \sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma_0^2} > \chi_{\alpha/2}^2(n) \,\,\,\,\,\, or \, \,\,\,\,\sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma_0^2} < \chi_{1 - \alpha/2}^2(n) k=1nσ02(Xkμ0)2>χα/22(n)ork=1nσ02(Xkμ0)2<χ1α/22(n)
  • b .   H 0 :   σ 2 ≤ σ 0 2   ⇔   H 1 :   σ 2 > σ 0 2 b. \, H_0: \, \sigma^2 \le \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 > \sigma_0^2 b.H0:σ2σ02H1:σ2>σ02
    ∑ k = 1 n ( X k − μ 0 ) 2 σ 0 2 > χ α 2 ( n ) \sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma_0^2} > \chi_{\alpha}^2(n) k=1nσ02(Xkμ0)2>χα2(n)
  • c .   H 0 :   σ 2 ≥ σ 0 2   ⇔   H 1 :   σ 2 < σ 0 2 c. \, H_0: \, \sigma^2 \ge \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 < \sigma_0^2 c.H0:σ2σ02H1:σ2<σ02
    ∑ k = 1 n ( X k − μ 0 ) 2 σ 0 2 < χ 1 − α 2 ( n ) \sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma_0^2} < \chi_{1 - \alpha}^2(n) k=1nσ02(Xkμ0)2<χ1α2(n)

(2)均值 μ \mu μ未知( χ 2 \chi^2 χ2检验), ∑ k = 1 n ( X k − X ‾ ) 2 σ 2 \sum_{k=1}^n \frac{(X_k - \overline{X})^2}{\sigma^2} k=1nσ2(XkX)2 ~ χ 2 ( n − 1 ) \chi^2(n-1) χ2(n1)

  • a .   H 0 :   σ 2 = σ 0 2   ⇔   H 1 :   σ 2 ≠ σ 0 2 a. \, H_0: \, \sigma^2 = \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 \ne \sigma_0^2 a.H0:σ2=σ02H1:σ2=σ02
    ∑ k = 1 n ( X k − X ‾ ) 2 σ 0 2 > χ α / 2 2 ( n − 1 )        o r       ∑ k = 1 n ( X k − X ‾ ) 2 σ 0 2 < χ 1 − α / 2 2 ( n − 1 ) \sum_{k=1}^n \frac{(X_k-\overline{X})^2}{\sigma_0^2} > \chi_{\alpha/2}^2(n - 1) \,\,\,\,\,\, or \,\,\,\,\, \sum_{k=1}^n \frac{(X_k-\overline{X})^2}{\sigma_0^2} < \chi_{1 - \alpha/2}^2(n - 1) k=1nσ02(XkX)2>χα/22(n1)ork=1nσ02(XkX)2<χ1α/22(n1)
  • b .   H 0 :   σ 2 ≤ σ 0 2   ⇔   H 1 :   σ 2 > σ 0 2 b. \, H_0: \, \sigma^2 \le \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 > \sigma_0^2 b.H0:σ2σ02H1:σ2>σ02
    ∑ k = 1 n ( X k − X ‾ ) 2 σ 0 2 > χ α 2 ( n − 1 ) \sum_{k=1}^n \frac{(X_k-\overline{X})^2}{\sigma_0^2} > \chi_{\alpha}^2(n - 1) k=1nσ02(XkX)2>χα2(n1)
  • c .   H 0 :   σ 2 ≥ σ 0 2   ⇔   H 1 :   σ 2 < σ 0 2 c. \, H_0: \, \sigma^2 \ge \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 < \sigma_0^2 c.H0:σ2σ02H1:σ2<σ02
    ∑ k = 1 n ( X k − X ‾ ) 2 σ 0 2 < χ 1 − α 2 ( n − 1 ) \sum_{k=1}^n \frac{(X_k-\overline{X})^2}{\sigma_0^2} < \chi_{1 - \alpha}^2(n - 1) k=1nσ02(XkX)2<χ1α2(n1)

4、两个总体方差比的检验
(1)均值 μ 1 、 μ 2 \mu_1、\mu_2 μ1μ2都未知( F F F检验), S 1 2 / S 2 2 σ 1 2 / σ 2 2 \frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} σ12/σ22S12/S22 ~ F ( n 1 − 1 , n 2 − 1 ) F(n_1-1, n_2-1) F(n11,n21)

  • a .   H 0 :   σ 1 2 = σ 2 2   ⇔   H 1 :   σ 2 ≠ σ 0 2 a. \, H_0: \, \sigma_1^2 = \sigma_2^2 \, \Leftrightarrow \, H_1: \, \sigma^2 \ne \sigma_0^2 a.H0:σ12=σ22H1:σ2=σ02
    S 1 2 S 2 2 > F α / 2 ( n 1 − 1 , n 2 − 1 )       o r       S 1 2 S 2 2 < F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2}{S_2^2} > F_{\alpha/2}(n_1-1, n_2-1) \,\,\,\,\, or \,\,\,\,\, \frac{S_1^2}{S_2^2} < F_{1 - \alpha/2}(n_1-1, n_2-1) S22S12>Fα/2(n11,n21)orS22S12<F1α/2(n11,n21)
  • b .   H 0 :   σ 1 2 ≤ σ 2 2   ⇔   H 1 :   σ 2 > σ 0 2 b. \, H_0: \, \sigma_1^2 \le \sigma_2^2 \, \Leftrightarrow \, H_1: \, \sigma^2 > \sigma_0^2 b.H0:σ12σ22H1:σ2>σ02
    S 1 2 S 2 2 > F α ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2}{S_2^2} > F_{\alpha}(n_1-1, n_2-1) S22S12>Fα(n11,n21)
  • c .   H 0 :   σ 1 2 ≥ σ 2 2   ⇔   H 1 :   σ 2 < σ 0 2 c. \, H_0: \, \sigma_1^2 \ge \sigma_2^2 \, \Leftrightarrow \, H_1: \, \sigma^2 < \sigma_0^2 c.H0:σ12σ22H1:σ2<σ02
    S 1 2 S 2 2 < F 1 − α ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2}{S_2^2} < F_{1 - \alpha}(n_1-1, n_2-1) S22S12<F1α(n11,n21)

5、成对数据的检验问题
(1)患者分成两组,一组服用甲,另一组服用乙

  • 需要检验两个独立正态总体均值是否相同的问题。(事先检验方差是否相同)

(2)同一组患者各服用甲、乙

  • 需要检验这些成对数据的差来自的正态总体的均值是否为0

2.2 指数总体参数的检验

1、理论依据: 2 n λ X ‾ 2n\lambda \overline{X} 2nλX ~ χ 2 ( 2 n ) \chi^2(2n) χ2(2n)

2、对寿命进行检验

  • a .   H 0 :   λ = λ 0   ⇔   H 1 :   λ ≠ λ 0 a. \, H_0: \, \lambda = \lambda_0 \, \Leftrightarrow \, H_1: \, \lambda \ne \lambda_0 a.H0:λ=λ0H1:λ=λ0
    2 n λ 0 X ‾ < χ 1 − α / 2 2 ( 2 n )       o r       2 n λ 0 X ‾ > χ α / 2 2 ( 2 n ) 2n\lambda_0 \overline{X} < \chi_{1-\alpha/2}^2(2n) \,\,\,\,\, or \,\,\,\,\, 2n\lambda_0 \overline{X} > \chi_{\alpha/2}^2(2n) 2nλ0X<χ1α/22(2n)or2nλ0X>χα/22(2n)
  • b .   H 0 :   λ ≤ λ 0   ⇔   H 1 :   λ > λ 0 b. \, H_0: \, \lambda \le \lambda_0 \, \Leftrightarrow \, H_1: \, \lambda > \lambda_0 b.H0:λλ0H1:λ>λ0
    2 n λ 0 X ‾ < χ 1 − α 2 ( 2 n ) 2n\lambda_0 \overline{X} < \chi_{1-\alpha}^2(2n) 2nλ0X<χ1α2(2n)
  • c .   H 0 :   λ ≥ λ 0   ⇔   H 1 :   λ < λ 0 c. \, H_0: \, \lambda \ge \lambda_0 \, \Leftrightarrow \, H_1: \, \lambda < \lambda_0 c.H0:λλ0H1:λ<λ0
    2 n λ 0 X ‾ > χ α 2 ( 2 n ) 2n\lambda_0 \overline{X} > \chi_{\alpha}^2(2n) 2nλ0X>χα2(2n)

2.3 两点分布参数的检验

1、总体属性比例的检验

  • H 0 :   p = p 0   ⇔   H 1 :   p ≠ p 0 H_0: \, p = p_0 \, \Leftrightarrow \, H_1: \, p \ne p_0 H0:p=p0H1:p=p0
    ∣ z ∣ = ∣ p s − p 0 ∣ p 0 ( 1 − p 0 ) n > μ α / 2 |z| = \frac {|p_s - p_0|}{\sqrt{\frac{p_0(1-p_0)}{n}}} > \mu_{\alpha/2} z=np0(1p0) psp0>μα/2

2、两个总体比例差的检验

  • H 0 :   p 1 − p 2 = 0   ⇔   H 1 :   p 1 − p 2 ≠ 0 H_0: \, p_1 - p_2 = 0 \, \Leftrightarrow \, H_1: \, p_1 - p_2 \ne 0 H0:p1p2=0H1:p1p2=0
    ∣ z ∣ = ∣ p s 1 − p s 2 ∣ p s 1 ( 1 − p s 1 ) n 1 + p s 2 ( 1 − p s 2 ) n 2 > μ α / 2 |z| = \frac {|p_{s1} - p_{s2}|}{\sqrt{\frac{p_{s1}(1-p_{s1})}{n_1} + \frac{p_{s2}(1-p_{s2})}{n_2}}} > \mu_{\alpha/2} z=n1ps1(1ps1)+n2ps2(1ps2) ps1ps2>μα/2

2.4 似然比检验

L R = s u p { L ( θ ) , θ ∈ Θ 0 } s u p { L ( θ ) , θ ∈ Θ } LR = \frac {sup \{ L(\theta), \theta \in \Theta_0 \}} {sup \{ L(\theta), \theta \in \Theta \}} LR=sup{L(θ),θΘ}sup{L(θ),θΘ0}
s u p { P θ ( L R < C ) , θ ∈ Θ 0 } = α sup \{ P_\theta (LR < C), \theta \in \Theta_0 \} = \alpha sup{Pθ(LR<C),θΘ0}=α
H 0 :   θ ∈ Θ 0 的 拒 绝 域 就 是 { L R < C } H_0: \, \theta \in \Theta_0 的拒绝域就是 \{ LR < C \} H0:θΘ0{LR<C}

三、非参数检验

3.1 卡方检验

1、想法
H 0 : F = F 0 ⇔ H 1 : F ≠ F 0 H_0: F=F_0 \Leftrightarrow H_1: F \ne F_0 H0:F=F0H1:F=F0
2、公式
K 2 = ∑ i = 1 m + 1 n p i ( v i n − p i ) 2 K^2 = \sum_{i=1}^{m+1}\frac{n}{p_i}(\frac{v_i}{n} - p_i)^2 K2=i=1m+1pin(nvipi)2
3、完全已知离散分布的卡方检验

  • 需要检验
    H 0 : P { X = a j } = p i , 1 ≤ i ≤ k H_0: P\{ X = a_j \} = p_i, 1 \le i \le k H0:P{X=aj}=pi,1ik
  • 取检验统计量
    K 2 = ∑ i = 1 k n p i ( v i n − p i ) 2 = ∑ i = 1 k ( v i − n p i ) 2 n p i = v i 2 p i ∑ i = 1 k − n K^2 = \sum_{i = 1}^{k} \frac{n}{p_i}(\frac{v_i}{n} - p_i)^2 = \sum_{i = 1}^{k} \frac{(v_i - np_i)^2}{np_i} = \frac{v_i^2}{p_i} \sum_{i = 1}^{k} - n K2=i=1kpin(nvipi)2=i=1knpi(vinpi)2=pivi2i=1kn
  • 水平 α \alpha α 的一个拒绝域
    K 2 > χ α 2 ( k − 1 ) K^2 > \chi_\alpha^2(k-1) K2>χα2(k1)

4、含未知参数离散分布的卡方检验

  • 取检验统计量
    K 2 = ∑ i = 1 k n p i ^ ( v i n − p i ^ ) 2 K^2 = \sum_{i = 1}^{k} \frac{n}{\hat{p_i}}(\frac{v_i}{n} - \hat{p_i})^2 K2=i=1kpi^n(nvipi^)2
  • 水平 α \alpha α 的一个拒绝域
    K 2 > χ α 2 ( k − r − 1 ) K^2 > \chi_\alpha^2(k-r-1) K2>χα2(kr1)

3.2 Kolmogrov检验

1、考虑检验问题
H 0 : F ( x ) = F 0 ( x ) ⇔ H 1 : F ( x ) ≠ F 0 ( x ) H_0: F(x) = F_0(x) \Leftrightarrow H_1: F(x) \ne F_0(x) H0:F(x)=F0(x)H1:F(x)=F0(x)
2、计算经验分布函数
F n ( x ) = { 0 , x ≤ x ( 1 ) k n , x ( k ) < x ≤ x ( k + 1 ) 1 , x > x ( n ) F_n(x) = \begin{cases} 0, & x \le x_{(1)} \\ \frac{k}{n}, & x_{(k)} < x \le x_{(k+1)} \\ 1, & x > x_{(n)} \end{cases} Fn(x)=0,nk,1,xx(1)x(k)<xx(k+1)x>x(n)
3、一致距离定义
D n = s u p ∣ F n ( x ) − F 0 ( x ) ∣ D_n = sup|F_n(x) - F_0(x)| Dn=supFn(x)F0(x)
4、相关定理
(1) G l i v e n k o − C a n t e l l i Glivenko-Cantelli GlivenkoCantelli定理
P { l i m D n = 0 } = 1 P \{ lim D_n = 0 \} = 1 P{limDn=0}=1
(2) K o l m o g r o v Kolmogrov Kolmogrov定理
P { n 1 / 2 D n ≤ x } → Q ( x ) P \{ n^{1/2}D_n \le x \} \to Q(x) P{n1/2Dnx}Q(x)
Q ( x ) = ∑ k = − ∞ k = + ∞ ( − 1 ) k e x p ( − 2 k 2 x 2 ) , x > 0 Q(x) = \sum_{k = - \infty}^{k = + \infty} (-1)^k exp(-2k^2x^2), x>0 Q(x)=k=k=+(1)kexp(2k2x2),x>0
5、 D n D_n Dn的计算公式

  • d k 1 = ∣ k n − F 0 ( x ( k ) ) ∣ , d k 2 = ∣ k − 1 n − F 0 ( x ( k ) ) ∣ d_{k1} = |\frac{k}{n} - F_0(x_{(k)})|, d_{k2} = |\frac{k - 1}{n} - F_0(x_{(k)})| dk1=nkF0(x(k)),dk2=nk1F0(x(k))
  • d k = m a x { d k 1 , d k 2 } d_k = max \{ d_{k1}, d_{k2} \} dk=max{dk1,dk2}
  • D n = m a x { d 1 , d 2 , . . . , d n } D_n = max \{ d_1, d_2, ... , d_n \} Dn=max{d1,d2,...,dn}

6、 K o l m o g r o v Kolmogrov Kolmogrov检验临界值 ( n ≥ 40 ) (n \ge 40) (n40)
P { n 1 / 2 D n ≥ d } = α P \{ n^{1/2}D_n \ge d \} = \alpha P{n1/2Dnd}=α

α \alpha α d d d
0.9 0.575
0.75 0.678
0.50 0.830
0.25 1.02
0.10 1.23
0.05 1.36
0.01 1.63

7、两点不足

  • 只适用于对连续分布的检验
  • 不能用来检验分布族(零假设分布中不能含有参数)

3.3 卡方分析(列联表检验)

H 0 : X 、 Y 相 互 独 立 , p i j = p i ⋅ p j H_0: X、Y 相互独立,p_{ij} = p_i · p_j H0:XYpij=pipj
1、 p i , p j p_i, p_j pi,pj 的极大似然估计

  • l n L = ∑ i = 1 s ∑ j = 1 t ( n i j l n p i + n i j l n q j ) lnL = \sum_{i=1}^{s}\sum_{j=1}^{t}(n_{ij}lnp_i + n_{ij}lnq_j) lnL=i=1sj=1t(nijlnpi+nijlnqj)
  • p i ^ = n i ⋅ n , q j ^ = n ⋅ j n , 1 ≤ i ≤ s , 1 ≤ j ≤ t \hat{p_i} = \frac{n_{i·}}{n}, \hat{q_j} = \frac{n_{·j}}{n}, 1 \le i \le s, 1 \le j \le t pi^=nni,qj^=nnj,1is,1jt

2、(分类变量)独立性的检验
K 2 = ∑ i = 1 s ∑ j = 1 t ( n i j − n p i ^ q j ^ ) 2 n p i ^ q j ^ K^2 = \sum_{i=1}^{s}\sum_{j=1}^{t}\frac{(n_{ij} - n\hat{p_i}\hat{q_j})^2}{n\hat{p_i}\hat{q_j}} K2=i=1sj=1tnpi^qj^(nijnpi^qj^)2
(1)极限分布的自由度为
s t − ( s − 1 ) − ( t − 1 ) − 1 = ( s − 1 ) ( t − 1 ) st-(s-1)-(t-1)-1 = (s-1)(t-1) st(s1)(t1)1=(s1)(t1)
(2)拒绝域为
K 2 > χ α 2 ( ( s − 1 ) ( t − 1 ) ) K^2 > \chi_\alpha^2((s-1)(t-1)) K2>χα2((s1)(t1))
(3)列联表检验统计量的计算公式
K 2 = n [ ∑ i = 1 s ∑ j = 1 t n i j 2 n i ⋅ n ⋅ j − 1 ] K^2 = n[ \sum_{i=1}^{s}\sum_{j=1}^{t} \frac{n_{ij}^2}{n_{i·}n_{·j}} - 1] K2=n[i=1sj=1tninjnij21]
(4)四格表检验统计量的计算公式
K 2 = n ( n 11 n 22 − n 12 n 21 ) 2 n 1 ⋅ n 2 ⋅ n ⋅ 1 n ⋅ 2 K^2 = \frac{n(n_{11}n_{22}-n_{12}n_{21})^2}{n_{1·}n_{2·}n_{·1}n_{·2}} K2=n1n2n1n2n(n11n22n12n21)2

  • 拒绝域
    K 2 > χ α 2 ( 1 ) K^2 > \chi_\alpha^2(1) K2>χα2(1)

3.4 秩检验

1、理论依据:因此依赖于 R R R 的统计量(秩统计量) T ( R ) T(R) T(R) 具有与 X X X 的总体 F F F 无关、固定不变的分布 。
P { R = a } = 1 n ! P \{ R=a \} = \frac{1}{n!} P{R=a}=n!1
2、秩和: W = R 1 + . . . + R n W = R_1 + ... + R_n W=R1+...+Rn
3、特例
(1)两个总体分布函数的秩和检验方法
W = ∑ i = 1 m ∑ j = 1 n I [ Y j > X i ] + 1 2 n ( n + 1 ) W = \sum_{i=1}^{m}\sum_{j=1}^{n}I[Y_j > X_i]+\frac{1}{2}n(n+1) W=i=1mj=1nI[Yj>Xi]+21n(n+1)

  •   H 0 : F ( x ) ≤ G ( x ) ⇔ H 1 : F ( x ) > G ( x ) \, H_0: F(x) \le G(x) \Leftrightarrow H_1: F(x) > G(x) H0:F(x)G(x)H1:F(x)>G(x)
    拒 绝 域 : W ≥ d 拒绝域:W \ge d Wd
  •   H 0 : F ( x ) ≥ G ( x ) ⇔ H 1 : F ( x ) < G ( x ) \, H_0: F(x) \ge G(x) \Leftrightarrow H_1: F(x) < G(x) H0:F(x)G(x)H1:F(x)<G(x)
    拒 绝 域 : W ≤ c 拒绝域:W \le c Wc
  •   H 0 : F ( x ) = G ( x ) ⇔ H 1 : F ( x ) ≠ G ( x ) \, H_0: F(x) = G(x) \Leftrightarrow H_1: F(x) \ne G(x) H0:F(x)=G(x)H1:F(x)=G(x)
    拒 绝 域 : W ≤ c   ∪   W ≥ d 拒绝域:W \le c \,\cup\, W \ge d WcWd

(2)非参数的均值检验

  •   H 0 : μ 1 ≥ μ 2 ⇔ H 1 : μ 1 < μ 2 \, H_0: \mu_1 \ge \mu_2 \Leftrightarrow H_1: \mu_1 < \mu_2 H0:μ1μ2H1:μ1<μ2
    拒 绝 域 : W ≥ d 拒绝域:W \ge d Wd
  •   H 0 : μ 1 ≤ μ 2 ⇔ H 1 : μ 1 > μ 2 \, H_0: \mu_1 \le \mu_2 \Leftrightarrow H_1: \mu_1 > \mu_2 H0:μ1μ2H1:μ1>μ2
    拒 绝 域 : W ≤ c 拒绝域:W \le c Wc
  •   H 0 : μ 1 = μ 2 ⇔ H 1 : μ 1 ≠ μ 2 \, H_0: \mu_1 = \mu_2 \Leftrightarrow H_1: \mu_1 \ne \mu_2 H0:μ1=μ2H1:μ1=μ2
    拒 绝 域 : W ≤ c   ∪   W ≥ d 拒绝域:W \le c \,\cup\, W \ge d WcWd

3.5 符号检验

  • 如果在重复观察时总体没有变化,则 n n n个样本中应该有正、负号基本上各占一半
  • 可以用二项分布计算出正号的 p − p- p
    p − 值 = B I N O M D I S T ( k , n , p , 1 ) p-值=BINOMDIST(k,n,p,1) p=BINOMDIST(k,n,p,1)
  • 相对比较安全

四、统计决策与Bayes理论

4.1 统计决策

1、三个要素
(1)参数空间 Θ \Theta Θ:未知参数 θ \theta θ 全部可能值构成的空间
(2)决策空间 D D D:实际工作中可能采取的各种行为
(3)损失函数 L ( θ , d ) L(\theta, d) L(θ,d):参数是 θ \theta θ 时采取行为 d d d 而引起的损失

2、常见的两种损失函数
(1)平方损失
L ( θ , d ) = ( θ − d ) 2 L(\theta, d) = (\theta - d)^2 L(θ,d)=(θd)2
(2)绝对损失
L ( θ , d ) = ∣ θ − d ∣ L(\theta, d) = |\theta - d| L(θ,d)=θd
3、风险函数
R ( θ , δ ) = E [ L ( θ , δ ( X 1 , . . . , X n ) ) ] R(\theta, \delta) = E [L(\theta, \delta(X_1, ..., X_n))] R(θ,δ)=E[L(θ,δ(X1,...,Xn))]
4、说明

  • 对于任意一个区间估计 δ ( x ) = ( φ 1 ( x ) , φ 2 ( x ) ) \delta(x) = (\varphi_1(x), \varphi_2(x)) δ(x)=(φ1(x),φ2(x))
  • 损失 L 1 L_1 L1导致风险函数
    R 1 ( θ , δ ) = 1 − P { φ 1 ( x ) < θ < φ 2 ( x ) } R_1(\theta, \delta) = 1 - P \{ \varphi_1(x) < \theta < \varphi_2(x) \} R1(θ,δ)=1P{φ1(x)<θ<φ2(x)}
  • 损失 L 2 L_2 L2的风险函数是区间平均长度
    R 2 ( θ , δ ) = E [ φ 2 ( x ) − φ 1 ( x ) ] R_2(\theta, \delta) = E[\varphi_2(x) - \varphi_1(x)] R2(θ,δ)=E[φ2(x)φ1(x)]
  • 指定置信度为 1 − α 1-\alpha 1α就理解为 R 1 ( θ , δ ) ≤ α R_1(\theta, \delta) \le \alpha R1(θ,δ)α,然后在这个条件下要求 R 2 ( θ , δ ) R_2(\theta, \delta) R2(θ,δ) 尽可能地小

5、常用的决策原则
(1) M i n i m a x Minimax Minimax 决策(极小化极大方法):对每一个决策都考虑最坏的可能状态,然后选择哪个对于全部最坏状态而言是最佳的决策。

(2) B a y e s Bayes Bayes 决策:对于参数 θ \theta θ 定义一个概率分布(称为先验分布),把风险函数 R ( θ , d ) R(\theta, d) R(θ,d) 关于这个先验分布取数学期望(称为 B a y e s Bayes Bayes 风险),在决策空间 D D D中使得 B a y e s Bayes Bayes 风险最小的那一个作为问题的解。

4.2 Bayes统计理论

1、背景
(1)频率学派:所有关于 θ \theta θ 的信息都全部包含在样本之中
(2) B a y e s Bayes Bayes 学派:先验分布 h ( θ ) h(\theta) h(θ) 综合了我们在抽样之前对 θ \theta θ 的全部信息

2、基本思想:对 θ \theta θ 的估计或者检验都依据后验分布来进行

3、求解步骤
(1)总体分布律或密度
p ( x , θ ) p(x, \theta) p(x,θ)
(2)概率函数
f ( x ∣ θ ) = ∏ p ( x i , θ ) f(x|\theta) = \prod p(x_i, \theta) f(xθ)=p(xi,θ)
(3) X X X θ \theta θ 的联合分布
h ( θ ) ⋅ ∏ p ( x i , θ ) h(\theta) · \prod p(x_i, \theta) h(θ)p(xi,θ)
(4)样本 X X X 的边缘分布
∫ Θ h ( θ ) ⋅ ∏ p ( x i , θ ) d θ \int_\Theta h(\theta) · \prod p(x_i, \theta) d\theta Θh(θ)p(xi,θ)dθ
(5) θ \theta θ 关于样本 X X X 的后验分布率或者后验密度函数
h ( θ ∣ x ) = h ( θ ) ⋅ ∏ p ( x i , θ ) ∫ Θ h ( θ ) ⋅ ∏ p ( x i , θ ) d θ h(\theta|x) = \frac{h(\theta) · \prod p(x_i, \theta)}{\int_\Theta h(\theta) · \prod p(x_i, \theta) d\theta} h(θx)=Θh(θ)p(xi,θ)dθh(θ)p(xi,θ)
4、 B a y e s Bayes Bayes 统计推断理论
(1) B a y e s Bayes Bayes 点估计:根据损失函数取成后验分布的中位数或者数学期望
(2) B a y e s Bayes Bayes 区间估计:直接由后验分布构造
(3) B a y e s Bayes Bayes 检验:由后验分布计算 θ \theta θ 落在零假设或者对立假设中的概率,哪个大就接受哪个

5、如何确定先验分布
(1)过去的经验或资料
(2)同等无知原则( B a y e s Bayes Bayes 假定):先验分布可以不再是一个分布律或者密度函数。如 h ( θ ) = 1 , θ ∈ R 1 h(\theta) = 1, \theta \in R^1 h(θ)=1,θR1,只要能保证样本 θ \theta θ 的边缘分布有限从而 h ( θ ∣ X ) h(\theta | X) h(θX) 存在即可,此时称为广义先验分布。
(3)共轭先验等

6、 K e r n e l Kernel Kernel 技巧
没有必要对 h ( θ ) ⋅ f ( X ∣ θ ) h(\theta)· f(X | \theta) h(θ)f(Xθ) 进行 θ \theta θ 积分或求和求出样本的边缘分布,而是直接看出后验分布的分布类型(与精确分布只相差一个常数)

五、常考题型及解题思路

1、求犯两类错误的概率 α \alpha α β \beta β
2、元件是否合格?机器是否正常工作?产量有无显著差异?
3、分布是否可以看作是泊松分布?离散均匀分布?二项分布?
4、气管炎与吸烟量是否有关系?三城镇经济收入是否有差异?血型与民族是否有关系?

PDF版本下载

你可能感兴趣的:(应用数理统计)