假设检验
一、基本检验
1.1 背景
- 小概率事件在一次试验中不应该发生
- 女士品茶例子:是否真的有鉴别能力?
- 假设检验的任务就是要根据抽取出的样本,来决定是接受零假设,还是拒绝零假设(接受对立假设)
1.2 基本过程
- 例子:女士品茶、机器是否正常工作 X X X ~ N ( μ , 0.05 ) N(\mu, 0.05) N(μ,0.05)
- 提出一个统计假设:如果机器正常工作,应该是 μ = 15.1 \mu = 15.1 μ=15.1,反之应该是 μ ≠ 15.1 \mu ≠ 15.1 μ=15.1
- 选取一个合适的检验统计量(类比第二章,参数估计、区间估计)
零 假 设 成 立 时 : z = 6 ( X ‾ − 15.1 ) 0.05 → N ( 0 , 1 ) 零假设成立时:z = \frac{\sqrt{6} (\overline{X} - 15.1)}{\sqrt{0.05}} \to N(0,1) 零假设成立时:z=0.05 6 (X−15.1)→N(0,1)
- 利用零假设成立时检验统计量的的分布构造出一个小概率事件
P { 6 ∣ X ‾ − 15.1 ∣ 0.05 > μ α / 2 } = α P\{ \frac{\sqrt{6} |\overline{X} - 15.1|}{\sqrt {0.05}} > \mu_{\alpha/2} \} = \alpha P{0.05 6 ∣X−15.1∣>μα/2}=α
- 代入样本观察值,如果使得这个小概率事件发生,就否定零假设而去接受对立假设。否则说明样本没有提供否定零假设的显著性证据,因此应该接受零假设。
1.3 相关概念
- 显著性水平(检验水平)(默认为 α = 0.05 \alpha = 0.05 α=0.05)
- 接受域、拒绝域(否定域)
- 显著水平对于 H 0 H_0 H0的保护, α \alpha α越小越不容易否定零假设
- 零假设、对立假设
- 两类检验错误:第一类错误(拒真),第二类错误(采假)
- 功效函数: β ϕ ( θ ) = P θ { 否 定 零 假 设 H 0 } , θ ∈ Θ \beta_\phi(\theta) = P_\theta \{ 否定零假设H_0 \}, \theta \in \Theta βϕ(θ)=Pθ{否定零假设H0},θ∈Θ
例:
β ϕ ( μ ) = P μ { X ‾ > C } = 1 − Φ ( n ( C − μ ) σ 0 ) \beta_\phi(\mu) = P_\mu \{ \overline{X} > C \} = 1 - \Phi(\frac {\sqrt{n}(C - \mu)} {\sigma_0}) βϕ(μ)=Pμ{X>C}=1−Φ(σ0n (C−μ))
C = X ‾ = μ 0 + μ α σ 0 n C = \overline{X} = \mu_0 + \frac{\mu_\alpha \sigma_0} {\sqrt{n}} C=X=μ0+n μασ0
β ϕ ( μ ) = 1 − Φ ( n ( μ 0 − μ ) σ 0 + μ α ) = Φ ( n ( μ − μ 0 ) σ 0 − μ α ) \beta_\phi(\mu) = 1 - \Phi(\frac {\sqrt{n}(\mu_0 - \mu)} {\sigma_0} + \mu_\alpha) = \Phi(\frac {\sqrt{n}(\mu - \mu_0)} {\sigma_0} - \mu_\alpha) βϕ(μ)=1−Φ(σ0n (μ0−μ)+μα)=Φ(σ0n (μ−μ0)−μα)
- 检验第一类错误
β ϕ ( μ ) = Φ ( n ( μ − μ 0 ) σ 0 − μ α ) \beta_\phi(\mu) = \Phi(\frac {\sqrt{n}(\mu - \mu_0)} {\sigma_0} - \mu_\alpha) βϕ(μ)=Φ(σ0n (μ−μ0)−μα)
- 检验第二类错误
β ϕ ( μ ) = 1 − Φ ( n ( μ − μ 0 ) σ 0 − μ α ) \beta_\phi(\mu) = 1 - \Phi(\frac {\sqrt{n}(\mu - \mu_0)} {\sigma_0} - \mu_\alpha) βϕ(μ)=1−Φ(σ0n (μ−μ0)−μα)
- p − p- p−值( p − v a l u e p-value p−value):零假设成立时得到所观测数据或者更为极端数据的概率
1.4 注意事项
- 样本量不变的情况下,无法同时减小第一类错误、第二类错误
- 先使 α \alpha α尽可能小,减小第一类错误
- 提高样本容量 n n n,减小第二类错误
二、重要参数检验(只构造水平为 α \alpha α的检验,不讨论犯第二类错误的概率)
2.1 正态总体参数的检验(均值、方差、成对数据)
1、一个总体的均值的检验
(1)方差已知 σ 0 2 \sigma_0^2 σ02( μ \mu μ检验), n ( X ‾ − μ ) σ 0 \, \frac{\sqrt{n}(\overline{X}-\mu)}{\sigma_0} σ0n (X−μ)~ N ( 0 , 1 ) N(0,1) N(0,1)
- a . H 0 : μ = μ 0 ⇔ H 1 : μ ≠ μ 0 a. \, H_0: \, \mu = \mu_0 \, \Leftrightarrow \, H_1: \, \mu \ne \mu_0 a.H0:μ=μ0⇔H1:μ=μ0
n ∣ X ‾ − μ 0 ∣ σ 0 > μ α / 2 \frac{\sqrt{n}|\overline{X}-\mu_0|}{\sigma_0} > \mu_{\alpha/2} σ0n ∣X−μ0∣>μα/2
- b . H 0 : μ ≤ μ 0 ⇔ H 1 : μ > μ 0 b. \, H_0: \, \mu \le \mu_0 \, \Leftrightarrow \, H_1: \, \mu > \mu_0 b.H0:μ≤μ0⇔H1:μ>μ0
n ( X ‾ − μ 0 ) σ 0 > μ α \frac{\sqrt{n}(\overline{X}-\mu_0)}{\sigma_0} > \mu_{\alpha} σ0n (X−μ0)>μα
- c . H 0 : μ ≥ μ 0 ⇔ H 1 : μ < μ 0 c. \, H_0: \, \mu \ge \mu_0 \, \Leftrightarrow \, H_1: \, \mu < \mu_0 c.H0:μ≥μ0⇔H1:μ<μ0
n ( X ‾ − μ 0 ) σ 0 < − μ α \frac{\sqrt{n}(\overline{X}-\mu_0)}{\sigma_0} < -\mu_{\alpha} σ0n (X−μ0)<−μα
(2)方差 σ 0 2 \sigma_0^2 σ02未知( t t t检验), n ( X ‾ − μ ) S \, \frac{\sqrt{n}(\overline{X}-\mu)}{S} Sn (X−μ)~ t ( n − 1 ) t(n-1) t(n−1)
- a . H 0 : μ = μ 0 ⇔ H 1 : μ ≠ μ 0 a. \, H_0: \, \mu = \mu_0 \, \Leftrightarrow \, H_1: \, \mu \ne \mu_0 a.H0:μ=μ0⇔H1:μ=μ0
n ∣ X ‾ − μ ∣ S > t α / 2 ( n − 1 ) \frac{\sqrt{n}|\overline{X}-\mu|}{S} > t_{\alpha/2}(n-1) Sn ∣X−μ∣>tα/2(n−1)
- b . H 0 : μ ≤ μ 0 ⇔ H 1 : μ > μ 0 b. \, H_0: \, \mu \le \mu_0 \, \Leftrightarrow \, H_1: \, \mu > \mu_0 b.H0:μ≤μ0⇔H1:μ>μ0
n ( X ‾ − μ ) S > t α ( n − 1 ) \frac{\sqrt{n}(\overline{X}-\mu)}{S} > t_{\alpha}(n-1) Sn (X−μ)>tα(n−1)
- c . H 0 : μ ≥ μ 0 ⇔ H 1 : μ < μ 0 c. \, H_0: \, \mu \ge \mu_0 \, \Leftrightarrow \, H_1: \, \mu < \mu_0 c.H0:μ≥μ0⇔H1:μ<μ0
n ( X ‾ − μ ) S < − t α ( n − 1 ) \frac{\sqrt{n}(\overline{X}-\mu)}{S} < -t_{\alpha}(n-1) Sn (X−μ)<−tα(n−1)
2、两个总体均值差的检验
(1)方差 σ 1 2 、 σ 2 2 \sigma_1^2、\sigma_2^2 σ12、σ22未知( μ \mu μ检验), ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 \, \frac {(\overline{X} - \overline{Y})-(\mu_1 - \mu_2)} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} n1σ12+n2σ22 (X−Y)−(μ1−μ2)~ N ( 0 , 1 ) N(0,1) N(0,1)
- a . H 0 : μ 1 − μ 2 = δ ⇔ H 1 : μ 1 − μ 2 ≠ δ a. \, H_0: \, \mu_1 - \mu_2 = \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 \ne \delta a.H0:μ1−μ2=δ⇔H1:μ1−μ2=δ
∣ X ‾ − Y ‾ − δ ∣ σ 1 2 n 1 + σ 2 2 n 2 > μ α / 2 \frac {|\overline{X} - \overline{Y} - \delta|} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} > \mu_{\alpha/2} n1σ12+n2σ22 ∣X−Y−δ∣>μα/2
- b . H 0 : μ 1 − μ 2 ≤ δ ⇔ H 1 : μ 1 − μ 2 > δ b. \, H_0: \, \mu_1 - \mu_2 \le \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 > \delta b.H0:μ1−μ2≤δ⇔H1:μ1−μ2>δ
X ‾ − Y ‾ − δ σ 1 2 n 1 + σ 2 2 n 2 > μ α \frac {\overline{X} - \overline{Y} - \delta} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} > \mu_{\alpha} n1σ12+n2σ22 X−Y−δ>μα
- c . H 0 : μ 1 − μ 2 ≥ δ ⇔ H 1 : μ 1 − μ 2 < δ c. \, H_0: \, \mu_1 - \mu_2 \ge \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 < \delta c.H0:μ1−μ2≥δ⇔H1:μ1−μ2<δ
X ‾ − Y ‾ − δ σ 1 2 n 1 + σ 2 2 n 2 < − μ α \frac {\overline{X} - \overline{Y} - \delta} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} < -\mu_{\alpha} n1σ12+n2σ22 X−Y−δ<−μα
(2)方差 σ 1 2 、 σ 2 2 \sigma_1^2、\sigma_2^2 σ12、σ22未知但相等( t t t检验), ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 \, \frac {(\overline{X} - \overline{Y})-(\mu_1 - \mu_2)} {S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} Swn11+n21 (X−Y)−(μ1−μ2)~ t ( n 1 + n 2 − 2 ) t(n_1+n_2-2) t(n1+n2−2)
S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22
- a . H 0 : μ 1 − μ 2 = δ ⇔ H 1 : μ 1 − μ 2 ≠ δ a. \, H_0: \, \mu_1 - \mu_2 = \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 \ne \delta a.H0:μ1−μ2=δ⇔H1:μ1−μ2=δ
∣ X ‾ − Y ‾ − δ ∣ S w 1 n 1 + 1 n 2 > t α / 2 ( n 1 + n 2 − 2 ) \frac {|\overline{X} - \overline{Y} - \delta|} {S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} > t_{\alpha/2}(n_1 + n_2 - 2) Swn11+n21 ∣X−Y−δ∣>tα/2(n1+n2−2)
- b . H 0 : μ 1 − μ 2 ≤ δ ⇔ H 1 : μ 1 − μ 2 > δ b. \, H_0: \, \mu_1 - \mu_2 \le \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 > \delta b.H0:μ1−μ2≤δ⇔H1:μ1−μ2>δ
X ‾ − Y ‾ − δ S w 1 n 1 + 1 n 2 > t α ( n 1 + n 2 − 2 ) \frac {\overline{X} - \overline{Y} - \delta} {S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} > t_{\alpha}(n_1 + n_2 - 2) Swn11+n21 X−Y−δ>tα(n1+n2−2)
- c . H 0 : μ 1 − μ 2 ≥ δ ⇔ H 1 : μ 1 − μ 2 < δ c. \, H_0: \, \mu_1 - \mu_2 \ge \delta \, \Leftrightarrow \, H_1: \, \mu_1 - \mu_2 < \delta c.H0:μ1−μ2≥δ⇔H1:μ1−μ2<δ
X ‾ − Y ‾ − δ S w 1 n 1 + 1 n 2 < − t α ( n 1 + n 2 − 2 ) \frac {\overline{X} - \overline{Y} - \delta} {S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} < -t_{\alpha}(n_1 + n_2 - 2) Swn11+n21 X−Y−δ<−tα(n1+n2−2)
3、一个总体的方差的检验
(1)均值 μ 0 \mu_0 μ0已知( χ 2 \chi^2 χ2检验), n ( X ‾ − μ 0 ) σ \frac{\sqrt{n}(\overline{X}-\mu_0)}{\sigma} σn (X−μ0)~ N ( 0 , 1 ) o r ∑ k = 1 n ( X k − μ 0 ) 2 σ 2 N(0,1) \, or \, \sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma^2} N(0,1)or∑k=1nσ2(Xk−μ0)2 ~ χ 2 ( n ) \chi^2(n) χ2(n)
- a . H 0 : σ 2 = σ 0 2 ⇔ H 1 : σ 2 ≠ σ 0 2 a. \, H_0: \, \sigma^2 = \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 \ne \sigma_0^2 a.H0:σ2=σ02⇔H1:σ2=σ02
∑ k = 1 n ( X k − μ 0 ) 2 σ 0 2 > χ α / 2 2 ( n ) o r ∑ k = 1 n ( X k − μ 0 ) 2 σ 0 2 < χ 1 − α / 2 2 ( n ) \sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma_0^2} > \chi_{\alpha/2}^2(n) \,\,\,\,\,\, or \, \,\,\,\,\sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma_0^2} < \chi_{1 - \alpha/2}^2(n) k=1∑nσ02(Xk−μ0)2>χα/22(n)ork=1∑nσ02(Xk−μ0)2<χ1−α/22(n)
- b . H 0 : σ 2 ≤ σ 0 2 ⇔ H 1 : σ 2 > σ 0 2 b. \, H_0: \, \sigma^2 \le \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 > \sigma_0^2 b.H0:σ2≤σ02⇔H1:σ2>σ02
∑ k = 1 n ( X k − μ 0 ) 2 σ 0 2 > χ α 2 ( n ) \sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma_0^2} > \chi_{\alpha}^2(n) k=1∑nσ02(Xk−μ0)2>χα2(n)
- c . H 0 : σ 2 ≥ σ 0 2 ⇔ H 1 : σ 2 < σ 0 2 c. \, H_0: \, \sigma^2 \ge \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 < \sigma_0^2 c.H0:σ2≥σ02⇔H1:σ2<σ02
∑ k = 1 n ( X k − μ 0 ) 2 σ 0 2 < χ 1 − α 2 ( n ) \sum_{k=1}^n \frac{(X_k-\mu_0)^2}{\sigma_0^2} < \chi_{1 - \alpha}^2(n) k=1∑nσ02(Xk−μ0)2<χ1−α2(n)
(2)均值 μ \mu μ未知( χ 2 \chi^2 χ2检验), ∑ k = 1 n ( X k − X ‾ ) 2 σ 2 \sum_{k=1}^n \frac{(X_k - \overline{X})^2}{\sigma^2} ∑k=1nσ2(Xk−X)2 ~ χ 2 ( n − 1 ) \chi^2(n-1) χ2(n−1)
- a . H 0 : σ 2 = σ 0 2 ⇔ H 1 : σ 2 ≠ σ 0 2 a. \, H_0: \, \sigma^2 = \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 \ne \sigma_0^2 a.H0:σ2=σ02⇔H1:σ2=σ02
∑ k = 1 n ( X k − X ‾ ) 2 σ 0 2 > χ α / 2 2 ( n − 1 ) o r ∑ k = 1 n ( X k − X ‾ ) 2 σ 0 2 < χ 1 − α / 2 2 ( n − 1 ) \sum_{k=1}^n \frac{(X_k-\overline{X})^2}{\sigma_0^2} > \chi_{\alpha/2}^2(n - 1) \,\,\,\,\,\, or \,\,\,\,\, \sum_{k=1}^n \frac{(X_k-\overline{X})^2}{\sigma_0^2} < \chi_{1 - \alpha/2}^2(n - 1) k=1∑nσ02(Xk−X)2>χα/22(n−1)ork=1∑nσ02(Xk−X)2<χ1−α/22(n−1)
- b . H 0 : σ 2 ≤ σ 0 2 ⇔ H 1 : σ 2 > σ 0 2 b. \, H_0: \, \sigma^2 \le \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 > \sigma_0^2 b.H0:σ2≤σ02⇔H1:σ2>σ02
∑ k = 1 n ( X k − X ‾ ) 2 σ 0 2 > χ α 2 ( n − 1 ) \sum_{k=1}^n \frac{(X_k-\overline{X})^2}{\sigma_0^2} > \chi_{\alpha}^2(n - 1) k=1∑nσ02(Xk−X)2>χα2(n−1)
- c . H 0 : σ 2 ≥ σ 0 2 ⇔ H 1 : σ 2 < σ 0 2 c. \, H_0: \, \sigma^2 \ge \sigma_0^2 \, \Leftrightarrow \, H_1: \, \sigma^2 < \sigma_0^2 c.H0:σ2≥σ02⇔H1:σ2<σ02
∑ k = 1 n ( X k − X ‾ ) 2 σ 0 2 < χ 1 − α 2 ( n − 1 ) \sum_{k=1}^n \frac{(X_k-\overline{X})^2}{\sigma_0^2} < \chi_{1 - \alpha}^2(n - 1) k=1∑nσ02(Xk−X)2<χ1−α2(n−1)
4、两个总体方差比的检验
(1)均值 μ 1 、 μ 2 \mu_1、\mu_2 μ1、μ2都未知( F F F检验), S 1 2 / S 2 2 σ 1 2 / σ 2 2 \frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} σ12/σ22S12/S22 ~ F ( n 1 − 1 , n 2 − 1 ) F(n_1-1, n_2-1) F(n1−1,n2−1)
- a . H 0 : σ 1 2 = σ 2 2 ⇔ H 1 : σ 2 ≠ σ 0 2 a. \, H_0: \, \sigma_1^2 = \sigma_2^2 \, \Leftrightarrow \, H_1: \, \sigma^2 \ne \sigma_0^2 a.H0:σ12=σ22⇔H1:σ2=σ02
S 1 2 S 2 2 > F α / 2 ( n 1 − 1 , n 2 − 1 ) o r S 1 2 S 2 2 < F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2}{S_2^2} > F_{\alpha/2}(n_1-1, n_2-1) \,\,\,\,\, or \,\,\,\,\, \frac{S_1^2}{S_2^2} < F_{1 - \alpha/2}(n_1-1, n_2-1) S22S12>Fα/2(n1−1,n2−1)orS22S12<F1−α/2(n1−1,n2−1)
- b . H 0 : σ 1 2 ≤ σ 2 2 ⇔ H 1 : σ 2 > σ 0 2 b. \, H_0: \, \sigma_1^2 \le \sigma_2^2 \, \Leftrightarrow \, H_1: \, \sigma^2 > \sigma_0^2 b.H0:σ12≤σ22⇔H1:σ2>σ02
S 1 2 S 2 2 > F α ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2}{S_2^2} > F_{\alpha}(n_1-1, n_2-1) S22S12>Fα(n1−1,n2−1)
- c . H 0 : σ 1 2 ≥ σ 2 2 ⇔ H 1 : σ 2 < σ 0 2 c. \, H_0: \, \sigma_1^2 \ge \sigma_2^2 \, \Leftrightarrow \, H_1: \, \sigma^2 < \sigma_0^2 c.H0:σ12≥σ22⇔H1:σ2<σ02
S 1 2 S 2 2 < F 1 − α ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2}{S_2^2} < F_{1 - \alpha}(n_1-1, n_2-1) S22S12<F1−α(n1−1,n2−1)
5、成对数据的检验问题
(1)患者分成两组,一组服用甲,另一组服用乙
- 需要检验两个独立正态总体均值是否相同的问题。(事先检验方差是否相同)
(2)同一组患者各服用甲、乙
- 需要检验这些成对数据的差来自的正态总体的均值是否为0
2.2 指数总体参数的检验
1、理论依据: 2 n λ X ‾ 2n\lambda \overline{X} 2nλX ~ χ 2 ( 2 n ) \chi^2(2n) χ2(2n)
2、对寿命进行检验
- a . H 0 : λ = λ 0 ⇔ H 1 : λ ≠ λ 0 a. \, H_0: \, \lambda = \lambda_0 \, \Leftrightarrow \, H_1: \, \lambda \ne \lambda_0 a.H0:λ=λ0⇔H1:λ=λ0
2 n λ 0 X ‾ < χ 1 − α / 2 2 ( 2 n ) o r 2 n λ 0 X ‾ > χ α / 2 2 ( 2 n ) 2n\lambda_0 \overline{X} < \chi_{1-\alpha/2}^2(2n) \,\,\,\,\, or \,\,\,\,\, 2n\lambda_0 \overline{X} > \chi_{\alpha/2}^2(2n) 2nλ0X<χ1−α/22(2n)or2nλ0X>χα/22(2n)
- b . H 0 : λ ≤ λ 0 ⇔ H 1 : λ > λ 0 b. \, H_0: \, \lambda \le \lambda_0 \, \Leftrightarrow \, H_1: \, \lambda > \lambda_0 b.H0:λ≤λ0⇔H1:λ>λ0
2 n λ 0 X ‾ < χ 1 − α 2 ( 2 n ) 2n\lambda_0 \overline{X} < \chi_{1-\alpha}^2(2n) 2nλ0X<χ1−α2(2n)
- c . H 0 : λ ≥ λ 0 ⇔ H 1 : λ < λ 0 c. \, H_0: \, \lambda \ge \lambda_0 \, \Leftrightarrow \, H_1: \, \lambda < \lambda_0 c.H0:λ≥λ0⇔H1:λ<λ0
2 n λ 0 X ‾ > χ α 2 ( 2 n ) 2n\lambda_0 \overline{X} > \chi_{\alpha}^2(2n) 2nλ0X>χα2(2n)
2.3 两点分布参数的检验
1、总体属性比例的检验
- H 0 : p = p 0 ⇔ H 1 : p ≠ p 0 H_0: \, p = p_0 \, \Leftrightarrow \, H_1: \, p \ne p_0 H0:p=p0⇔H1:p=p0
∣ z ∣ = ∣ p s − p 0 ∣ p 0 ( 1 − p 0 ) n > μ α / 2 |z| = \frac {|p_s - p_0|}{\sqrt{\frac{p_0(1-p_0)}{n}}} > \mu_{\alpha/2} ∣z∣=np0(1−p0) ∣ps−p0∣>μα/2
2、两个总体比例差的检验
- H 0 : p 1 − p 2 = 0 ⇔ H 1 : p 1 − p 2 ≠ 0 H_0: \, p_1 - p_2 = 0 \, \Leftrightarrow \, H_1: \, p_1 - p_2 \ne 0 H0:p1−p2=0⇔H1:p1−p2=0
∣ z ∣ = ∣ p s 1 − p s 2 ∣ p s 1 ( 1 − p s 1 ) n 1 + p s 2 ( 1 − p s 2 ) n 2 > μ α / 2 |z| = \frac {|p_{s1} - p_{s2}|}{\sqrt{\frac{p_{s1}(1-p_{s1})}{n_1} + \frac{p_{s2}(1-p_{s2})}{n_2}}} > \mu_{\alpha/2} ∣z∣=n1ps1(1−ps1)+n2ps2(1−ps2) ∣ps1−ps2∣>μα/2
2.4 似然比检验
L R = s u p { L ( θ ) , θ ∈ Θ 0 } s u p { L ( θ ) , θ ∈ Θ } LR = \frac {sup \{ L(\theta), \theta \in \Theta_0 \}} {sup \{ L(\theta), \theta \in \Theta \}} LR=sup{L(θ),θ∈Θ}sup{L(θ),θ∈Θ0}
s u p { P θ ( L R < C ) , θ ∈ Θ 0 } = α sup \{ P_\theta (LR < C), \theta \in \Theta_0 \} = \alpha sup{Pθ(LR<C),θ∈Θ0}=α
H 0 : θ ∈ Θ 0 的 拒 绝 域 就 是 { L R < C } H_0: \, \theta \in \Theta_0 的拒绝域就是 \{ LR < C \} H0:θ∈Θ0的拒绝域就是{LR<C}
三、非参数检验
3.1 卡方检验
1、想法
H 0 : F = F 0 ⇔ H 1 : F ≠ F 0 H_0: F=F_0 \Leftrightarrow H_1: F \ne F_0 H0:F=F0⇔H1:F=F0
2、公式
K 2 = ∑ i = 1 m + 1 n p i ( v i n − p i ) 2 K^2 = \sum_{i=1}^{m+1}\frac{n}{p_i}(\frac{v_i}{n} - p_i)^2 K2=i=1∑m+1pin(nvi−pi)2
3、完全已知离散分布的卡方检验
- 需要检验
H 0 : P { X = a j } = p i , 1 ≤ i ≤ k H_0: P\{ X = a_j \} = p_i, 1 \le i \le k H0:P{X=aj}=pi,1≤i≤k
- 取检验统计量
K 2 = ∑ i = 1 k n p i ( v i n − p i ) 2 = ∑ i = 1 k ( v i − n p i ) 2 n p i = v i 2 p i ∑ i = 1 k − n K^2 = \sum_{i = 1}^{k} \frac{n}{p_i}(\frac{v_i}{n} - p_i)^2 = \sum_{i = 1}^{k} \frac{(v_i - np_i)^2}{np_i} = \frac{v_i^2}{p_i} \sum_{i = 1}^{k} - n K2=i=1∑kpin(nvi−pi)2=i=1∑knpi(vi−npi)2=pivi2i=1∑k−n
- 水平 α \alpha α 的一个拒绝域
K 2 > χ α 2 ( k − 1 ) K^2 > \chi_\alpha^2(k-1) K2>χα2(k−1)
4、含未知参数离散分布的卡方检验
- 取检验统计量
K 2 = ∑ i = 1 k n p i ^ ( v i n − p i ^ ) 2 K^2 = \sum_{i = 1}^{k} \frac{n}{\hat{p_i}}(\frac{v_i}{n} - \hat{p_i})^2 K2=i=1∑kpi^n(nvi−pi^)2
- 水平 α \alpha α 的一个拒绝域
K 2 > χ α 2 ( k − r − 1 ) K^2 > \chi_\alpha^2(k-r-1) K2>χα2(k−r−1)
3.2 Kolmogrov检验
1、考虑检验问题
H 0 : F ( x ) = F 0 ( x ) ⇔ H 1 : F ( x ) ≠ F 0 ( x ) H_0: F(x) = F_0(x) \Leftrightarrow H_1: F(x) \ne F_0(x) H0:F(x)=F0(x)⇔H1:F(x)=F0(x)
2、计算经验分布函数
F n ( x ) = { 0 , x ≤ x ( 1 ) k n , x ( k ) < x ≤ x ( k + 1 ) 1 , x > x ( n ) F_n(x) = \begin{cases} 0, & x \le x_{(1)} \\ \frac{k}{n}, & x_{(k)} < x \le x_{(k+1)} \\ 1, & x > x_{(n)} \end{cases} Fn(x)=⎩⎪⎨⎪⎧0,nk,1,x≤x(1)x(k)<x≤x(k+1)x>x(n)
3、一致距离定义
D n = s u p ∣ F n ( x ) − F 0 ( x ) ∣ D_n = sup|F_n(x) - F_0(x)| Dn=sup∣Fn(x)−F0(x)∣
4、相关定理
(1) G l i v e n k o − C a n t e l l i Glivenko-Cantelli Glivenko−Cantelli定理
P { l i m D n = 0 } = 1 P \{ lim D_n = 0 \} = 1 P{limDn=0}=1
(2) K o l m o g r o v Kolmogrov Kolmogrov定理
P { n 1 / 2 D n ≤ x } → Q ( x ) P \{ n^{1/2}D_n \le x \} \to Q(x) P{n1/2Dn≤x}→Q(x)
Q ( x ) = ∑ k = − ∞ k = + ∞ ( − 1 ) k e x p ( − 2 k 2 x 2 ) , x > 0 Q(x) = \sum_{k = - \infty}^{k = + \infty} (-1)^k exp(-2k^2x^2), x>0 Q(x)=k=−∞∑k=+∞(−1)kexp(−2k2x2),x>0
5、 D n D_n Dn的计算公式
- d k 1 = ∣ k n − F 0 ( x ( k ) ) ∣ , d k 2 = ∣ k − 1 n − F 0 ( x ( k ) ) ∣ d_{k1} = |\frac{k}{n} - F_0(x_{(k)})|, d_{k2} = |\frac{k - 1}{n} - F_0(x_{(k)})| dk1=∣nk−F0(x(k))∣,dk2=∣nk−1−F0(x(k))∣
- d k = m a x { d k 1 , d k 2 } d_k = max \{ d_{k1}, d_{k2} \} dk=max{dk1,dk2}
- D n = m a x { d 1 , d 2 , . . . , d n } D_n = max \{ d_1, d_2, ... , d_n \} Dn=max{d1,d2,...,dn}
6、 K o l m o g r o v Kolmogrov Kolmogrov检验临界值 ( n ≥ 40 ) (n \ge 40) (n≥40)
P { n 1 / 2 D n ≥ d } = α P \{ n^{1/2}D_n \ge d \} = \alpha P{n1/2Dn≥d}=α
α \alpha α |
d d d |
0.9 |
0.575 |
0.75 |
0.678 |
0.50 |
0.830 |
0.25 |
1.02 |
0.10 |
1.23 |
0.05 |
1.36 |
0.01 |
1.63 |
7、两点不足
- 只适用于对连续分布的检验
- 不能用来检验分布族(零假设分布中不能含有参数)
3.3 卡方分析(列联表检验)
H 0 : X 、 Y 相 互 独 立 , p i j = p i ⋅ p j H_0: X、Y 相互独立,p_{ij} = p_i · p_j H0:X、Y相互独立,pij=pi⋅pj
1、 p i , p j p_i, p_j pi,pj 的极大似然估计
- l n L = ∑ i = 1 s ∑ j = 1 t ( n i j l n p i + n i j l n q j ) lnL = \sum_{i=1}^{s}\sum_{j=1}^{t}(n_{ij}lnp_i + n_{ij}lnq_j) lnL=∑i=1s∑j=1t(nijlnpi+nijlnqj)
- p i ^ = n i ⋅ n , q j ^ = n ⋅ j n , 1 ≤ i ≤ s , 1 ≤ j ≤ t \hat{p_i} = \frac{n_{i·}}{n}, \hat{q_j} = \frac{n_{·j}}{n}, 1 \le i \le s, 1 \le j \le t pi^=nni⋅,qj^=nn⋅j,1≤i≤s,1≤j≤t
2、(分类变量)独立性的检验
K 2 = ∑ i = 1 s ∑ j = 1 t ( n i j − n p i ^ q j ^ ) 2 n p i ^ q j ^ K^2 = \sum_{i=1}^{s}\sum_{j=1}^{t}\frac{(n_{ij} - n\hat{p_i}\hat{q_j})^2}{n\hat{p_i}\hat{q_j}} K2=i=1∑sj=1∑tnpi^qj^(nij−npi^qj^)2
(1)极限分布的自由度为
s t − ( s − 1 ) − ( t − 1 ) − 1 = ( s − 1 ) ( t − 1 ) st-(s-1)-(t-1)-1 = (s-1)(t-1) st−(s−1)−(t−1)−1=(s−1)(t−1)
(2)拒绝域为
K 2 > χ α 2 ( ( s − 1 ) ( t − 1 ) ) K^2 > \chi_\alpha^2((s-1)(t-1)) K2>χα2((s−1)(t−1))
(3)列联表检验统计量的计算公式
K 2 = n [ ∑ i = 1 s ∑ j = 1 t n i j 2 n i ⋅ n ⋅ j − 1 ] K^2 = n[ \sum_{i=1}^{s}\sum_{j=1}^{t} \frac{n_{ij}^2}{n_{i·}n_{·j}} - 1] K2=n[i=1∑sj=1∑tni⋅n⋅jnij2−1]
(4)四格表检验统计量的计算公式
K 2 = n ( n 11 n 22 − n 12 n 21 ) 2 n 1 ⋅ n 2 ⋅ n ⋅ 1 n ⋅ 2 K^2 = \frac{n(n_{11}n_{22}-n_{12}n_{21})^2}{n_{1·}n_{2·}n_{·1}n_{·2}} K2=n1⋅n2⋅n⋅1n⋅2n(n11n22−n12n21)2
- 拒绝域
K 2 > χ α 2 ( 1 ) K^2 > \chi_\alpha^2(1) K2>χα2(1)
3.4 秩检验
1、理论依据:因此依赖于 R R R 的统计量(秩统计量) T ( R ) T(R) T(R) 具有与 X X X 的总体 F F F 无关、固定不变的分布 。
P { R = a } = 1 n ! P \{ R=a \} = \frac{1}{n!} P{R=a}=n!1
2、秩和: W = R 1 + . . . + R n W = R_1 + ... + R_n W=R1+...+Rn
3、特例
(1)两个总体分布函数的秩和检验方法
W = ∑ i = 1 m ∑ j = 1 n I [ Y j > X i ] + 1 2 n ( n + 1 ) W = \sum_{i=1}^{m}\sum_{j=1}^{n}I[Y_j > X_i]+\frac{1}{2}n(n+1) W=i=1∑mj=1∑nI[Yj>Xi]+21n(n+1)
- H 0 : F ( x ) ≤ G ( x ) ⇔ H 1 : F ( x ) > G ( x ) \, H_0: F(x) \le G(x) \Leftrightarrow H_1: F(x) > G(x) H0:F(x)≤G(x)⇔H1:F(x)>G(x)
拒 绝 域 : W ≥ d 拒绝域:W \ge d 拒绝域:W≥d
- H 0 : F ( x ) ≥ G ( x ) ⇔ H 1 : F ( x ) < G ( x ) \, H_0: F(x) \ge G(x) \Leftrightarrow H_1: F(x) < G(x) H0:F(x)≥G(x)⇔H1:F(x)<G(x)
拒 绝 域 : W ≤ c 拒绝域:W \le c 拒绝域:W≤c
- H 0 : F ( x ) = G ( x ) ⇔ H 1 : F ( x ) ≠ G ( x ) \, H_0: F(x) = G(x) \Leftrightarrow H_1: F(x) \ne G(x) H0:F(x)=G(x)⇔H1:F(x)=G(x)
拒 绝 域 : W ≤ c ∪ W ≥ d 拒绝域:W \le c \,\cup\, W \ge d 拒绝域:W≤c∪W≥d
(2)非参数的均值检验
- H 0 : μ 1 ≥ μ 2 ⇔ H 1 : μ 1 < μ 2 \, H_0: \mu_1 \ge \mu_2 \Leftrightarrow H_1: \mu_1 < \mu_2 H0:μ1≥μ2⇔H1:μ1<μ2
拒 绝 域 : W ≥ d 拒绝域:W \ge d 拒绝域:W≥d
- H 0 : μ 1 ≤ μ 2 ⇔ H 1 : μ 1 > μ 2 \, H_0: \mu_1 \le \mu_2 \Leftrightarrow H_1: \mu_1 > \mu_2 H0:μ1≤μ2⇔H1:μ1>μ2
拒 绝 域 : W ≤ c 拒绝域:W \le c 拒绝域:W≤c
- H 0 : μ 1 = μ 2 ⇔ H 1 : μ 1 ≠ μ 2 \, H_0: \mu_1 = \mu_2 \Leftrightarrow H_1: \mu_1 \ne \mu_2 H0:μ1=μ2⇔H1:μ1=μ2
拒 绝 域 : W ≤ c ∪ W ≥ d 拒绝域:W \le c \,\cup\, W \ge d 拒绝域:W≤c∪W≥d
3.5 符号检验
- 如果在重复观察时总体没有变化,则 n n n个样本中应该有正、负号基本上各占一半
- 可以用二项分布计算出正号的 p − p- p−值
p − 值 = B I N O M D I S T ( k , n , p , 1 ) p-值=BINOMDIST(k,n,p,1) p−值=BINOMDIST(k,n,p,1)
- 相对比较安全
四、统计决策与Bayes理论
4.1 统计决策
1、三个要素
(1)参数空间 Θ \Theta Θ:未知参数 θ \theta θ 全部可能值构成的空间
(2)决策空间 D D D:实际工作中可能采取的各种行为
(3)损失函数 L ( θ , d ) L(\theta, d) L(θ,d):参数是 θ \theta θ 时采取行为 d d d 而引起的损失
2、常见的两种损失函数
(1)平方损失
L ( θ , d ) = ( θ − d ) 2 L(\theta, d) = (\theta - d)^2 L(θ,d)=(θ−d)2
(2)绝对损失
L ( θ , d ) = ∣ θ − d ∣ L(\theta, d) = |\theta - d| L(θ,d)=∣θ−d∣
3、风险函数
R ( θ , δ ) = E [ L ( θ , δ ( X 1 , . . . , X n ) ) ] R(\theta, \delta) = E [L(\theta, \delta(X_1, ..., X_n))] R(θ,δ)=E[L(θ,δ(X1,...,Xn))]
4、说明
- 对于任意一个区间估计 δ ( x ) = ( φ 1 ( x ) , φ 2 ( x ) ) \delta(x) = (\varphi_1(x), \varphi_2(x)) δ(x)=(φ1(x),φ2(x))
- 损失 L 1 L_1 L1导致风险函数
R 1 ( θ , δ ) = 1 − P { φ 1 ( x ) < θ < φ 2 ( x ) } R_1(\theta, \delta) = 1 - P \{ \varphi_1(x) < \theta < \varphi_2(x) \} R1(θ,δ)=1−P{φ1(x)<θ<φ2(x)}
- 损失 L 2 L_2 L2的风险函数是区间平均长度
R 2 ( θ , δ ) = E [ φ 2 ( x ) − φ 1 ( x ) ] R_2(\theta, \delta) = E[\varphi_2(x) - \varphi_1(x)] R2(θ,δ)=E[φ2(x)−φ1(x)]
- 指定置信度为 1 − α 1-\alpha 1−α就理解为 R 1 ( θ , δ ) ≤ α R_1(\theta, \delta) \le \alpha R1(θ,δ)≤α,然后在这个条件下要求 R 2 ( θ , δ ) R_2(\theta, \delta) R2(θ,δ) 尽可能地小
5、常用的决策原则
(1) M i n i m a x Minimax Minimax 决策(极小化极大方法):对每一个决策都考虑最坏的可能状态,然后选择哪个对于全部最坏状态而言是最佳的决策。
(2) B a y e s Bayes Bayes 决策:对于参数 θ \theta θ 定义一个概率分布(称为先验分布),把风险函数 R ( θ , d ) R(\theta, d) R(θ,d) 关于这个先验分布取数学期望(称为 B a y e s Bayes Bayes 风险),在决策空间 D D D中使得 B a y e s Bayes Bayes 风险最小的那一个作为问题的解。
4.2 Bayes统计理论
1、背景
(1)频率学派:所有关于 θ \theta θ 的信息都全部包含在样本之中
(2) B a y e s Bayes Bayes 学派:先验分布 h ( θ ) h(\theta) h(θ) 综合了我们在抽样之前对 θ \theta θ 的全部信息
2、基本思想:对 θ \theta θ 的估计或者检验都依据后验分布来进行
3、求解步骤
(1)总体分布律或密度
p ( x , θ ) p(x, \theta) p(x,θ)
(2)概率函数
f ( x ∣ θ ) = ∏ p ( x i , θ ) f(x|\theta) = \prod p(x_i, \theta) f(x∣θ)=∏p(xi,θ)
(3) X X X 与 θ \theta θ 的联合分布
h ( θ ) ⋅ ∏ p ( x i , θ ) h(\theta) · \prod p(x_i, \theta) h(θ)⋅∏p(xi,θ)
(4)样本 X X X 的边缘分布
∫ Θ h ( θ ) ⋅ ∏ p ( x i , θ ) d θ \int_\Theta h(\theta) · \prod p(x_i, \theta) d\theta ∫Θh(θ)⋅∏p(xi,θ)dθ
(5) θ \theta θ 关于样本 X X X 的后验分布率或者后验密度函数
h ( θ ∣ x ) = h ( θ ) ⋅ ∏ p ( x i , θ ) ∫ Θ h ( θ ) ⋅ ∏ p ( x i , θ ) d θ h(\theta|x) = \frac{h(\theta) · \prod p(x_i, \theta)}{\int_\Theta h(\theta) · \prod p(x_i, \theta) d\theta} h(θ∣x)=∫Θh(θ)⋅∏p(xi,θ)dθh(θ)⋅∏p(xi,θ)
4、 B a y e s Bayes Bayes 统计推断理论
(1) B a y e s Bayes Bayes 点估计:根据损失函数取成后验分布的中位数或者数学期望
(2) B a y e s Bayes Bayes 区间估计:直接由后验分布构造
(3) B a y e s Bayes Bayes 检验:由后验分布计算 θ \theta θ 落在零假设或者对立假设中的概率,哪个大就接受哪个
5、如何确定先验分布
(1)过去的经验或资料
(2)同等无知原则( B a y e s Bayes Bayes 假定):先验分布可以不再是一个分布律或者密度函数。如 h ( θ ) = 1 , θ ∈ R 1 h(\theta) = 1, \theta \in R^1 h(θ)=1,θ∈R1,只要能保证样本 θ \theta θ 的边缘分布有限从而 h ( θ ∣ X ) h(\theta | X) h(θ∣X) 存在即可,此时称为广义先验分布。
(3)共轭先验等
6、 K e r n e l Kernel Kernel 技巧
没有必要对 h ( θ ) ⋅ f ( X ∣ θ ) h(\theta)· f(X | \theta) h(θ)⋅f(X∣θ) 进行 θ \theta θ 积分或求和求出样本的边缘分布,而是直接看出后验分布的分布类型(与精确分布只相差一个常数)
五、常考题型及解题思路
1、求犯两类错误的概率 α \alpha α 与 β \beta β
2、元件是否合格?机器是否正常工作?产量有无显著差异?
3、分布是否可以看作是泊松分布?离散均匀分布?二项分布?
4、气管炎与吸烟量是否有关系?三城镇经济收入是否有差异?血型与民族是否有关系?
PDF版本下载