L6-假设检验:临界值法与P值法

假设检验(hypothesis testing),又称统计假设检验,先做出某种假设,然后通过抽样收集数据进行统计推理,对此假设应该被拒绝还是接受做出推断。

e.g. 某药品 X X X可以起到降血糖的作用,为检验其药效,随机抽取 9 9 9位实验者。记录服药前的血糖值,然后让每位实验者服用该药物,连续服药一周后,再次记录其血糖值度。服药前后血糖差值如下: 1.5 , 0.6 , − 0.3 , 1.1 , − 0.8 , 0 , 2.2 , − 1.0 , 1.4 1.5, 0.6, -0.3, 1.1,-0.8, 0, 2.2, -1.0, 1.4 1.50.60.31.10.802.21.01.4问题:根据目前的样本能否认为该药物有效的?

1. 建立两个完全对立的假设

原假设(零假设) H 0 H_0 H0,备择假设 (对立假设) H 1 H_1 H1

原假设与备择假设是不对称的,决定谁是原假设,依赖于立场、惯例、方便性。

(1)保护原假设:如果错误地拒绝假设A比错误地拒绝假设B带来更严重的后果——A选作原假设。

  • 假设A:新药有某种毒副作用
  • 假设B:新药无某种毒副作用

“有毒副作用”错误地当成“无毒副作用”比“无毒副作用”错误地当成“有毒副作用”带来的后果更严重,因此A选作原假设 H 0 H0 H0

(2)原假设为维持现状:为解释某些现象或效果的存在性,原假设常取为“无效果”、“无改进”、“无差异”,等,拒绝原假设表示有较强的理由支持备择假设。

  • 原假设 H 0 H_0 H0:药物无效
  • 备择假设 H 1 H_1 H1: 药物有效

(3)原假设取简单假设:只有一个参数(或分布)的假设称为简单假设.如果只有一个假设是简单假设,将其取为原假设。

参数假设的形式

θ \theta θ是反映总体指标某方面特征的量, 是我们感兴趣的参数,一般参数 θ \theta θ的假设有三种情形:

  • H 0 : θ = θ 0 , H 1 : θ < θ 0 H_0:\theta = \theta_0,H_1:\theta < \theta_0 H0θ=θ0H1θ<θ0 (左边检验)
  • H 0 : θ = θ 0 , H 1 : θ > θ 0 H_0:\theta = \theta_0,H_1:\theta > \theta_0 H0θ=θ0H1θ>θ0 (右边检验)
  • H 0 : θ = θ 0 , H 1 : θ ≠ θ 0 H_0:\theta = \theta_0,H_1:\theta \neq \theta_0 H0θ=θ0H1θ=θ0 (右边检验)

其中, H 0 : θ ≥ θ 0 , H 1 : θ < θ 0 H_0:\theta \geq \theta_0,H_1:\theta < \theta_0 H0θθ0H1θ<θ0 (左边检验)与 H 0 : θ = θ 0 , H 1 : θ < θ 0 H_0:\theta = \theta_0,H_1:\theta < \theta_0 H0θ=θ0H1θ<θ0(左边检验)的检验法则与检验效果一致。

同理, H 0 : θ ≤ θ 0 , H 1 : θ > θ 0 H_0:\theta \leq \theta_0,H_1:\theta > \theta_0 H0θθ0H1θ>θ0 (右边检验)与 H 0 : θ = θ 0 , H 1 : θ > θ 0 H_0:\theta = \theta_0,H_1:\theta > \theta_0 H0θ=θ0H1θ>θ0(右边检验)的检验法则与检验效果一致。

2. 给出检验统计量,并确定拒绝域的形式

如果统计量 T = T ( X 1 , . . . , X n ) T=T(X_1,...,X_n) T=T(X1,...,Xn)的取值大小和原假设 H 0 H_0 H0是否成立有密切联系,可将其称为对应假设问题的检验统计量,而对应于拒绝原假设 H 0 H_0 H0时,样本值的范围称为拒绝域,记为 W W W,其补集 W ˉ \bar W Wˉ称为接受域

该例中,设服药前后血糖差值 X ∼ N ( μ , σ 2 ) X \sim N(\mu ,\sigma^2) XN(μ,σ2),并假设 σ = 0.36 \sigma^ = 0.36 σ=0.36

假设检验 H 0 : μ = 0 , H 1 : μ > 0 H_0:\mu=0,H_1:\mu>0 H0μ=0H1μ>0

由于 X ˉ \bar X Xˉ μ \mu μ的无偏估计, X ˉ \bar X Xˉ的取值大小反映了 μ \mu μ的取值大小,当原假设成立时(药物无效), X ˉ \bar X Xˉ取值应偏小。

因此

  • X ˉ ≥ C \bar X \geq C XˉC时,拒绝原假设 H 0 H_0 H0
  • X ˉ < C \bar X < C Xˉ<C时,接受原假设 H 0 H_0 H0

本例中检验统计量 X X X,拒绝域 W = { ( X 1 , . . . , X n ) : X ˉ ≥ C } W = \{(X_1,...,X_n): \bar X \geq C \} W={(X1,...,Xn):XˉC}

关键问题:如何选择 C C C

两类错误

由于样本的随机性,任一检验规则在应用时,都有可能发生错误的判断——两类错误

原假设为真 原假设为假
拒绝原假设 I I I 类错误 正确
接受原假设 正确 I I II II 类错误
  • I I I类错误:拒绝真实的原假设(弃真)
  • I I II II类错误:接受错误的原假设(取伪)

  • α = P { 第 \alpha = P\{第 α=P{I 类 错 误 } = P { 拒 绝 H 0   ∣ H 0 为 真 } 类错误\}= P\{拒绝H_0\ \mid H_0为真\} }=P{H0 H0}
  • β = P { 第 \beta = P\{第 β=P{II 类 错 误 } = P { 接 受 H 0   ∣ H 0 为 假 } 类错误\}= P\{接受H_0\ \mid H_0为假\} }=P{H0 H0}

e.g. 总体 X ∼ N ( μ , 1 ) X \sim N(\mu,1) XN(μ,1),则 X ˉ = 1 n ∑ i = 1 n X i ∼ N ( μ , 1 n ) \bar X = \frac{1}{n}\sum_{i=1}^{n}X_i \sim N(\mu, \frac{1}{n}) Xˉ=n1i=1nXiN(μ,n1)

H 0 : μ = μ 0 , H 1 : μ = μ 1 ( > μ 0 ) H_0:\mu = \mu_0,H_1:\mu=\mu_1(>\mu_0) H0μ=μ0H1:μ=μ1(>μ0),拒绝域: X ˉ ≥ C \bar X \geq C XˉC

犯两类错误的概率相互制约。

Neyman-Pearson原则
首先控制犯第 I I I类错误的概率不超过某个常数 α ∈ ( 0 , 1 ) \alpha \in (0,1) α(0,1),再寻找检验,使得犯第 I I II II类错误的概率尽可能小。 α \alpha α称为显著水平。常取 α = 0.01 , 0.05 , 0.1 \alpha = 0.01,0.05,0.1 α=0.010.050.1等。

3. 临界值法:根据显著水平和统计量的分布确定临界值

本例中,取显著水平 α = 0.05 \alpha = 0.05 α=0.05

H 0 : μ = 0 H_0:\mu=0 H0μ=0成立时, X ˉ 0.6 / 9 ∼ N ( 0 , 1 ) \frac{\bar X}{0.6 / \sqrt{9}}\sim N(0,1) 0.6/9 XˉN(0,1)

犯第 I I I类错误的概率
P { X ˉ ≥ ∣ μ = 0 } = P { X ˉ σ / n ≥ C σ / n ∣ μ = 0 } = 1 − Φ ( C σ / n ) ≤ α = 0.05 \begin{aligned} P\{\bar X \ge \mid \mu = 0\} & = P\{\frac{\bar X}{\sigma / \sqrt{n}} \ge \frac{C}{\sigma / \sqrt{n}} \mid \mu =0 \} \\ & = 1 - \Phi( \frac{C}{\sigma / \sqrt{n}}) \\ & \leq \alpha = 0.05 \end{aligned} P{Xˉμ=0}=P{σ/n Xˉσ/n Cμ=0}=1Φ(σ/n C)α=0.05

Φ ( − z 0.05 ) = 0.05 \Phi(-z_{0.05}) = 0.05 Φ(z0.05)=0.05 C 0.6 / 9 ≥ z 0.05 = 1.645 ⟹ C ≥ 0.329 \frac{C}{0.6 / \sqrt{9}} \ge z_{0.05} = 1.645 \Longrightarrow C \ge 0.329 0.6/9 Cz0.05=1.645C0.329

根据Neyman-Pearson原则,为使犯第 I I II II类错误的概率尽可能小,应取 C = 0.329 C=0.329 C=0.329,因此拒绝域为 W = { X ˉ ≥ 0.329 } W = \{\bar X \ge 0.329\} W={Xˉ0.329}

4. 根据样本得出结论

根据样本, x ˉ = 0.522 > 0.329 \bar x = 0.522 > 0.329 xˉ=0.522>0.329在拒绝域内

当原假设 H 0 H_0 H0成立时,样本落在拒绝域的概率不超过0.05,是小概率事件。根据实际推断原理,有充分的理由拒绝原假设(药物无效),认为药物有效

同理可验证,若取显著性水平 α = 0.01 \alpha = 0.01 α=0.01,拒绝域 W = { X ˉ ≥ 0.465 } W = \{\bar X \ge 0.465\} W={Xˉ0.465} x ˉ = 0.522 > 0.465 \bar x = 0.522 > 0.465 xˉ=0.522>0.465,依然在拒绝域内,因此拒绝原假设。

5. P值法

P _ P\_ P_值:当原假设 H 0 H_0 H0成立时,检验统计量取比观察到的结果更为极端的数值的概率,即最小显著性水平。

P _ = P { X ˉ ≥ x ˉ = 0.522 ∣ μ = 0 } = 1 − Φ ( 0.522 0.6 9 ) = 0.0045 < α = 0.05 \begin{aligned} P\_ & = P\{\bar X \geq \bar x = 0.522 \mid \mu = 0\} \\ & = 1- \Phi(\frac{0.522}{0.6 \sqrt{9}}) = 0.0045 \\ & < \alpha = 0.05 \end{aligned} P_=P{Xˉxˉ=0.522μ=0}=1Φ(0.69 0.522)=0.0045<α=0.05

通过比较 P 值 P_值 P与显著性水平,得出结论:概率这么小的事件发生了,因此拒绝原假设。

P _ P\_ P_值与显著水平 α \alpha α的关系

  • P _ ≤ α P\_ \leq \alpha P_α,等价于样本落在拒绝域内,因此拒绝原假设,称检验结果在水平 α \alpha α下是统计显著的。
  • P _ > α P\_ > \alpha P_>α,等价于样本不落在拒绝域内,因此接受原假设,称检验结果在水平 α \alpha α下是统计不显著的。

小结

(1)临界值法处理假设检验问题的基本步骤

  • 根据实际问题提出原假设和备择假设
  • 提出检验统计量和拒绝域的形式
  • 在给定的显著水平 α \alpha α下,根据Neyman-Pearson原则求出拒绝域的临界值
  • 根据实际样本观测值做出判断

(2) P _ P\_ P_值法处理假设检验问题的基本步骤

  • 根据实际问题提出原假设和备择假设
  • 提出检验统计量和拒绝域的形式
  • 计算检验统计量的观测值与 P _ P\_ P_
  • 根据给定的显著水平 α \alpha α做出判断

你可能感兴趣的:(#,概率论与数理统计,概率论,机器学习)