理解假设检验原理

这一部分是核心啊核心,经常考啊。

在理解假设检验的原理之前,要理解假设检验的两类错误。即第一类与第二类错误。

image.png

第一类错误,也称为弃真错误、α错误,是指当原假设正确时,而拒绝H0所犯的错误。

第二类错误,也称为取伪错误、β错误,是指原假设错误时,反而接受H0的情况 。

然后再来看假设检验的原理,这部分的话我觉得薛薇讲的挺好的(《SPSS统计分析方法及应用(第4版)》),这里还是summarize一下。

假设检验基于小概率原理,即发生概率很小的随机时间,在某一次特定额实验中几乎不可能发生。在某一假设下,检测某一极端事件发生的概率,若概率很小,可以认为假设是成立的;否则则认为假设不成立。

步骤为:

  1. 提出原假设。一般将希望证实和支持的假设放在备择假设上,将希望推翻的假设放在原假设。
  2. 选择检验统计量
  3. 计算检验统计量观测值发生的概率p,间接得到某一样本值发生的概率。
  4. 给定显著性水平α,做出统计决策。

对4作一些注解:这里的显著性水平α(可以视为一种阈值),指原假设正确却被错误地拒绝了的概率或风险,即犯弃真错误(第一类错误)的概率,一般控制在0.05,即假设检验的目标是使犯弃真错误(第一类错误)的最小,希望它为小概率事件。 犯弃真错误(第一类错误)的概率为0.05,也就说明有95%的概率拒绝原假设而不犯错。这也是我们为什么尽量把希望推翻的假设放在原假设的原因。即,希望大概率地能够不犯错地拒绝掉想要推翻的假设。这里可以引一些实例。比如均值类假设检验,一般的原假设都是总体均值等于检验值,或者多个样本的总体均值相等之类的。其实在现实世界中,等于比不等于要难,多个样本的总体均值相等,只要中间两个不相等就可以推翻了。因此全部相等是想要推翻的假设。原假设为总体分布没有差异、总体方差没有差异、两个随机变量没有关系同理。

得到概率p与显著性水平α,做出统计决策过程如下:

  1. 若检验统计量的概率p小于显著性水平α:说明犯弃真错误的可能性小于我们设定的阈值,拒绝原假设不太可能犯错,可以直接拒绝原假设。
  2. 同理, 若检验统计量的概率p大于显著性水平α:说明犯弃真错误的可能性大于我们设定的阈值,拒绝原假设犯错概率比控制水平搞,不应拒绝原假设。

你可能感兴趣的:(理解假设检验原理)