假设检验之p值(probability value)

假设检验与参数估计时统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。

参数估计是在总体参数未知的前提下,通过样本统计统计量估计参数的方法,得到总体参数的一个点估计或区间估计。而假设检验是,根据以往的经验先给出总体参数值的一个假设,然后通过现有的样本信息去检验这个假设是否成立。

关于假设检验过程中的原假设、备择假设、单侧检验及双侧检验等内容都比较容易理解。这里重点讨论一下对于p值的理解。

为什么要用p值

从p值的英文概念——probability value——很容易理解它是某一种概率的值,这个概率的具体含义是什么?要说明这个概率的含义,我们先说明假设检验的流程,首先提出原假设和备择假设;其次,确定适当的检验统计量(如z统计量、t统计量或F统计量),并计算器数值,这一步会选定一个置信水平即α(如α=0.05或α=0.01);最后进行统计决策,决策的依据是根据样本计算出的统计量与选定置信水平下的值进行比较,然后决定是接受原假设还是拒绝原假设。

从假设检验的流程可以看出,根据检验统计量落入的区域做出是否拒绝原假设。然而当置信水平α确定后,拒绝域的位置也就确定了,这样就可以方便的进行决策,然而这个决策不够精确。假设置信水平α=0.05的统计量值zα/2=1.96,根据某个样本计算的的统计量z=2.5,落入拒绝域,我们拒绝原假设,并指导犯弃真错误的概率为0.05;如果另一个样本计算的统计量z=2.0,同样落入拒绝域,我们拒绝原假设面临的风险也是0.05。而0.05是一个通用的风险概率,这是用域表示的缺陷,但根据不同的样本结果进行决策,面临的风险事实上是有差别的,为了精确地反应决策的风险度,这时就需要利用p值来判断哪一个样本计算的统计量更精确。

p值(p-value,probability value)定义

p值是指当原假设为真时样本观察结果或更极端结果出现的概率。如果p值很小,说明这种情况发生的概率很小,如果这种情况出现了,根据小概率原理,我们就有理由拒绝原假设1,p值越小,拒绝原假设的理由就越充分。

p值的优点事它反映了观察到的实际数据与原假设之间不一致的概率,与传统的拒绝域范围相比,p值是一个具体的值,这样就提供了更多的信息。

总结

通过p值让我们可以更准确的做出决策。也可以直接使用p值进行决策,这时p值本身就代表了显著性水平。也可以使用p值,按照所需要的显著性水平进行判断和决策,具体做法就是将p值和需要的显著性水平进行比较。

参考资料

《统计学(第六版)》:贾俊平

统计学假设检验中 p 值的含义具体是什么? - 马同学的回答 - 知乎

假设检验中的P值


  1. 小概率原理是指一个事件的发生概率很小,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中是必然发生的。统计学上,把小概率事件在一次实验中看成是实际不可能发生的事件,一般认为等于或小于0.05或0.01的概率为小概率。 ↩︎

你可能感兴趣的:(数据分析)