统计学中假设检验的基本步骤

1. 建立假设,确定检验水准 α

假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设.H0 和 H1 的关系是互相对立的,如果拒绝 H0, 就要接受 H1, 根据备择假设不同,假设检验有单、双侧检验两种.

检验水准用 α 表示,通常取 0.05 或 0.10, 检验水准说明了该检验犯第一类错误的概率.

2.犯第一类错误和犯第二类错误

我们当然希望犯两类错误的概率都尽可能小,但是当样本容量固定时,要使犯第一类错误和第二类错误的概率和同时变小是不可能的,减小犯第一类错误的概率势必会增大犯第二类错误的概率,反之亦然,此消彼长。因而,Neyman 和 Pearson 提出一个原则,即在控制犯第一类错误的概率的条件下,尽量使得犯第二类错误的概率尽量小。这一原则的含义是,原假设要受到保护,不轻易否定;若检验结果否定了原假设,则说明否定的理由是充分的。所以在实际问题中,为了通过样本观测值对某一陈述取得强有力的支持,通常把这种陈述本身作为备择假设,而将这种陈述的否定作为原假设。

在统计推断中,这种只控制而不考虑的假设检验,称为显著性检验,称为显著性水平。最常用的的取值为 0.05、0.01、0.001 等。一般情况下,根据研究的问题,如果犯弃真错误损失大,为减少这类错误,的取值应适当的小,反之的取值可以适当大一些。

3. 根据研究目的和设计类型选择适合的检验方法

这里的检验方法,是指参数检验方法,有 u 检验、t 检验和方差分析三种,对应于不同的检验公式。对双样本资料,要注意区分成组设计和配对设计的资料类型。如果资料里有 "配成对子" 字样,或者是对同一对象用两种方法来处理,一般就可以判定是配对设计资料.

4. 确定 P 值并作出统计结论

u 检验得到的是 u 统计量或称 u 值,t 检验得到的是 t 统计量或称 t 值。方差分析得到的是 F 统计量或称 F 值。将求得的统计量绝对值与界值相比,可以确定 P 值.
当 α=0.05 时,u 值要和 u 界值 1.96 相比较,确定 P 值。如果 u<1.96, 则 P>0.05. 反之,如 u>1.96, 则 P<0.05.t 值要和某自由度的 t 界值相比较,确定 P 值。如果 t 值<t 界值,故 P>0.05. 反之,如 t>t 界值,则 P<0.05.
相同自由度的情况下,单侧检验的 t 界值要小于双侧检验的 t 界值,因此有可能出现算得的 t 值大于单侧 t 界值,而小于双侧 t 界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论.

当 P>0.05 时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当 P<0.05 时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。但即使检验结果是 P<0.01 甚至 P<0.001, 都不说明差异相差很大,只表示更有把握认为二者存在差异.

P 值由已知样本计算出来的,表示在原假设为真的情况下观测到该样本或比该样本更加极端的样本的概率。一个大的 P 值表示在原假设为真的情况下,观测到该样本发生的概率很大;当 P 值很小时,表示在原假设为真的情况下,观测到这个样本的概率很小,那么这个本来应该是小概率的事件发生了,我们就有足够的证据怀疑这一假设的真实性,从而拒绝原假设。这就是假设检验的基本原理。

例如,在前面扔硬币的例子当中,如果原假设为硬币是均匀的,如果在 100 次试验当中,观测到了 40 次正面,60 次反面,根据这个样本计算出来的 P 值就表示在硬币是均匀的前提下,在 100 次这样的试验中观测到 40 或小于 40 次正面的概率。

判断原则:

当 P 值 >=,接受原假设;当 P 值 <,拒绝原假设。

你可能感兴趣的:(统计学中假设检验的基本步骤)