假设检验与单侧检验、双侧检验

在看假设检验的例题的时候发现,同样是5%的显著性水平,有时候会选择使用双侧检验,有时候又选择单侧,到底应该如何选择?

今天通过一些资料理解一下,记录下来。

1. 什么是假设检验

我们经常会遇到需要用数据来说服他人的时候,假设检验就是一种解读数据的方式。首先它会有一个样本p,然后它会做出一个假设(零假设),做出假设的同时也就出现了假设的对立面,也就是备择假设。检验的过程就是求出在零假设为真的情况下,得到样本p的概率。

如果得到样本p的概率高,我们就会倾向于认为这个事件发生是合理的,我们也就选择相信这个假设。如果得到样本p的概率很低(一般不满足5%的显著性水平),我们就认为这个事情不太可能发生,我们就拒绝相信这个假设,而选择相信它的对立面备择假设。

2. 假设检验是否准确

由假设检验的定义可以知道,假设检验并非100%精确的。主要存在着这么一种错误:如果我们这一次的抽样,恰好就是抽中了一个非常小的小概率事件

由于我们抽中的是实际情况中的小概率事件,而在假设检验的检验步骤中被认为是不可信的而错过了正确的假设。这种错误我们称作为 第一型错误

3. 如何选择单侧还是双侧检验

在实践中,我们会根据问题的性质来决定:

  1. 双侧检验
    如果检验的目的是检验抽样的样本统计量与假设参数的差是否过大(无论正方向,还是负方向),我们都会把风险分摊到左右两侧。比如显著性水平为5%,则概率曲线的左右两侧各占2.5%,也就是95%的置信区间。

  2. 单侧检验
    如果检验的目的只是注重验证是否偏高,或者偏低,也就是说只注重验证单一方向,我们就检验单侧。比如显著性水平为5%,概率曲线只需要关注某一侧占5%即可,即90%的置信区间。

举个例子,同样是检验中学生男女生身高是否有性别差异。

如果问题是:中学生中,男女生的身高是否存在性别差异,这个时候我们需要用双侧检验,因为实际的差异可能是男生平均身高比女生高,也可能是男生平均比女生矮。这两种情况都属于存在性别差异。

而如果问题变为:中学生中,男生的身高是否比女生高,这个时候我们只需要检验单侧即可。

你可能感兴趣的:(数据分析,数学基础)