假设检验:建立原假设的原则、方法

单侧检验与双侧检验的判断与建立原假设

我们得先熟悉几个概念:显著性水平,p值以及检验统计量。

  1. 显著性水平:弃真的概率,犯第一类错误(原假设错误却拒绝了)的概率。在和p-value联系学习时应当按“显著性水平是公认的小事件发生的概率”这一原理来理解(检验中计算出来的p值小于小事件发生的概率,即统计量如此取值的发生概率很小,以至于不应当在本次试验中表现出来,因此认为一定是本来的原假设出错了才会导致统计量如此取值。)
  2. 显著性:一般指的是指两个群体的某些维度之间的任何差异是由于系统因素而不是偶然因素的影响。例如,“男性和女性之间的荷尔蒙水平存在显著性差异”,则代表这两者的差异是由系统因素引起的,而不是由偶然因素解释的。
  3. P值是 当原假设为真时所得到的样本观察结果或更极端结果出现的概率 。如果P值很小,说明这种情况的发生的概率很小。而通过计算我们得出该检验的p值,如果还要小于这个概率,根据小概率原理就有理由认为是原本的假设是有问题的,因此拒绝原假设,P值越小,拒绝原假设的理由越充分。(比如说原假设H0:场内机器尺寸误差小于0.3,即尺寸误差总体均值小于0.3,我们计算出相应的统计量并发现该情况下的p值很小,小于规定的显著性水平——这种情况是十分极端的(当然我们假定了原假设是正确的)竟然都能在一次试验中出现,根据小概率原理我们认为一定是原假设错了,所以要拒绝原假设)
    我们从中可以得到的规律是,计算出的 p-value越小,越有充分的证据显示原假设是错的(计算出的比显著性水平还要小的、即这种极端的事件本不应该在一次实验中就出现);在用P-value进行假设检验时,当p- value大于显著性水平则保留原假设或不拒绝原假设,小于显著性水平时则拒绝原假设。

单侧检验具有一个拒绝域,一个临界值,又分为左单侧和右单侧检验。;双侧检验有两个拒绝域和两个临界值,每个拒绝域面积为α/2. 可以简单解释为,“检验统计量是否落入(左/右单侧、双边的)拒绝域中”,相应地,备择假设中的区间即是拒绝域(理由见下一部分)

原假设与备择假设的建立

如何建立假设并没有固定的统一标准,假设的确定取决于要检验的问题以及检验的目的。一般来说,在考试中一般都将希望证明的命题放在备择假设,而把原有的、传统的观点或结论放在原假设上。可以这么理解,传统的观点或结论并不是我们完全认可的,而是有所怀疑的。如果原有的传统的观点不容置疑,也就不需要检验了;当检验统计量落入拒绝域,我们也就有了充足的理由推翻原假设,我们则会考虑备择假设,即诞生了新理论。
举例如下:

  • 某公司采用了某项可以使寿命延长到5000小时以上的新技术,为了检验新技术是否有效
    原假设H0: 总体均值 <= 5000
    备择假设H1:总体均值>5000

  • 一项研究认为,从及格率上说,男生的数学学得比女生好,检验该结论是否正确。(即传统的观点都认为性别不影响数学成绩,或者女生的成绩比男生要好。)
    原假设H0: 女生及格率>=男生及格率
    备择假设H1: 男生及格率>女生及格率

你可能感兴趣的:(统计学)