四、假设检验

假设检验的基本原理

一、假设的陈述

假设:对总体参数的具体数值所做的陈述。
假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
零假设:通常将研究者想收集证据予以反对的假设称为原假设(零假设)用h0表示。
备择假设:通常将研究者想收集证据予以支持的假设称为备择假设(研究假设)用h1表示。
eg:
  一种零件的标准是直径10cm,对生产过程进行控制,确定这台机床生产是否的零件是否符合标准要求。进行调整,陈述用检验生产过程是否正常的原假设和备择假设?
  h0:μ=10(生产过程正常) 反对
  h1:μ≠10(生产过程不正常)支持

  
建立假设的几点认识:
  ①原假设和备择假设必有一个成立,而且只有一个成立;
  ②通常先确定备择假设,再确定零假设,因为备择假设是我们关心的;
  ③在假设检验中,等号总是放在原假设上,为数学表述上的方便,我们将与H1对立的所有可能情况放进了只含一个符号的原假设之中;
  ④具有方向性的假设 称为单侧假设(单尾检验),没有方向性,假设称为双侧假设(双尾假设);
单侧假设(单尾假设):备择假设具有特定的方向性,并含有符号 ‘>’ 或 ‘<’ 的假设检验。
双侧检验(双尾检验):备择假设没有特定的方向性,并含有符号 ‘≠’ 的假设检验。

假设检验的基本形式:

假设 双侧检验 单侧检验
左侧检验 右侧检验
原假设 H0:μ=μ0 H0:μ≥μ0 H0:μ≤μ0
备择假设 H1:μ≠μ0 H1:μ<μ0 H1:μ>μ0

二、两类错误与显著水平

假设检验的目的是根据样本信息做出决策,也就是作出吃否拒绝原假设而倾向于备择假设的决策。因为原假设和备择假设不能同时成立。
第I类错误(弃真假设):当原假设为真时,拒绝原假设 【α】。
第II类错误(取伪假设):当原假设为假时没有拒绝原假设 【β】 。

决策结果 实际情况
H0为真 H0为假
未拒绝H0 正确决策 第II类错误β
拒绝H0 第I类错误α 正确决策

注意:只有原假设被拒绝时,才会犯第I类错误;当原假设未被拒绝时,会犯第II类错误。由于犯第I类错误的概率是由研究者控制的,因此在假设检验中,往往控制第I类错误的发生概率。发生第I类错误的概率也常被用于检验结论的可靠性,并将这一概率称为显著性水平。
  
显著性水平:假设检验中犯的第I类错误的概率。【α】
显著性水平是事先指定的犯第I类错误的概率α的最大允许值。犯第I类错误的后果更严重,因此α会取值比较小。通常选择显著性水平为0.05或比0.05更小的概率。通常α=0.01、α=0.05、α=0.1等。

在确定显著性水平α就等于控制了第I类错误的概率,但是第II类错误的概率β不确定。因此,在假设检验中我们采用“不拒绝H0”,避免第II类错误的发生风险。

三、检验统计量与拒绝域

提出具体假设后,研究者需要提供可靠的证据来支持所提出的备择假设。信息主要来自所取得样本,检验统计量便于对样本信息进行压缩和概括。

检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。
  检验统计量实际是总体参数的点估计量(样本均值就是总体均值的一个点估计量),将点估计量标准化后,才能用与度量它与原假设的参数值之间的差异程度,对点估计量标准化的依据是:①原假设为H0为真②点估计量的抽样分布。标准化检验统计量简称为检验统计量。
标准化的检验统计量可表示:
标准化的检验统计量=点估计量—假设值/点估计量的抽样标准差

拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。
  拒绝域就是显著性水平α所围成的区域。样本观测结果数值落在拒绝域内,就拒绝原假设。拒绝域的大小与选定的显著水平有一定关系,确定显著性水平α后,根据α确定拒绝域的具体边界值,拒绝与的边界值称为临界值。
临界值:根据给定的显著性水平确定的拒绝与的边界值。
  根据给定的α,得到临界值 。将检验统计量的值与临界值进行比较,作出是否拒绝原假设的决策。当样本固定,拒绝域的未知则取决于检验是单侧检验还是双侧检验。双侧检验的拒绝域在抽样分布的两侧;备择假设具有符号‘<’,拒绝域位于抽样分布的左侧,称为左侧检验;备择假设有符号‘>’,则拒绝域位于抽样分布的右侧,称右侧检验。 在给定显著性水平α条件下,拒绝域与临界值如下图:
四、假设检验_第1张图片

四、利用P值进行决策

显著性水平α是在检验之前确定的,也就是确定了拒绝域,不论检验统计量的值是大小,如果落在拒绝域就拒绝原假设H0,由于α是犯第I类错误的上线控制值,只是个可靠性的大致范围,无法给出精确度量。要测量出样本观测数据与原假设中假设的值μ0的偏离程度,则需要计算P值。
P值(观察到的显著性水平):在原假设为真的条件下,检验统计量的观察值大于或等于其值的概率。
  P值反应时间观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与H0之间不一致的程度越大,检验的结果也就越显著。

四、假设检验_第2张图片
P值是当原假设正确时,得到的所观测数据的概率。
P值进行决策方法简单,与α进行比较,可判断是否拒绝原假设。不论是单双检测,用P值进行决策的准则都是:P值<α,拒绝H0;P值>α,不拒绝H0。
  利用统计量根据显著性水平作出决策,如果我们拒绝原假设,也仅仅是知道犯错误的可能性是α那么大,而P值则是犯错误的实际概率。

总体均值的检验

一、大样本的检验方法

假设检验的重要一步是 确定适当的检验统计量,大样本情况下,样本均值的抽样分布近似服从正态分布,抽样标准差是σ/√n。
  eg:一种饮料,每罐的容量是255ml,标准差为5ml,为检验每罐容量是否符合要求,质检人员随机抽取40罐进行检测,测得每罐的平均容量为255.8ml。取显著性水平α=0.05,检验是否符合标准。
  H0:μ=255
  H1:μ≠255
计算检验统计量的具体数值:
z=(255.8-255)/5√40=1.01
检验统计量的含义:样本均值与检验的总体均值相比,相差1.01个抽样标准差。
双侧检验取值: zα/2 单侧检验取值: zα
  α=0.05 zα/2=z0.025=1.96.由于|z|=1.01

用P值检验
  Excel NORM.S.DIST 函数,将z的绝对值1.01录入,得到结果0.844,
双侧检验P值:2(1-P值) 单侧检验P值:1-P值*
z=1.01 双侧检验最后的P值为:p=2*(1-0.844)=0.312 > α=0.05 不拒绝H0,检验结果表明:没有证据表明生产的饮料不符合标准要求。
四、假设检验_第3张图片

二、小样本的检验方法

检测与大样本总体均值检测一样,区分大样本,小样本,是因为大样本的统计量用正态分布,小样本用t分布。

总体比例的检验

四、假设检验_第4张图片
总结:
  两种情形:①大样本条件下,总体均值的检验采用正态分布统计量,②小样本,总体均值的检验采用t分布统计量。不论是总体均值的检验还是比例检验,除了利用计算检验外,可之间用P值进行检验。

你可能感兴趣的:(统计基础)