第九章 假设检验

参考书目为安德森的《商务与经济统计》,以下为个人的学习总结,如果有错误欢迎指正。有需要本书pdf的,链接在本文末尾。(仅限个人学习使用,请勿牟利)

第九章 假设检验

假设检验中,我们首先对总体参数做一个尝试性地假设,称为原假设,记作;定义另一个和原假设对立地假设,称为备择假设,记作

9.1 原假设和备择假设的建立

9.1.1 将研究中地假设作为备择假设

例如测试新型燃油系统的燃油效率是否更好,原效率均值24英里/加仑,令新的燃油效率为
我们希望得到的结论为,新型的效率更高。

如果样本拒绝的结论,那么就可以作出的推断。

9.1.2 将收到挑战的假说作为原假设

如检测饮料净含量是否达标,比如一瓶标注67.6盎司的饮料。


我们将受到挑战的假说(质量达标)作为原假设,如果样本不能拒绝原假设,我们则认为商家的产品是达标的。

9.1.3 原假设和备择假设形式的小结

对于总体均值的假设检验,我们令为假定值,并采用下面三种形式之一进行假设检验。

image

前两种是单侧检验,第三种是双侧检验。

9.2 第一类错误和第二类错误

image

简单来说,

  • 如果选择接受是错误的,为第二类错误
  • 如果选择拒绝是错误的,为第一类错误

在原假设为等式形式出现时,如,犯第一类错误的概率称为检验的显著水平

显著水平:当作为一个等式的原假设为真时,反第一类错误的概率称为检验的显著水平。用来表示,一般取0.05或0.01。

应用中:只空值第一类错误的假设检验称为显著性检验(一般也是用这种类型的检)。
由于显著性检验中第二类错误的发生具有不确定性,所以我们只能说不能拒绝,而不说接受。因为接受了可能犯第二类错误。

9.3 总体均值的检验:已知

当总体不服从正态分布时得样本足够大,下面的方法才奏效。

9.3.1 单侧检验

总体均值的单侧检验有以下两种形式:

  • 下侧检验:
  • 上侧检验:

举例:咖啡每听3磅重
假设:
只要拒绝了就可以处罚制造商,如果不能拒绝那就不惩罚。
我们选取36听作为样本,且总体标准差,且样本和总体都服从正态分布。

由于服从正态分布,则

image

总体均值假设检验的检验统计量:已知

当z值达到多小我们才能拒绝,两种方法来解决
第一种:P-值法
P-值是一个概率值,它度量样本所提供的证据对原假设的支持程度。P-值越小说明反对原假设的证据越多。

例如刚刚的咖啡例子:
我们根据标准正态概率表查的z=-2.67下侧的面积为0.0038。则P-值为0.0038(也称为实际显著水平)

image

由于P-值为0.0038小于0.01的显著水平,我们容许有0.001概率发生第一类错误的可能性拒绝 的成立。

P-值法的拒绝法则:如果p-值,则拒绝

第二种:临界值法
临界值是确定检验统计量的值是否小到足以拒绝原假设的一个基准。换句话,临界值是使我们拒绝原假设的检验统计量的最大值。

下侧检验的拒绝法则:临界值法
如果,则拒绝

例子:咖啡(书上可能写错,根据查表z应该是-2.33)
临界值时标准正态概率分布中,下侧面积相对应的检验统计量的值。利用查表法,我们发现z=-2.23时下侧面积为0.01。对应则我们拒绝

小结
p-值法相较于临界值法,优点在于可以知道有多么显著(实际显著水平)
单侧检验的p-值:

  1. 计算出检验统计量的值
  2. 下侧检验,根据标准正态分布,计算z小于或等于检验统计量的值的概率(下侧面积)。
  3. 上侧检验:根据标准正态分布,计算z大于或等于检验统计量的值的概率(上侧面积)。

可以根据excel的函数快速进行p和z的转化:

  • z到p:NORM.DIST()
  • p到z:NORM.INV()

9.3.2 双侧检验

双侧检验的一般形式:

举例:高尔夫球的发球距离必须为295码,多了或少了都不行。
假设:
如果没有明显偏离295则不会拒绝
选择作为检验的显著性水平,样本量为50,,

p-值法
如果检验统计量的值位于抽样分布的两侧尾部,则支持拒绝原假设。
上述高尔夫例子:
p-值
由于p-值,所以不能拒绝

双侧检验p-值得计算步骤

  1. 计算检验统计量的值z
  2. 判断z的正负号,为正则求z大于或者等于检验统计量值得概率(上侧面积);为负同理。
  3. 将概率乘以2求得p-值

临界值法
例如取显著水平,左右两侧得临界值对应得面积就为根据查表法,求得检验统计量的临界值当
当或者则拒绝

image

9.3.3 小结和建议

截屏2020-12-19 18.02.03
image

9.3.4 区间估计与假设检验的关系

区间估计所构造的区间有%概率包含总体均值,

image

置信区间和假设检验,都是观察样本统计量在抽样分布中的位置:

  • 区间估计,只要样本统计量在抽样分布所要求的范围内,就可以擅长手臂构造置信区间包含总体参数
  • 假设检验中相当于总体参数,只要我们以这个参数作为总体均值,就可以构造一个抽样分布,同样的样本统计量伸长手臂构造的置信区间如果包含了就不能拒绝

9.4 总体均值的检验:未知

针对未知的情况,检验统计量服从自由度为n-1的t分布。
总体均值假设检验的检验统计量:未知

第八章讲了t分布是在假设抽样总体服从正态分布下得到的,当然如果样本容量n足够大也可以用。

9.4.1 单侧检验

例子:给希斯罗机场评分,n为60,评分从0-10分,分,样本标准差,因为高于7认定机场提供了优质服务,所以假设如下:

我们取显著性水平

根据查询t分布表,查得自由度59,t=1.84的情况下p-值为

image

p-值介于0.05和0.025之间,小于0.05。所以我们拒绝 ,认为这个机场

使用excel来对t和p进行转换:

  • t转p:T.DIST(x,deg_freedom,True)x填写t的值,最后返回累计下侧面积
  • p转t:T.INV(probability,deg_freedom)填写下侧面积,返回对应的t值

同样可以使用临界值法:
在自由度为59的t分布中上侧面积对应的临界值为只要我们就可以拒绝。

9.4.2 双侧检验

举例:玩具生产商有近千家分销零售商,预计每个分销零售商需要的订货量为40个玩具,现抽样25个商家,令表示订货量的总体均值,做出假设(定置信水平):

如果我们不能拒绝那我们就认为总体需求的均值为40(虽然可能犯二类错误)
样本均值
检验统计量的值:

image

根据查表,可以知道t=-1.10的下侧面积介于0.1-0.2之间。不过我用excel算出了准确的下侧面积为0.14,那么p-值= 所以我们不能拒绝 ,只能选择先接受(可能犯第二类错误)

当然也可以用临界值法
先求检验统计量的临界值(书上是-2.604有点离谱,我还是以excel为准)
则用计算出来的检验统计量t值来比较,如果在-2.06-2.06之间,我们不能拒绝

9.4.3 小结和应用建议

image

和有 相比,没有的话用s来代替,检验统计量需要服从t分布。
如果总体是正态分布,小样本(n<15)也可以有满意结果,总体不服从正态分布,一般 也可以有满意结果。

9.5 总体比率

我们令代表总体比率的假设值,下面是关于总体比率的假设检验的三种形式:

image

分别为下侧检验,上侧检验,双侧检验

举例:高尔夫球场,女性少%。经过运营后,看下是否上升。
假设: 如果能拒绝就可以支持女性占比上升的结论。取显著水平

前面提到过,且,则服从正态分布。

总体比率假设检验的检验统计量

回到刚刚的例子,我们选取样本n=400,其中100个为女性,则。
检验统计量

我们将z转换为p(此时为下侧面积),根据查表此时下侧面积=0.9938,那么对应的上侧面积p-值=1-0.9938=0.0062<0.05,则我们可以拒绝认为女性上升了。

也可以用临界值法
我们求出,由于计算出来的所以我们认为可以拒绝

9.5.1 小结

和总体均值的检验一样,不过需要且,这样才符合正态分布。

image

9.6 假设检验与决策

我们知道:

  • 第一类错误是拒绝了,但为真。(通过置信水平来控制)
  • 第二类错误是接受了,但为假。

对于决策者来说,总是需要做出决策,哪怕不能拒绝。所以后续的章节我们会讨论如何控制第二类错误。

9.7 计算第二类错误的概率

举例:测试电池寿命,我们假设 ,要求显著水平
已知n=36,,我们使用临界值法
则看检验统计量是否满足不等式
满足,则拒绝,我们对不等式进行处理相当于

  • 小于116.71时我们就会拒绝
  • 大于116.7我们会选择接受(可能犯第二类错误)

为了计算第二类错误的发生概率,我们需要选择一个小于120小时的值,比如选取,我们可能从这批均值为112的货物中选出了的样本

image

我们计算当 时的检验统计量
我们可以知道z=2.36的上侧面积为0.0091,这就是当 时发生第二类错误的概率0.0091,这个概率用

对于其他小于120的值,我们可以重复计算该过程,求出不同值下犯第二类错误的概率。

image

当为假,我们作出拒绝的正确结论的概率称作检验的功效(power),根据不同的对应的功效,我们可以绘制曲线称作为功效曲线。

image

总结计算第二类错误的概率流程:

  1. 确定假设和
  2. 在显著水平下,得到z的临界值
  3. 并根据求检验统计量的公式,求得临界值
  4. 根据3中求得的临界值,得到接受时所对应的样本均值的值,这些值构成了检验的接受域。(就是在的抽样分布上的上侧面积)
  5. 对于满足的值,给这个建立抽样分布,利用的抽样分布,和步骤4中的接受域。计算样本均值落在接受域的概率,这一概率值即为在选定值处发生第二类错误的概率。(此时要用以建立的抽样分布)

9.8 对总体均值进行假设检验时样本容量的确定

image

发生第一类错误的概率为,发生第二类错误的概率为
这里为满足的值
我们对上式进行转换可得总体均值单侧假设检验中的样本容量

备注:双侧检验中使用来代替
在决定样本容量之前,需要明确能接受两类错误的概率大小。再计算即可获得样本容量的大小。

对于,,之间的关系如下:

  1. 知道其中两个,即可求另一个
  2. 给定,在n增大时减小
  3. 对于给定n,和成反比

这里可以知道,我们不能同时减小第一类错误和第二类错误,不可兼得。


链接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取码: 333c 复制这段内容后打开百度网盘手机App,操作更方便哦

你可能感兴趣的:(第九章 假设检验)