第九章假设检验

参考书目为安德森的《商务与经济统计》，以下为个人的学习总结，如果有错误欢迎指正。有需要本书pdf的，链接在本文末尾。（仅限个人学习使用，请勿牟利）

第九章假设检验

假设检验中，我们首先对总体参数做一个尝试性地假设，称为原假设，记作；定义另一个和原假设对立地假设，称为备择假设，记作

9.1 原假设和备择假设的建立

9.1.1 将研究中地假设作为备择假设

例如测试新型燃油系统的燃油效率是否更好，原效率均值24英里/加仑，令新的燃油效率为
我们希望得到的结论为，新型的效率更高。

如果样本拒绝的结论，那么就可以作出的推断。

9.1.2 将收到挑战的假说作为原假设

如检测饮料净含量是否达标，比如一瓶标注67.6盎司的饮料。

我们将受到挑战的假说（质量达标）作为原假设，如果样本不能拒绝原假设，我们则认为商家的产品是达标的。

9.1.3 原假设和备择假设形式的小结

对于总体均值的假设检验，我们令为假定值，并采用下面三种形式之一进行假设检验。

image

前两种是单侧检验，第三种是双侧检验。

9.2 第一类错误和第二类错误

image

简单来说，

如果选择接受是错误的，为第二类错误
如果选择拒绝是错误的，为第一类错误

在原假设为等式形式出现时，如，犯第一类错误的概率称为检验的显著水平

显著水平：当作为一个等式的原假设为真时，反第一类错误的概率称为检验的显著水平。用来表示，一般取0.05或0.01。

应用中：只空值第一类错误的假设检验称为显著性检验（一般也是用这种类型的检）。
由于显著性检验中第二类错误的发生具有不确定性，所以我们只能说不能拒绝，而不说接受。因为接受了可能犯第二类错误。

9.3 总体均值的检验：已知

当总体不服从正态分布时得样本足够大，下面的方法才奏效。

9.3.1 单侧检验

总体均值的单侧检验有以下两种形式：

下侧检验：
上侧检验：

举例：咖啡每听3磅重
假设：
只要拒绝了就可以处罚制造商，如果不能拒绝那就不惩罚。
我们选取36听作为样本，且总体标准差，且样本和总体都服从正态分布。
则
由于服从正态分布，则

image

总体均值假设检验的检验统计量：已知

当z值达到多小我们才能拒绝，两种方法来解决
第一种：P-值法
P-值是一个概率值，它度量样本所提供的证据对原假设的支持程度。P-值越小说明反对原假设的证据越多。

例如刚刚的咖啡例子：
我们根据标准正态概率表查的z=-2.67下侧的面积为0.0038。则P-值为0.0038（也称为实际显著水平）

image

由于P-值为0.0038小于0.01的显著水平，我们容许有0.001概率发生第一类错误的可能性拒绝的成立。

P-值法的拒绝法则：如果p-值，则拒绝

第二种：临界值法
临界值是确定检验统计量的值是否小到足以拒绝原假设的一个基准。换句话，临界值是使我们拒绝原假设的检验统计量的最大值。

下侧检验的拒绝法则：临界值法
如果，则拒绝

例子：咖啡（书上可能写错，根据查表z应该是-2.33）
临界值时标准正态概率分布中，下侧面积相对应的检验统计量的值。利用查表法，我们发现z=-2.23时下侧面积为0.01。对应则我们拒绝

小结：
p-值法相较于临界值法，优点在于可以知道有多么显著（实际显著水平）
单侧检验的p-值：

计算出检验统计量的值
下侧检验，根据标准正态分布，计算z小于或等于检验统计量的值的概率（下侧面积）。
上侧检验：根据标准正态分布，计算z大于或等于检验统计量的值的概率（上侧面积）。

可以根据excel的函数快速进行p和z的转化：

z到p：NORM.DIST()
p到z：NORM.INV()

9.3.2 双侧检验

双侧检验的一般形式：

举例：高尔夫球的发球距离必须为295码，多了或少了都不行。
假设：
如果没有明显偏离295则不会拒绝
选择作为检验的显著性水平,样本量为50，,

p-值法：
如果检验统计量的值位于抽样分布的两侧尾部，则支持拒绝原假设。
上述高尔夫例子：
p-值
由于p-值，所以不能拒绝

双侧检验p-值得计算步骤：

计算检验统计量的值z
判断z的正负号，为正则求z大于或者等于检验统计量值得概率（上侧面积）；为负同理。
将概率乘以2求得p-值

临界值法
例如取显著水平，左右两侧得临界值对应得面积就为根据查表法，求得检验统计量的临界值当
当或者则拒绝

image

9.3.3 小结和建议

截屏2020-12-19 18.02.03

image

9.3.4 区间估计与假设检验的关系

区间估计所构造的区间有%概率包含总体均值，

image

置信区间和假设检验，都是观察样本统计量在抽样分布中的位置：

区间估计，只要样本统计量在抽样分布所要求的范围内，就可以擅长手臂构造置信区间包含总体参数
假设检验中相当于总体参数，只要我们以这个参数作为总体均值，就可以构造一个抽样分布，同样的样本统计量伸长手臂构造的置信区间如果包含了就不能拒绝

9.4 总体均值的检验：未知

针对未知的情况，检验统计量服从自由度为n-1的t分布。
总体均值假设检验的检验统计量：未知

第八章讲了t分布是在假设抽样总体服从正态分布下得到的，当然如果样本容量n足够大也可以用。

9.4.1 单侧检验

例子：给希斯罗机场评分，n为60，评分从0-10分，分，样本标准差，因为高于7认定机场提供了优质服务，所以假设如下：

我们取显著性水平

根据查询t分布表，查得自由度59，t=1.84的情况下p-值为

image

p-值介于0.05和0.025之间，小于0.05。所以我们拒绝，认为这个机场

使用excel来对t和p进行转换：

t转p：T.DIST(x,deg_freedom,True)x填写t的值，最后返回累计下侧面积
p转t：T.INV(probability,deg_freedom)填写下侧面积，返回对应的t值

同样可以使用临界值法：
在自由度为59的t分布中上侧面积对应的临界值为只要我们就可以拒绝。

9.4.2 双侧检验

举例：玩具生产商有近千家分销零售商，预计每个分销零售商需要的订货量为40个玩具，现抽样25个商家，令表示订货量的总体均值，做出假设(定置信水平)：

如果我们不能拒绝那我们就认为总体需求的均值为40（虽然可能犯二类错误）
样本均值
检验统计量的值：

image

根据查表，可以知道t=-1.10的下侧面积介于0.1-0.2之间。不过我用excel算出了准确的下侧面积为0.14，那么p-值= 所以我们不能拒绝，只能选择先接受（可能犯第二类错误）

当然也可以用临界值法：
先求检验统计量的临界值(书上是-2.604有点离谱，我还是以excel为准)
则用计算出来的检验统计量t值来比较，如果在-2.06-2.06之间，我们不能拒绝

9.4.3 小结和应用建议

image

和有相比，没有的话用s来代替，检验统计量需要服从t分布。
如果总体是正态分布，小样本（n<15）也可以有满意结果，总体不服从正态分布，一般也可以有满意结果。

9.5 总体比率

我们令代表总体比率的假设值，下面是关于总体比率的假设检验的三种形式：

image

分别为下侧检验，上侧检验，双侧检验

举例：高尔夫球场，女性少%。经过运营后，看下是否上升。
假设：如果能拒绝就可以支持女性占比上升的结论。取显著水平

前面提到过，且，则服从正态分布。

总体比率假设检验的检验统计量：

回到刚刚的例子，我们选取样本n=400，其中100个为女性，则。
检验统计量

我们将z转换为p（此时为下侧面积），根据查表此时下侧面积=0.9938，那么对应的上侧面积p-值=1-0.9938=0.0062<0.05，则我们可以拒绝认为女性上升了。

也可以用临界值法：
我们求出，由于计算出来的所以我们认为可以拒绝

9.5.1 小结

和总体均值的检验一样，不过需要且，这样才符合正态分布。

image

9.6 假设检验与决策

我们知道：

第一类错误是拒绝了，但为真。（通过置信水平来控制）
第二类错误是接受了，但为假。

对于决策者来说，总是需要做出决策，哪怕不能拒绝。所以后续的章节我们会讨论如何控制第二类错误。

9.7 计算第二类错误的概率

举例：测试电池寿命，我们假设，要求显著水平
已知n=36，，我们使用临界值法
则看检验统计量是否满足不等式
满足，则拒绝，我们对不等式进行处理相当于

小于116.71时我们就会拒绝
大于116.7我们会选择接受（可能犯第二类错误）

为了计算第二类错误的发生概率，我们需要选择一个小于120小时的值，比如选取，我们可能从这批均值为112的货物中选出了的样本

image

我们计算当时的检验统计量
我们可以知道z=2.36的上侧面积为0.0091，这就是当时发生第二类错误的概率0.0091，这个概率用

对于其他小于120的值，我们可以重复计算该过程，求出不同值下犯第二类错误的概率。

image

当为假，我们作出拒绝的正确结论的概率称作检验的功效（power），根据不同的对应的功效，我们可以绘制曲线称作为功效曲线。

image

总结计算第二类错误的概率流程：

确定假设和
在显著水平下，得到z的临界值
并根据求检验统计量的公式，求得临界值
根据3中求得的临界值，得到接受时所对应的样本均值的值，这些值构成了检验的接受域。（就是在的抽样分布上的上侧面积）
对于满足的值，给这个建立抽样分布，利用的抽样分布，和步骤4中的接受域。计算样本均值落在接受域的概率，这一概率值即为在选定值处发生第二类错误的概率。（此时要用以建立的抽样分布）

9.8 对总体均值进行假设检验时样本容量的确定

image

发生第一类错误的概率为，发生第二类错误的概率为
这里为满足的值
我们对上式进行转换可得总体均值单侧假设检验中的样本容量

备注：双侧检验中使用来代替
在决定样本容量之前，需要明确能接受两类错误的概率大小。再计算即可获得样本容量的大小。

对于,,之间的关系如下：

知道其中两个，即可求另一个
给定，在n增大时减小
对于给定n，和成反比

这里可以知道，我们不能同时减小第一类错误和第二类错误，不可兼得。

链接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取码: 333c 复制这段内容后打开百度网盘手机App，操作更方便哦

第九章 假设检验