参考书目为安德森的《商务与经济统计》,以下为个人的学习总结,如果有错误欢迎指正。有需要本书pdf的,链接在本文末尾。(仅限个人学习使用,请勿牟利)
第九章 假设检验
假设检验中,我们首先对总体参数做一个尝试性地假设,称为原假设,记作;定义另一个和原假设对立地假设,称为备择假设,记作
9.1 原假设和备择假设的建立
9.1.1 将研究中地假设作为备择假设
例如测试新型燃油系统的燃油效率是否更好,原效率均值24英里/加仑,令新的燃油效率为
我们希望得到的结论为,新型的效率更高。
如果样本拒绝的结论,那么就可以作出的推断。
9.1.2 将收到挑战的假说作为原假设
如检测饮料净含量是否达标,比如一瓶标注67.6盎司的饮料。
我们将受到挑战的假说(质量达标)作为原假设,如果样本不能拒绝原假设,我们则认为商家的产品是达标的。
9.1.3 原假设和备择假设形式的小结
对于总体均值的假设检验,我们令为假定值,并采用下面三种形式之一进行假设检验。
前两种是单侧检验,第三种是双侧检验。
9.2 第一类错误和第二类错误
简单来说,
- 如果选择接受是错误的,为第二类错误
- 如果选择拒绝是错误的,为第一类错误
在原假设为等式形式出现时,如,犯第一类错误的概率称为检验的显著水平
显著水平:当作为一个等式的原假设为真时,反第一类错误的概率称为检验的显著水平。用来表示,一般取0.05或0.01。
应用中:只空值第一类错误的假设检验称为显著性检验(一般也是用这种类型的检)。
由于显著性检验中第二类错误的发生具有不确定性,所以我们只能说不能拒绝,而不说接受。因为接受了可能犯第二类错误。
9.3 总体均值的检验:已知
当总体不服从正态分布时得样本足够大,下面的方法才奏效。
9.3.1 单侧检验
总体均值的单侧检验有以下两种形式:
- 下侧检验:
- 上侧检验:
举例:咖啡每听3磅重
假设:
只要拒绝了就可以处罚制造商,如果不能拒绝那就不惩罚。
我们选取36听作为样本,且总体标准差,且样本和总体都服从正态分布。
则
由于服从正态分布,则
总体均值假设检验的检验统计量:已知
当z值达到多小我们才能拒绝,两种方法来解决
第一种:P-值法
P-值是一个概率值,它度量样本所提供的证据对原假设的支持程度。P-值越小说明反对原假设的证据越多。
例如刚刚的咖啡例子:
我们根据标准正态概率表查的z=-2.67下侧的面积为0.0038。则P-值为0.0038(也称为实际显著水平)
由于P-值为0.0038小于0.01的显著水平,我们容许有0.001概率发生第一类错误的可能性拒绝 的成立。
P-值法的拒绝法则:如果p-值,则拒绝
第二种:临界值法
临界值是确定检验统计量的值是否小到足以拒绝原假设的一个基准。换句话,临界值是使我们拒绝原假设的检验统计量的最大值。
下侧检验的拒绝法则:临界值法
如果,则拒绝
例子:咖啡(书上可能写错,根据查表z应该是-2.33)
临界值时标准正态概率分布中,下侧面积相对应的检验统计量的值。利用查表法,我们发现z=-2.23时下侧面积为0.01。对应则我们拒绝
小结:
p-值法相较于临界值法,优点在于可以知道有多么显著(实际显著水平)
单侧检验的p-值:
- 计算出检验统计量的值
- 下侧检验,根据标准正态分布,计算z小于或等于检验统计量的值的概率(下侧面积)。
- 上侧检验:根据标准正态分布,计算z大于或等于检验统计量的值的概率(上侧面积)。
可以根据excel的函数快速进行p和z的转化:
- z到p:NORM.DIST()
- p到z:NORM.INV()
9.3.2 双侧检验
双侧检验的一般形式:
举例:高尔夫球的发球距离必须为295码,多了或少了都不行。
假设:
如果没有明显偏离295则不会拒绝
选择作为检验的显著性水平,样本量为50,,
p-值法:
如果检验统计量的值位于抽样分布的两侧尾部,则支持拒绝原假设。
上述高尔夫例子:
p-值
由于p-值,所以不能拒绝
双侧检验p-值得计算步骤:
- 计算检验统计量的值z
- 判断z的正负号,为正则求z大于或者等于检验统计量值得概率(上侧面积);为负同理。
- 将概率乘以2求得p-值
临界值法
例如取显著水平,左右两侧得临界值对应得面积就为根据查表法,求得检验统计量的临界值当
当或者则拒绝
9.3.3 小结和建议
9.3.4 区间估计与假设检验的关系
区间估计所构造的区间有%概率包含总体均值,
置信区间和假设检验,都是观察样本统计量在抽样分布中的位置:
- 区间估计,只要样本统计量在抽样分布所要求的范围内,就可以擅长手臂构造置信区间包含总体参数
- 假设检验中相当于总体参数,只要我们以这个参数作为总体均值,就可以构造一个抽样分布,同样的样本统计量伸长手臂构造的置信区间如果包含了就不能拒绝
9.4 总体均值的检验:未知
针对未知的情况,检验统计量服从自由度为n-1的t分布。
总体均值假设检验的检验统计量:未知
第八章讲了t分布是在假设抽样总体服从正态分布下得到的,当然如果样本容量n足够大也可以用。
9.4.1 单侧检验
例子:给希斯罗机场评分,n为60,评分从0-10分,分,样本标准差,因为高于7认定机场提供了优质服务,所以假设如下:
我们取显著性水平
根据查询t分布表,查得自由度59,t=1.84的情况下p-值为
p-值介于0.05和0.025之间,小于0.05。所以我们拒绝 ,认为这个机场
使用excel来对t和p进行转换:
- t转p:T.DIST(x,deg_freedom,True)x填写t的值,最后返回累计下侧面积
- p转t:T.INV(probability,deg_freedom)填写下侧面积,返回对应的t值
同样可以使用临界值法:
在自由度为59的t分布中上侧面积对应的临界值为只要我们就可以拒绝。
9.4.2 双侧检验
举例:玩具生产商有近千家分销零售商,预计每个分销零售商需要的订货量为40个玩具,现抽样25个商家,令表示订货量的总体均值,做出假设(定置信水平):
如果我们不能拒绝那我们就认为总体需求的均值为40(虽然可能犯二类错误)
样本均值
检验统计量的值:
根据查表,可以知道t=-1.10的下侧面积介于0.1-0.2之间。不过我用excel算出了准确的下侧面积为0.14,那么p-值= 所以我们不能拒绝 ,只能选择先接受(可能犯第二类错误)
当然也可以用临界值法:
先求检验统计量的临界值(书上是-2.604有点离谱,我还是以excel为准)
则用计算出来的检验统计量t值来比较,如果在-2.06-2.06之间,我们不能拒绝
9.4.3 小结和应用建议
和有 相比,没有的话用s来代替,检验统计量需要服从t分布。
如果总体是正态分布,小样本(n<15)也可以有满意结果,总体不服从正态分布,一般 也可以有满意结果。
9.5 总体比率
我们令代表总体比率的假设值,下面是关于总体比率的假设检验的三种形式:
分别为下侧检验,上侧检验,双侧检验
举例:高尔夫球场,女性少%。经过运营后,看下是否上升。
假设: 如果能拒绝就可以支持女性占比上升的结论。取显著水平
前面提到过,且,则服从正态分布。
总体比率假设检验的检验统计量:
回到刚刚的例子,我们选取样本n=400,其中100个为女性,则。
检验统计量
我们将z转换为p(此时为下侧面积),根据查表此时下侧面积=0.9938,那么对应的上侧面积p-值=1-0.9938=0.0062<0.05,则我们可以拒绝认为女性上升了。
也可以用临界值法:
我们求出,由于计算出来的所以我们认为可以拒绝
9.5.1 小结
和总体均值的检验一样,不过需要且,这样才符合正态分布。
9.6 假设检验与决策
我们知道:
- 第一类错误是拒绝了,但为真。(通过置信水平来控制)
- 第二类错误是接受了,但为假。
对于决策者来说,总是需要做出决策,哪怕不能拒绝。所以后续的章节我们会讨论如何控制第二类错误。
9.7 计算第二类错误的概率
举例:测试电池寿命,我们假设 ,要求显著水平
已知n=36,,我们使用临界值法
则看检验统计量是否满足不等式
满足,则拒绝,我们对不等式进行处理相当于
- 小于116.71时我们就会拒绝
- 大于116.7我们会选择接受(可能犯第二类错误)
为了计算第二类错误的发生概率,我们需要选择一个小于120小时的值,比如选取,我们可能从这批均值为112的货物中选出了的样本
我们计算当 时的检验统计量
我们可以知道z=2.36的上侧面积为0.0091,这就是当 时发生第二类错误的概率0.0091,这个概率用
对于其他小于120的值,我们可以重复计算该过程,求出不同值下犯第二类错误的概率。
当为假,我们作出拒绝的正确结论的概率称作检验的功效(power),根据不同的对应的功效,我们可以绘制曲线称作为功效曲线。
总结计算第二类错误的概率流程:
- 确定假设和
- 在显著水平下,得到z的临界值
- 并根据求检验统计量的公式,求得临界值
- 根据3中求得的临界值,得到接受时所对应的样本均值的值,这些值构成了检验的接受域。(就是在的抽样分布上的上侧面积)
- 对于满足的值,给这个建立抽样分布,利用的抽样分布,和步骤4中的接受域。计算样本均值落在接受域的概率,这一概率值即为在选定值处发生第二类错误的概率。(此时要用以建立的抽样分布)
9.8 对总体均值进行假设检验时样本容量的确定
发生第一类错误的概率为,发生第二类错误的概率为
这里为满足的值
我们对上式进行转换可得总体均值单侧假设检验中的样本容量
备注:双侧检验中使用来代替
在决定样本容量之前,需要明确能接受两类错误的概率大小。再计算即可获得样本容量的大小。
对于,,之间的关系如下:
- 知道其中两个,即可求另一个
- 给定,在n增大时减小
- 对于给定n,和成反比
这里可以知道,我们不能同时减小第一类错误和第二类错误,不可兼得。
链接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取码: 333c 复制这段内容后打开百度网盘手机App,操作更方便哦