假设检验(一)

商务与经济统计

以《商务与经济统计》的课后习题为例进行讲解

假设检验主要是验证在假设成立的前提下,是否发生了几乎不可能发生的事件,显著性水平即区分可能发生的事件与几乎不可能发生的时间的界限(低于显著性水平的事件为几乎不可能发生的事件),若发生了几乎不可能发生的时间,则假设为假。
题目:
在美国,家庭每个月的互联网账单的均值为32.79美元(CNBC,2006年1月18日)。由南部一个州的50个家庭组成的样本显示,样本均值为30.63美元。取总体标准差为5.6美元。问:
a. 提出假设,用于确定样本数据是否支持作出结论:南部州的家庭每个月互联网账单的均值低于全美32.79美元的平均水平。
b. 检验统计量的值是多少?
c. p-值是多少?
d. 在α=0.01的显著性水平下,你的结论是什么?

一、为检验提出原假设和备择假设

根据题目,这是一个单侧检验的问题,因为假设检验中命题只能证伪,所以我们将要证明的命题的否命题设置为原假设。原假设为H0≥32.79,备择假设Hα<32.79。

二、计算统计量

这种统计数据符合正态分布,所以在总体标准差已知的情况下检验统计量为



经计算z=-2.727411870290969,z的概率分布为标准整体分布。

检验统计量的作用是判断样本均值是否偏离假定值足够远。

三、利用p-值判断能能否拒绝H0

目前样本均值小于设定值,判断总体均值是否小于设定值首先要判断样本均值是否小到足够拒绝H0,这里应该做一个下侧检验,p-值为产生当前样本均值或极端的样本均值的概率,在这个例子中p-值为标准正态曲线下在检验统计量的左边部分的面积。
查询标准正态分布表,可以查到z=-2.727左侧面积为0.0033(p-值),即得到小于30.63的均值的概率为0.0033。

也就是说,在H0成立(即南部州的网费不低于全美平均水平)的前提下,出现这个均值30.63、样本数量50的样本的概率为0.0033,低于α=0.01。说明在H0成立的条件下,这个样本是几乎不可能出现的(若p-高于α则认为是有可能发生的事件),所以可以以此为证据拒绝H0

四、使用置信区间检验对上述结果进行验算

显著水平为0.01,可以得到总体均值的99%置信区间为:


查表得到zα/2的值约为2.575,则置信区间为:
[28.591,32.669]
整个置信区间均小于全美均值32.79,所以拒绝H0

你可能感兴趣的:(假设检验(一))