贾俊平-第八章:假设检验

参数估计与假设检验的区别:
参数估计与假设检验是统计推断的两个组成部分,都是利用样本信息对总体进行推断,但角度不同。
参数估计是样本统计量估计总体参数的方法,总体参数载估计前是未知的;假设检验是先对总体参数提出一个假设,后用样本信息去验证这个假设是否正确。

学习目标:

  1. 假设检验的基本思想和原理
  2. 假设检验的步骤
  3. 一个总体参数的检验
  4. 两个总体参数的检验
  5. P值的计算与应用
  6. 用Excel进行检验

8.1 假设检验的基本问题
8.1.1 假设问题的提出
什么是假设:
对总体参数的具体数值所作的陈述
· 总体参数包括总体均值/比例/方差等
· 分析之前必需陈述
什么是假设检验:
1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程
2.有参数检验和非参数检验
3.逻辑上运用反证法,统计上依据小概率原理
假设的基本思想

8.1.2 假设的表达式
原假设:
1.研究者想收集证据予以反对的假设
2.又称“0假设”
3.总是有符号=,≤或≥
4.表示为H0
· H0 :μ=某一数值
· 指定为符号=,≤或≥
· 例如,H0 :μ=10cm
备择假设:
1.研究者想收集证据予以支持的假设
2.也称“研究假设”
3.总是有符号≠,<或>
4.表示为H1 :
H1 :μ<某一数值,或μ>某一数值
例如,H1 :μ < 10cm,或μ > 10cm

提出假设——结论与建议
1.原假设和备择假设是一个完备事件组,相互对立
- 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立
2.先确定备择假设,再确定原假设
3.等号“=”总是放在原假设上
4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)

双侧检验与单侧检验
1.备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)
2.备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)
· 备择假设的方向为“<”,称为左侧检验
· 备择假设的方向为“>”,称为右侧检验

8.1.3 两类错误
1.第Ⅰ类错误(弃真错误)
· 原假设为真时拒绝原假设
· 第Ⅰ类错误的概率记为α,α被称为显著性水平

2.第Ⅱ类错误(取伪错误)
· 原假设为假时未拒绝原假设
· 第Ⅱ类错误的概率记为β

注:第一类/第二类错误在样本容量确定的情况下是此消彼长的,但α+β不一定等于1

显著性水平α
1.是一个概率值
2.原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝域
3.表示为α,常用的值有0.01,0.05,0.10
4.有研究者事先确定

影响β错误的因素
1.总体参数的真值,随着假设的总体参数的减少而增大
2.显著性水平α,当α减少时增大
3.总体标准差σ,当σ增大时增大
4.样本容量n,当n减少时增大

8.1.4 假设检验的流程
假设检验中的小概率原理
什么是小概率:
1.在一次试验中,一个几乎不可能发生的事件发生的概率
2.在一次实验中小概率事件一旦发生,就有理由拒绝原假设
3.小概率由研究者事先确定

检验统计量:
1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量
2.对样本估计量的标准化结果
· 建立在原假设H0 为真的基础上,用点估计查看抽样分布
3.标准化的检验统计量 = (点估计量-假设值)/点估计量的抽样标准差

决策规则
1.给定显著性水平α,查表得出相应的临界值Zα 或Zα/2 ,tα 或tα/2
2.将检验统计量的值与显著性水平的临界值进行比较
3.做出决策
· 双侧检验:|统计量| > 临界值,拒绝H0
· 左侧检验:统计量 < -临界值,拒绝H0
· 右侧检验:统计量 > 临界值,拒绝H0

8.1.5 利用P值进行决策
什么是P值(事后概率)
1.在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率;双侧检验为分布中两侧面积的总和;P值越小,越有可能拒绝原假设。
2.反映实际观测到的数据与原假设H0 之间不一致的程度
3.被称为观察到的(或实测的)显著性水平
4.决策规则:若p值<α,拒绝H0

假设检验的结论表述
1.假设检验的目的就在于试图找到拒绝原假设,而不在于证明什么是正确的
2.拒绝原假设时结论是清楚的
例如:H0 :μ=10,拒绝H0 时,可以说μ≠10
3.当不拒绝原假设时
· 并未给出明确的结论
· 不能说原假设是正确的,也不能说它不是正确的
· 例如,当不拒绝H0 :μ=10,并未说它就是10,但也未说它不是10,只能说样本提供的证据还不足以推翻原假设。

假设检验步骤的总结
1.陈述原假设和备择假设
2.从所研究的总体中抽出一个随机样本
3.确定一个适当的检验统计量,并利用数据算出其具体数值
4.确定一个适当的显著性水平,并计算出临界值,指定拒绝域
5.将统计量的值与临界值进行比较,做出决定
· 统计量的值落在拒绝域,拒绝H0 ,不拒绝H0
· 也可以直接利用P值做出判断

8.2 一个总体参数的检验
8.2.1 检验统计量的确定

大样本,用正态分布构造统计量;小样本,用t分布。

8.2.2 总体均值的检验
总体均值的检验——大样本
1.假定条件
不管总体的分布是否为正态分布,当正态总体或非正态总体大样本(n≥30),所抽取的样本都可以用正态统计量构造。
2.使用z检验统计量
σ2 已知:
σ2 未知:

总体均值的检验——小样本
1.假定条件

  • 总体服从正态分布
  • 小样本(n<30)
    2.检验统计量
    σ2 已知:
    σ2 未知:

8.2.3 总体比例的检验
假定条件:总体服从二项分布,可用正态分布来近似(大样本)
检验的z统计量:
π0 为假设的总体比例

8.2.4 总体方差的检验
检验一个总体的方差或标准差,假设总体近似服从正态分布,使用x2 检验统计量

8.3 两个总体参数的检验
8.3.1 两个统计量的确定

8.3.2 两个总体均值之差的检验
对于独立大样本:
1.假定条件
· 两个样本是独立的随机样本
· 正态总体或非正态总体大样本(n1 ≥30和n2 ≥30)检验统计量
已知:
未知:

对于独立小样本
1.假定条件1: 已知
· 两个独立的小样本
· 两个总体都是正态分布
· 已知
检验统计量

2.假定条件2: 未知但
· 两个独立的小样本
· 两个总体都是正态分布
· 未知但
检验统计量

其中:
自由度:n1 + n2 -2

3.假定条件3: 未知但
· 两个总体都是正态分布
· 未知且不相等,即
· 样本容量相等,即n1 = n2 = n
检验统计量:

自由度:n1 + n2 -2 = 2(n-1)
4.假定条件4: 未知且
· 两个总体都是正态分布
· 未知且不相等,即
· 样本容量不相等,即n1 ≠ n2
检验统计量

自由度:

对于匹配样本
假定条件:
两个总体配对差值构成的总体服从正态分布;
配对差是由差值总体中随机抽取的;
数据配对或匹配(重复测量(前/后))
检验统计量

样本差值均值:
样本差值标准差:

8.3.3 两个总体比例之差的检验
假定条件:
两个总体都服从二项分布
可以用正态分布来近似
检验统计量:
检验H0 :π1 - π2 = 0

其中,
检验H0 :π1 - π2 = d0

8.3.4 两个总体方差之比的检验
F检验
假定条件:两个总体都服从正态分布,且方差相等;两个独立的随机样本

你可能感兴趣的:(贾俊平-第八章:假设检验)