概率论与数理统计 第八章 假设检验

课前导读

统计推断的另一类重要问题是假设检验问题。
参数估计的主要任务是找参数值等于多少,或在哪个范围内取值。而假设检验则主要是看参数的值是否等于某个特定的值
通常进行假设检验即选定一个假设,确定用以决策的拒绝域的形式,构造一个检验统计量,求出拒绝域或检验统计量的p值,查看结果是否落在拒绝域内或p值是否小于显著性水平,做出决策的一个过程。

第一节 检验的基本原理

举个例子,体现假设检验的思想:


假设检验的统计思想:类似"反证法",不妨先认为某一假设(记为 )是成立的,通过样本数据,结果得到一个与之相矛盾的结果,于是认为假设 (零假设)不成立,而接受与之对立的另外一个假设(对立假设,记为 )

一、建立假设

对要检验的问题提出一个原假设和备择假设。

二、给出拒绝域的形式

根据样本提供的信息,由样本给出未知参数的点估计量。比较的观测值与的距离。距离很近,则不拒绝原假设;如果距离远了,就拒绝原假设。
度量距离“远近”的方法:拒绝域
说明:拒绝域从备择假设开始


三、确定显著性水平

一个假设检验通过拒绝域的方式将样本数据进行了划分,通过这种划分做出一个决策:接受或拒绝。但这一决策是基于样本提供的不完全信息对未知的总体参数做出的判断。因此总会存在不正确决策的风险。
所以借助于样本来进行的假设检验可能有四种结果:(第一类错误:弃真、第二类错误:采伪)


一般来说,当第一类错误概率小时,第二类错误概率就显得大。


从上面两类错误的分析我们知道,在样本量一定的条件下,不可能同时控制一个检验的两类错误概率。所以,在此基础上,采用折中方案,仅限制犯第一类错误的概率不超过事先设定的值,再尽量减少犯第二类错误的概率。

称该拒绝域所代表的检验为显著性水平的检验,称为显著性水平。 最常用的选择是。

四、建立检验统计量,给出拒绝域

确定了显著性水平后,可以来确定拒绝域中的临界值c了。下面这个例子介绍具体步骤。

在这里,为了求出临界值c的值,构造了一个统计量,称符合这个要求的统计量为检验统计量。再本例中,检验统计量服从标准正态分布,故该检验又称为-检验(又可称为-检验)

综上所述,在给定显著性水平下,求拒绝域的一般步骤如下:

五、p值和p值检验法


p值检验法的原则是当p值小到一定程度时拒绝

通常约定: 称结果为显著, 称结果为高度显著。

第二节 正态总体参数的假设检验

一、单正态总体均值的假设检验

假定总体,考虑以下三种均值的检验问题:


由于正态分布中有两个参数 和 , 是否已知对检验有影响。因此分 已知和未知两种情况展开讨论。

1.方差\sigma^2已知时的均值检验



在上述过程中,检验的原假设与备择假设构成一个双侧检验问题,换成如下单侧(右侧)检验问题:



检验的讨论过程完全相似。



单正态总体方差的假设检验

考虑如下三种关于方差的检验问题:


实际情况中通常假定 是未知的, 的估计通常用样本方差 表示



综上所述,关于单正态总体方差的假设检验问题如下表所示:

三、两个正态总体均值差的假设检验

同单正态总体的假设检验一样,两个总体的未知参数的检验问题都有一对原假设和备择假设,同样也存在双侧和单侧假设检验。


同置信区间求解过程相似, 、 是否已知对 和 的检验是有影响的。

四、两个正态分布方差比的假设检验




综上所述,关于两个正态总体方差比的假设检验问题如下表所示:


第三节 拟合优度检验

第七章的参数固定是假定总体的分布类型是已知的,需要通过样本来估计刻画总体分布的一个或若干个参数。但是,在实际问题中,经常不知道总体服从什么分布,这时只能假定其为某种分布,那么就需要根据样本数据来检验假设是否合理,即检验假设的总体分布是否可以被接受。又称为 分布的拟合检验。常用的方法有拟合优度检验。



上面这个例子中,我们假定每一组的概率都是已知的i=1,2,...,k,但在实际问题中,有时还依赖于r个未知参数,而这r个未知参数需要利用样本来估计。
这时先用点估计法估计出这r个位置参数,然后再算出的估计值

拓展阅读

假设检验与区间估计的关系




你可能感兴趣的:(概率论与数理统计 第八章 假设检验)