假设检验学习【合集】(一)

为什么要假设检验?

为了推断某些总体未知的特性,提出某些关于总体的假设。(条件:总体的分布未知或者只知其形式)并根据样本对所提出的假设作出是接受还是拒绝的决策。

假设检验学习【合集】(一)_第1张图片

经典例题【测量净重来检测机器知否有故障】
产品的净重是一个随机变量,它服从正态分布(只知总体的分布形式);当机器正常,产品均值为0.5kg,标准差为0.015kg。某日,我们想知道机器是否正常?随机抽取9个产品,净重分别为(0.497 0.506 0.518 0.524 0.498 0.511 0.520 .0515 0.512)kg
我们单纯的想法是计算一下这9个产品的均值和标准差是否符合(0.5kg 和 0.015kg)即可。
但是,由于抽样样本与总体之间是不同的,我们只能用样本来估计总体。由此,计算出来的均值与标准差肯定与(0.5kg 和 0.015kg)存在偏差,这种
偏差是否符合在我们的接受范围里,就要用到假设检验了。
 

一般标准差比较稳定,我们设\sigma =0.015,所以,正常产品的总体X\sim N(\mu,0.015^{^{2}})。由此我们对μ做出假设:

H_{0}:\mu =0.5 \; \; \; \; \; \; \; \; \; \; H_{1}:\mu\neq 0.5

这里,就用到了刚才的设想,因为样本的均值\bar{X}\mu无偏估计(这里不知道为什么是无偏估计的,蓝字解释),而且抽样样本的观察值\bar{x}在一定程度上反映了\mu的大小。当\mu =\mu _{0},即0.5时,有\frac{\left |\bar{X}-\mu _{0} \right |}{\sigma /\sqrt{n}}\sim N(0,1)(这个不理解的,需要用到中心极限定理来证明,这里就不啰嗦了),所以,计算一下抽样样本的均值\bar{x}和μ0之间的差距,\frac{\left |\bar{x}-\mu _{0} \right |}{\sigma /\sqrt{n}}大于一个值k就说明偏差很大,小于一个值k就说明偏差很小。(很高兴我们又回到偏差了)

假设检验学习【合集】(一)_第2张图片

【无偏性】某些样本的估计值有时候相对于真值来说偏大,有时候偏小,但是,多次“取平均”后,估计量对于被估计的真值就没有偏差,偏差为0,即E(\hat{\theta} )=\theta

在这种偏差过大的时候,我们的假设就是不成立的。(很好理解吧!)但是,我们是抽样,是抽样就有可能出错,也就是说,抽样的样本不能一定准确地代表总体,会出错,这个错的概率我们要控制,一般是控制本来总体为正常,但是抽样为不正常(即H0为真,却拒绝H0假设)的这种错误,把它的错误概率控制为\alpha。即:假设检验学习【合集】(一)_第3张图片,换句话说,我们容许存在偏差,但是要在我们容许的范围之内,也就是\alpha规定的概率。

因为\frac{\left |\bar{X}-\mu _{0} \right |}{\sigma /\sqrt{n}}\sim N(0,1),所以,

假设检验学习【合集】(一)_第4张图片

又因为,假设检验学习【合集】(一)_第5张图片,所以,k=Z_{\alpha /2} (这里就是简单的概率计算)

现在,模型搞完了,去计算抽样样本的z=\frac{\left |\bar{x}-\mu _{0} \right |}{\sigma /\sqrt{n}}k=Z_{\alpha /2}相比较,是否在接受范围里。从而得出最后的结论,是否接受H0假设。

本例中,我们设置\alpha=0.05,则k=Z_{\alpha /2}=1.96,计算\frac{\left |\bar{x}-\mu _{0} \right |}{\sigma /\sqrt{n}}=2.2>1.96。这偏差超出了我们所能容忍的范围,所以拒绝H0,结论:这批产品不正常,机器不正常。

假设检验学习【合集】(一)_第6张图片

假设检验的类别

 根据数据类型,分为样本与总体之间的假设检验,两个样本之间的假设检验,还有,三个即以上样本的假设检验。

根据已知条件,方差已知还是未知,还有是否是大样本还是小样本。是独立样本还是配对样本有不同的假设检验。

Z检验/U检验

假设总体服从正态分布,  \sigma ^{2}已知,关于μ的检验。现实问题中大多数问题的总体都是服从或者近似服从正态分布,通过抽样样本的观测值就可以与假设的均值的偏差了。
统计量 来确定拒绝域,是最常见的一种检验方式。也就是上面那个例子(双侧检验),也可以单侧检验。

假设检验学习【合集】(一)_第7张图片

未完待续
                 

你可能感兴趣的:(统计学,统计学,数学)