假设检验

要理解假设检验,就要从概率分布图讲起。如下概率分布图:
假设检验_第1张图片
这个图如何理解呢?

它的横轴是样本的取值,它的纵轴是相应取值出现的概率。

比如最简单的:扔骰子,它的概率分布图就是6个高度一样的点,因为1点到6点它们出现的概率都一样,都是16.7%(100%/6)。

假设检验_第2张图片

一般假设检验采用“置信区间法”或者“检验统计量”去检验。

1)采用“置信区间”:其实上面的例子就使用的“置信区间”进行检验。但在实际使用中,会先确定一个小概率事件的概率范围。比如,上面例子中,我把“小概率”定义为1%;我也可以把“小概率”定义为2%、 5%、10%。那相应也就越来越容易拒绝原假设了:

假设检验的逻辑是是什么?

如果“小概率”是1%,那么落在红色的区域拒绝,拒绝难度比较大。

假设检验的逻辑是是什么?

如果“小概率”是5%,那么红色的区域变大了,落在红色区域的可能性也变大了,更容易拒绝原假设了。

这个人为定的“小概率”,我们给起了一个名字叫做“显著性水平”。而红色区域有个名字,叫做“拒绝域”。

“拒绝域”没有覆盖到的区域,叫做“置信区间”,它其实是抛去“拒绝域”概率所剩的概率,如果“拒绝域”的概率是5%,那么“置信区间”的概率就是95%(如上图红色区域和白色区域)。可以简单理解为95%的情况下,我都相信原假设成立(所以95%是“置信”区间),一旦出现那5%的小概率事件,我就认为原假设不成立。

2)采用“检验统计量”:

检验统计量(又叫:标准化统计量)的公式为:
假设检验_第3张图片
“点估计量”就是这个人再一次投出的环数,“假设值”就是我们从样本算出的环数均值 ,因为目前我们不能确定由样本算出的均值就是 ,所以它就是一个“假设值”(就是原假设 的假设值嘛 )。下面的“点估计量的抽样标准差”就是从样本算出的标准差 。

公式变形一下:
在这里插入图片描述
这个公式等号右边在这里插入图片描述
超级像,所以其实“检验统计量”就是一个倍数,这个倍数乘以标准差 再加均值 ,就是我投出的环数。

而采用 “检验统计量”去判断这一次投出的环数是否是小概率事件,实际上就是拿这个“检验统计量”与1.96、2.58去比较。

如果“检验统计量”大于1.96,那我这次投出的环数就落在下面图中的红色区域:
假设检验_第4张图片
如果“检验统计量”大于2.58,那我这次投出的环数就落在下面图中更小的红色区域:假设检验_第5张图片

所以,其实采用“标准量”与采用“置信区间”是类似的原理,只不过观察的对象变化了。采用“置信区间”是观察我这次投出的环数,落在了概率图的哪个位置。采用“标准量”则是观察我投出的环数是偏离均值几倍的标准差,再拿这个倍数与1.96、2.58去比较。但其实最终原理都是一样的,都是判断是否存在小概率事件的过程。

假设检验总结:
1、不轻易拒绝原假设。原假设即使真的成立,而观察的样本由于数量较少,观察值存在一定的波动。所以我们要给原假设一定范围的容忍度,这个容忍度要尽可能大,观察值出现在这个范围内都是可以容忍的。
2、小概率事件发生不正常。如果小概率事件还是发生了,那么就说明原假设有问题。

结合这两点,我们设置一个随机变量的区域,这个区域是偏离原假设的,并且发生在这个区域的概率很小,如果实际观察到的值还是出现在这个不太可能出现的范围内,那么我们可以拒绝原假设。
参考 :
知乎https://www.zhihu.com/question/20254932

你可能感兴趣的:(假设检验)