推论统计学 · 减熵增长(第1篇)

Summary

一个命题的判断往往不是是非题,真实世界中存在最多的是假设。统计学的假设检验在实际生产生活中有很大用处。

  • 假设检验流程
  • 基于Confidence Interval(CI)的假设检验
  • 决策错误

假设检验流程

首先,我们从现实情况中提炼出假设命题H0,下标0代表null;
然后,我们找到H0的替代命题HA,下标A代表alternative,也就是统计学中要检验的命题;
接着,使用统计学检验方法,在假设H0成立的前提下,检验统计学上的可能性;
最后,如果检验结果不能有效支持HA成立,那么我们坚持H0的原假设,反之。

作者语:这个思考逻辑不仅在应用统计学时有用,也应该应用在日常生活的决策上。因为人类思维的局限性,我们习惯了二元论的思考方式,非黑即白,非此即彼,但如果能稍微加上一点可能性,就有了黑白之间的灰色地带,而那使我们日常生活所在的地方。

基于Confidence Interval(CI)的假设检验

默认显著性水平为5%,在以H0为真的前提下,计算观察数据符合H0情况的概率。
具体计算过程是:Z值 =(观察数据的平均值-H0的整体平均值)/标准误差,这里的标准误差SE = 观察数据的标准偏差SD/ (样本数据量的0.5次幂)。根据Z值对应查表,得到概率p值。
如果p值低于5%,则H0为真的可能性过低,推翻原假设,证实HA为真;如果p值高于5%,则H0为真的可能性显著,支持原假设。

作者语:统计学让常人不舒服的点往往在于不能确定,换用统计学的话来说,使用牺牲precision的方式换得了accuracy。所以,我们判断一个假设真假的时候也不是绝对的判断,而是用一个显著性水平来衡量。

决策错误

考虑假设的情况和真实的情况,可能有四种情况:

决策 决策
保留H0 推翻H0
真相 H0为真 正确 Type I error
真相 H0为假 Type II error 正确

有两种逻辑上的决策错误,Type I是原假设为真却推翻了原假设,Type II是原假设为假却放过了原假设。
两种类型的错误此消彼长,都和显著性水平有关。我们默认显著性水平是5%,如果提高这个数值,我们更容易推翻原假设,这提高了Type I错误的概率,反之降低显著性水平会提高Type II错误的概率。

作者语:现实中往往是好事不能得兼的,两种错误在这里是此消彼长的,所以在具体问题中,如何平衡,选择合适的度是最难的事情。

你可能感兴趣的:(推论统计学 · 减熵增长(第1篇))