007第三十四篇:教育与收入有关吗?—回归系数的显著度检验 统计学(11)

概念:

显著度检验(significance test)

弄清楚“显著”本质:其实显著度应该是 level of significance(显著程度、显著水平),显著顾名思义就是突出、引人注目的。“显著”会错误引导很多人。统计学中significance(意思、意味、意义)。significance test应为“检验是否有意义”,会让人了解更加清楚。

举个例子:

教育程度与年薪回归系数显著吗?意思是:读书有用吗?

回归系数不显著=读书没用也没害;

回归系数是正值,而且显著=读书有用的;

回归系数是负值,而且显著=读书有害。

如何验证显著度?

我们用的“概率思维”来考虑证明途径。

正向证明不容易李连江老师归结证明方式为:第一步欲擒故纵;第二步诱敌深入;第三步反戈一击。

1、提出假设

年薪是我们关心的事情,差别不但影响我们的收入,还重重的打击着我们的自尊心。“为什么呢?”一个因素引入眼帘“教育程度”即可量化为“受教育年数”,到底有没有关系(无关、相关、因果)不知道。建立假设:年薪差别与教育程度有关(H1)。

2、设立零假设:欲擒故纵

零假设就是上面假设的否命题:假设年薪与教育程度没有系统的、显著的关系(H0)。本来应该证明H1的但我们暂且放下,去看看H0目的是有没有足够信心放弃它。

3、姑且假定零假设是真的:诱敌深入

零假设为真时,意味着样本中教育程度与年薪的回归系数为0。但是抽样中观察的回归系数为3909(见前面的文章),意思是教育程度多一年,年薪可能增加3909元。当然错误有可能在抽样上,总样本参数还是为0的。那么我们看到标准误204。t值就是3909/204=19。这样表明如果零假设成立,我们这次的抽样得到3909这种结果的样本概率是小的没边际的。(t=3:偏离3个标准误概率已经是千分之一了)。

4、预测与现实:反戈一击

发生以上抽样状况的概率是千分之一,很大程度上零假设已经收到了极大质疑。我们时候该放弃零假设呢?

5、权衡放弃的风险:无法两全

教育程度与年薪无关的概率是0.001;那么教育程度与年薪有关的概率就急速增加。一般情况下P(t值发生的概率)小于5%的情况,我们就放弃零假设,接受原有假设了。

6、良心决断:明于取舍

为什么我们没说:教育程度与年薪无关的概率是0.001,推导出教育程度与年薪有关的概率0.999呢,其实两者只能说是负相关。命题与否命题之间不是零和博弈。有可能有我们想不到的第三种情况(比如曲线相关)。大概率取舍就可以了,不能落入二元世界的悖论中。

你可能感兴趣的:(007第三十四篇:教育与收入有关吗?—回归系数的显著度检验 统计学(11))