007第三十六篇:IF因果关系,THEN谁重要?——小试多元回归 统计学(13)

007第三十六篇:IF因果关系,THEN谁重要?——小试多元回归 统计学(13)_第1张图片

“菩萨畏因、凡人畏果”,因果律深入人心。也就是说,现在我们的处境,其实是以前种下种子,生长成的结果。再换个说法,那么同样结果呈现一定有原因。

把自己当作“菩萨”深入想想,原因是什么,不是一下就能说明白的,要分解成好多小问题才能清晰解答。1、造成结果,原因是一个还是多个?2、如果有多个,它们之间是否也同样互相影响?3、多个原因分别对结果的影响程度大小是否有不同?4、对结果影响不同的原因我们关注那几个重要的?

多元回归分析提供一种方式,能够让人们比较清楚的步步为营、探查究竟。我们带着满脑袋的问题进入游戏,攻破关卡、逐一解决,最后结论会显现。

第一步:整理思维 世界是复杂多变的,如果有因果,绝不可能只有一个。建立一个接贴近事实,又足够简化便于利用方法,需要浪费些脑细胞。

那盖房子做个比喻吧。单因素回归分析是制作一块砖头(原因,即自变项);多元回归分析就是把两块、三块砖头堆砌起来。除了制作砖头,还要建立砖头之间的联系,最后才能得到“大屋子”(分析结果)。


第二步:分析过程

1、知道有很多原因(自变项)不停同时变化,影响着我们关注结果(因变项)。为了便于分析假设:一个瞬间,只有一个自变项在变化,其他自变项都没变。我们看看它到底有多大效果。—双变项回归分析前几篇文章统计学9、10、11、12已经详细叙述了。现在看看如何控制其他变项不变时,自变项与因变项的变化。

例子:薪资(因变项)与教育程度、是否经理、种族分析(自变项)。

种族与薪资,其他不变。具体见下图。


控制其他变量


2、全面找寻影响因素是收集材料的目的,自变项缺失就会导致无法控制,大大影响结果。


3、多个自变项选取的角度有可能完全相同、部分相同、完全不同。它们之间互相影响,效果叠加在一起,需要分离。那么按影响程度划分,原因有大小之分、我们仍然不能确定谁是“主犯”、谁是“从犯”。应该特别关注谁、注意谁、忽略谁。衡量指标是“净回归系数”


007第三十六篇:IF因果关系,THEN谁重要?——小试多元回归 统计学(13)_第2张图片


007第三十六篇:IF因果关系,THEN谁重要?——小试多元回归 统计学(13)_第3张图片

第三步:分析过程中的注意事项

1、特别关注的因素(变项)作为预测变项。比如:种族作为预测变项,而薪资作为因变项。

2、高度相关几个自变项,之间出现共线(相似),结果会出现,自变项与因变项无关的结果。比如:教育程度(年数)与上学的年数两个自变项,对于薪资的影响。这两个自变项基本是一回事,在净回归系数图中显示的F值很大,则D、G值几乎为零,结果自然显示为“无关”。

3、回归系数R,在二元回归中有正负之分,即正、负相关;而在多元回归中,多因素影响的结果,没有正负之分。

4、判定系数R2趋近于1时,模型设计贴近现实。比如:平均值像马褂一样展现体型;二元回归分析像西装一样展现体型;多元回归分析像内衣一样展现体型。后者比前者更贴近现实。

总结:


007第三十六篇:IF因果关系,THEN谁重要?——小试多元回归 统计学(13)_第4张图片




你可能感兴趣的:(007第三十六篇:IF因果关系,THEN谁重要?——小试多元回归 统计学(13))