多重共线性与虚拟变量

计量经济学的概念都很重要。

问题来源

多元回归分析有一个重要假设:解释变量之间无相关性,实际上相关性大量存在。

什么是多重共线性

直接解答:2个或2个以上变量存在相关性。

数学语言:存在

c1x1i+c2x2i++ckxki=0,i=1,2,n

即其中一个变量可以由其他的变量表示,这就说明这个变量是多余的;这就是多重共线性。

上式我们称之为完全共线性,如果有

c1x1i+c2x2i++ckxki+vi=0,i=1,2,n

多了一个常数,那么称之为近似共线性。

多重共线性的后果

根据高等代数的知识我们可以知道,在上述情况下,矩阵 X 是不满秩的,因此不存在 X1 ,导致最小二乘法不能估计参数。

同时也会导致方差增大,由于t检验需要用到方差:

t=β̂ D(β)

方差增大后,t检验的值会减小,因此模型显著性受到影响。

检验多重共线性

模型只有两个解释变量

x1,x2 的相关系数 r , |r|1 则存在强的多重共线性。

模型有多个解释变量

ls x1 c x2 x3 ...
ls x2 c x1 x3 ...
ls x3 c x1 x2 ...

即对每个变量进行一次回归分析,看拟合优度 R2 , 如果它十分接近1那可以确定此变量可以由其他变量来表示,它是多余的,模型存在多重共线性。

看统计检验

R2 大, F 大, t 小,经验上说明存在多重共线性。

虚拟变量

定性因素不能加减,就用0和1来表示;这就是虚拟变量,用 D 表示。

加法

如模型

yi=β0+β1xi+β2Di+μi

虚拟变量改变了模型的截距。

乘法

yi=β0+β1xi+β2Dix2+μi

你可能感兴趣的:(计量经济学,多重共线性,虚拟变量)