浅谈共线性的产生以及解决方法(下篇——来世)

浅谈共线性的产生以及解决方法(下篇——来世)

上篇对共线性问题的诊断以及消除做了详尽的介绍,那么如何与实际场景结合呢?
(1)数据来源
该数据来源于《1994年统计摘要》1978-1993年的中国民航客运量统计数据。
(2)变量介绍
Y——民航客运量(万人)
X1——国民收入(亿元)
X2——消费额(亿元)
X3——铁路客运量(万人)
X4——民航线里程(万公里)
X5——来华旅游入境人数(万人)
对数据进行多元线性回归模型的拟合,看下效果
浅谈共线性的产生以及解决方法(下篇——来世)_第1张图片
我们可以根据方差膨胀因子判别多元线性模型是否存在共线性问题,上述的系数表中,有四个VIF大于10,故我们认为该模型中存在多重共线性。
下面我们利用R对民航数据进行建模

###建立多重线性模型
minhang<-read.table(

你可能感兴趣的:(数据分析,共线性,大数据,机器学习)