多元线性回归

案例研究犯罪率和其他因素的关系,包括人口,文盲率,平均收入,结霜天数。

第一步:检测变量间的相关性

多元线性回归_第1张图片
多元线性回归_第2张图片

谋杀是双峰的曲线,每个预测值在一定程度上都出现了偏斜。

谋杀率随着人口和文盲的增加而增加,随着收入和结霜天数的增加而下降。

同时越冷的州府文盲率月底,收入水平越高。

cor()#提供了两个变量之前的相关系数#

car包中scatterplotMatrix()函数则会生成散点图矩阵

第二步,使用lm函数拟合多元线性回归模型

多元线性回归_第3张图片

文盲率回归系数:4.14,表示控制人口,收入,温暖不变时,文盲率上升1%,谋杀率上升4.14%。

总体来看,所有预测变量解释了各周谋杀率57%的方差。

以上是多元性回归实战~可关注公众号“三只数据产品汪1”查看系列文章。

你可能感兴趣的:(多元线性回归)