8、用R语言进行回归分析

OLS模型:最小二乘法模型

8.1 回归的多面性

8.2 OLS回归

8.1简单线性回归

	#8.2.2简单线性回归
	dt<-women
	fit<-lm(weight~height,data=dt)#先y后x
	summary(fit)
	plot(dt$height,dt$weight)#先x后y
	abline(fit)#回归线

8.2多项式回归

	#8.2.3多项式回归
	##y可能不止和x相关呢?还可能和x^2相关呀
	fit2<-lm(weight~height+I(height^2),data=dt)
	#先y后x;I(height^2)之中的I()是为了防止出现将^识别错误
	summary(fit2)
	plot(dt$height,dt$weight)#先x后y
	lines(dt$height,fitted(fit2))#预测值:fitted(fit2)

8.3多元回归

	#8.2.4多元线性回归
	states<-as.data.frame(state.x77[,c('Murder','Population','Illiteracy','Income','Frost')])
	#计算相关系数
	cor(states)
	install.packages("car")
	library(car)
	scatterplotMatrix(states,spread=FALSE,smoother.args=list(lty=2))#回归前的参考
	fit3<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)
	warnings()
	summary(fit3)
	
	#8.2.5有交互项的多元线性回归
	fit4<-lm(mpg~hp+wt,data = mtcars)#无交互
	fit5<-lm(mpg~hp+wt+hp:wt,data = mtcars)#有交互
	summary(fit5)

8.3回归诊断

为了能够恰当地解释OLS模型的系数,数据必须满足以下的统计假设
(1)正态性:对于固定的自变量值,因变量值成正态分布
(2)独立性:Yi值之间相互独立
(3)线性:因变量和自变量之间为线性相关
(4)同方差性:因变量的方差不随自变量的水平不同而变化。也可称作不变方差

8.4 异常观测值

	dt<-women
	fit<-lm(weight~height,data=dt)
	summary(fit)
	par(mfrow=c(2,2))#生成评价拟合模型的四张图片
	plot(fit)

加入二次型之后,明显发现线性拟合更好

	fit2<-lm(weight~height+I(height^2),data=dt)
	#先y后x;I(height^2)之中的I()是为了防止出现将^识别错误
	summary(fit2)
	plot(fit2)

8.5改进措施

你可能感兴趣的:(r语言,r语言,回归,机器学习)