统计学--基于R(第3版)(基于R应用的统计学丛书)作者:贾俊平 习题答案 第九章

9.1

#9.1
load("C:/exercise/ch9/exercise9_1.RData")
exercise9_1
#(1)绘制散点图,判断人均GDP与居民消费水平之间的关系,并计算相关系数分析其关系强度
library(car)
scatterplot(人均GDP~居民消费水平,data=exercise9_1,pch=19,xlab="居民消费水平",ylab="人均GDP",cex.lab=0.8)#pch决定点的样式
#由散点图可看出二者大概具有正的线性相关关系
cor(exercise9_1[,2],exercise9_1[,3])#计算相关系数
cor.test(exercise9_1[,2],exercise9_1[,3])#检验相关系数
#正线性相关且线性关系很强
#(2)以居民消费水平为因变量、人均GDP为自变量建立回归模型,并对回归模型进行综合评估
#回归模型的拟合
model<-lm(居民消费水平~人均GDP,data=exercise9_1)
summary(model)
#计算回归系数的置信区间
confint(model,level=0.95)
#输出方差分析表
anova(model)
#绘制拟合图
attach(exercise9_1)
model<-lm(居民消费水平~人均GDP)
plot(居民消费水平~人均GDP)
text(居民消费水平~人均GDP,labels=地区,cex=0.6,adj=c(-0.6,0.25),col=4)
abline(model,col=2,lwd=2)
n=nrow(exercise9_1)
for(i in 1:n){segments(exercise9_1[i,3],exercise9_1[i,2],exercise9_1[i,3],model$fitted[i])}
mtext(expression(hat(y)==7.514e+02+3.194e-01%*%人均GDP),cex=0.7,side=1,line=-6,adj=0.75)
arrows(600,4900,550,5350,code=2,angle=15,length=0.08)

9.2

#9.2
load("C:/exercise/ch9/exercise9_2.RData")
exercise9_2
#(1)绘制产量与生产费用的散点图,判断二者之间的关系形态
library(car)
scatterplot(产量~生产费用,data=exercise9_2,pch=19,xlab="生产费用",ylab="产量",cex.lab=0.8)#pch决定点的样式
#正的线性相关关系
#(2)计算产量与生产费用之间的线性相关系数,对相关系数的显著性进行检验(α=0.05),并解释二者之间的关系强度
cor(exercise9_2[,2],exercise9_2[,3])#计算相关系数
cor.test(exercise9_2[,2],exercise9_2[,3])#检验相关系数
#cor=0.9202324,正线性相关,线性关系很强

9.3

#9.3
load("C:/exercise/ch9/exercise9_3.RData")
exercise9_3
#(1)用航班准点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义
#回归模型的拟合
model<-lm(投诉次数~航班准点率,data=exercise9_3)
summary(model)
#所以可得,hat(y)==430.1892+ -4.7006%*%航班准点率
#计算回归系数的置信区间
confint(model,level=0.95)
#输出方差分析表
anova(model)
#绘制拟合图
attach(exercise9_3)
model<-lm(投诉次数~航班准点率)
plot(投诉次数~航班准点率)
text(投诉次数~航班准点率,labels=航空公司编号,cex=0.6,adj=c(-0.6,0.25),col=4)
abline(model,col=2,lwd=2)
n=nrow(exercise9_3)
for(i in 1:n){segments(exercise9_3[i,3],exercise9_3[i,2],exercise9_3[i,3],model$fitted[i])}
mtext(expression(hat(y)==430.1892-4.7006%*%航班准点率),cex=0.7,side=1,line=-6,adj=0.75)
arrows(600,4900,550,5350,code=2,angle=15,length=0.08)
#(2)检验回归系数的显著性(α=0.05)
#计算回归系数的置信区间
confint(model,level=0.95)
cor.test(exercise9_3[,2],exercise9_3[,3])#检验相关系数
#p-value = 0.001108<0.05,拒绝H0,认为显著
#(3)如果航班准点率为80%,估计顾客的投诉次数
h<-430.1892-4.7006*80.0
h
# 54.1412,即约为54次

9.4

#9.4
load("C:/exercise/ch9/exercise9_4.RData")
exercise9_4
#用广告费支出作自变量x,销售额作因变量y建立回归模型,并对模型进行诊断和评价
#回归模型的拟合
model<-lm(销售额~广告费支出,data=exercise9_4)
summary(model)
#计算回归系数的置信区间
confint(model,level=0.95)
#输出方差分析表
anova(model)
#绘制拟合图
attach(exercise9_4)
model<-lm(销售额~广告费支出)
plot(销售额~广告费支出)
text(销售额~广告费支出,labels=超市,cex=0.6,adj=c(-0.6,0.25),col=4)
abline(model,col=2,lwd=2)
n=nrow(exercise9_4)
for(i in 1:n){segments(exercise9_4[i,3],exercise9_4[i,2],exercise9_4[i,3],model$fitted[i])}
mtext(expression(hat(y)==29.3991+1.5475%*%广告费支出),cex=0.7,side=1,line=-6,adj=0.75)
arrows(600,4900,550,5350,code=2,angle=15,length=0.08)
#诊断和评价
#计算残差和标准化残差
model<-lm(销售额~广告费支出,data=exercise9_4)
pre<-fitted(model)
res<-residuals(model)
zre<-model$residuals/(sqrt(deviance(model)/df.residual(model)))
data.frame(销售额=exercise9_4$销售额,点预测值=pre,残差=res,标准化残差=zre)
#绘制成分残差图
library(car)
crPlots(model)
#检验正态性
par(mfrow=c(2,2),cex=0.8,cex.main=0.7)
plot(model)
#Normal Q-Q图可见,在销售额与广告费支出的线性模型中,关于ε正态性的假定基本成立
#Residuals vs Fitted图可见,销售额与广告费支出的线性关系假定成立
#Scale-Location图,检验方差齐性
#方差齐性检验
ncvTest(model)
#绘制散布-水平图
spreadLevelPlot(model)
#检验独立性
#检验残差独立性
durbinWatsonTest(model)

你可能感兴趣的:(r语言,大数据)