1、收集2012-2018年郑州市和新乡市的高中毕业生人数和本科生毕业人数,制作表格。
新乡市数据:
郑州市数据:
1、2分别完成新乡市、郑州市2012-2018年度研究生、本科生、高中毕业生信息的箱线图;确认有无异常数据;
library(‘xlsx’)
file<-“D:/zuoye-r/3大作业/新乡市.xlsx”
file2<-“D:/zuoye-r/3大作业/郑州市.xlsx”
excel1<-read.xlsx(file,1,encoding = ‘UTF-8’)
excel2<-read.xlsx(file2,1,encoding = ‘UTF-8’)
boxplot(excel1,main=‘新乡市2012-2018年度本科生、高中毕业生信息’)
boxplot(excel2,main=‘郑州市2012-2018年度本科生、高中毕业生信息’)
#年份
a<-excel1[,1]
#-------------------数据分析(回归分析)----------------------
#新乡市
#高中信息(新乡市高中人数关于年份的回归)
x<-excel1[,2]
#系数和截距
lm(x~a+1)
#得更多信息
summary(lm(x~a+1))
#预测
point<-data.frame(a=2019)
predict(lm(x~a+1),point,interval = “prediction”,level = 0.95)
point<-data.frame(a=2020)
predict(lm(x~a+1),point,interval = “prediction”,level = 0.95)
#本科信息
y<-excel1[,3]
lm(y~a+1)
summary(lm(y~a+1))
point<-data.frame(a=2019)
predict(lm(y~a+1),point,interval = “prediction”,level = 0.95)
point<-data.frame(a=2020)
predict(lm(y~a+1),point,interval = “prediction”,level = 0.95)
#郑州市
#高中信息
c<-excel2[,2]
lm(c~a+1)
summary(lm(c~a+1))
point<-data.frame(a=2019)
predict(lm(c~a+1),point,interval = “prediction”,level = 0.95)
point<-data.frame(a=2020)
predict(lm(c~a+1),point,interval = “prediction”,level = 0.95)
#本科信息
d<-excel2[,3]
lm(d~a+1)
summary(lm(d~a+1))
point<-data.frame(a=2019)
predict(lm(d~a+1),point,interval = “prediction”,level = 0.95)
point<-data.frame(a=2020)
predict(lm(d~a+1),point,interval = “prediction”,level = 0.95)
#---------------------------画回归方程------------------------------
#新乡高中
fit<-lm(高中毕业人数~年份,data=excel1)
#绘制散点图
plot(excel1 年 份 , e x c e l 1 年份,excel1 年份,excel1高中毕业人数)
#添加回归线
abline(fit)
#新乡大学
fit2<-lm(本科毕业人数~年份,data=excel1)
plot(excel1 年 份 , e x c e l 1 年份,excel1 年份,excel1本科毕业人数)
abline(fit2)
#郑州高中
fit3<-lm(高中毕业人数~年份,data=excel2)
plot(excel2 年 份 , e x c e l 2 年份,excel2 年份,excel2高中毕业人数)
abline(fit3)
#郑州大学a
fit4<-lm(本科毕业人数~年份,data=excel2)
plot(excel2 年 份 , e x c e l 2 年份,excel2 年份,excel2本科毕业人数)
abline(fit4)
#---------------------------新乡市数据图---------------------------------
#高中毕业生信息曲线
plot(excel1[,1],excel1[,2],type=“o”,xlab=“年份”,ylab="/人",ylim=c(20000,40000),col=“red”,main=“20191574321_李亚青_新乡市本科生、高中毕业生信息”,pch=c(15))
#添加本科毕业生信息曲线
lines(excel1[,1],excel1[,3],type=“o”,col=“blue”,pch=c(16))
#加图例
legend(“topleft”,c(“高中毕业生人数”,“本科毕业生人数”),col=c(“red”,“blue”),pch=15:17,cex=1)
#---------------------------郑州市数据图---------------------------------
plot(excel2[,1],excel2[,2],type=“o”,xlab=“年份”,ylab="/人",ylim=c(50000,200000),col=“red”,main=“XXXX”,pch=c(15))
lines(excel2[,1],excel2[,3],type=“o”,col=“blue”,pch=c(16))
legend(“topright”,c(“高中毕业生人数”,“本科毕业生人数”),col=c(“red”,“blue”),pch=15:17,cex=1)