1.直接输入
> x<-c(61.4,48.3,51.8,35.9,17.0,55.0,32.7,17.0,27.3,21.5,35.5,30.0,13.8)
> y<-c(26.13,23.49,2.97,7.18,6.80,18.43,11.69,7.99,12.15,6.80,17.20,9.50,5.52)
2.引入文件
> data1<-read.csv("dataset01.csv",as.is = TRUE)
> data1
年木材剩余物 年木材采伐量
1 26.13 61.4
2 23.49 48.3
3 2.97 51.8
4 7.18 35.9
5 6.80 17.0
6 18.43 55.0
7 11.69 32.7
8 7.99 17.0
9 12.15 27.3
10 6.80 21.5
11 17.20 35.5
12 9.50 30.0
13 5.52 13.8
但是这里要注意修改工作区域,我一开始直接从上面的工具栏修改区域,但是没有成功不知道为什么,然后就搜了一下,用下面两行代码就可以解决了
> getwd()%这个可以查看默认的工作目录
> setwd("C:\\Users\\你猜\\Desktop")%这个是将当前的工作目录改到我的桌面,因为的我都数据表在桌面上,当然也可以把数据放到刚才查看的工作目录去
我们需要把上面引入的数据用x,y来代替,比如年木材剩余物->y,年木材采伐量->x
> colnames(data1)<-c("y","x")
> data1
y x
1 26.13 61.4
2 23.49 48.3
3 2.97 51.8
4 7.18 35.9
5 6.80 17.0
6 18.43 55.0
7 11.69 32.7
8 7.99 17.0
9 12.15 27.3
10 6.80 21.5
11 17.20 35.5
12 9.50 30.0
13 5.52 13.8
> plot(x,y)
> res<-lm(y~x)
> summary(res)
回归系数 | 点估计 |
---|---|
截距 | 1.5530 |
斜率 | 0.3034 |
回归方程为:Y=1.5530+0.3034x
检验统计量F=8.344,检验的p值=0.01474<0.05,说明y与x有显著性的线性关系
> dat<-data.frame(x=38)
> pred<-predict(res,dat)
> pred
1
13.08055
> predc<-predict(res,dat,interval="c",level=0.95)
> predc
fit lwr upr
1 13.08055 9.516714 16.64438
> predp<-predict(res,dat,interval="prediction",level=0.95)
> predp
fit lwr upr
1 13.08055 0.08782698 26.07327
当年木材采伐量为38万时,年木材剩余物的为13.08055,此时95%的置信区间为[9.516714,16.64438],预测区间为[0.08782698,26.07327]