一元线性回归 R语言

一元线性回归 R语言

    • 导入数据
    • 修改变量名
    • 画散点图
    • 回归分析
    • 是否有显著性的线性关系检验
    • 给定一个变量求对应的值以及求预测区间

导入数据

1.直接输入

> x<-c(61.4,48.3,51.8,35.9,17.0,55.0,32.7,17.0,27.3,21.5,35.5,30.0,13.8)
> y<-c(26.13,23.49,2.97,7.18,6.80,18.43,11.69,7.99,12.15,6.80,17.20,9.50,5.52)

2.引入文件

> data1<-read.csv("dataset01.csv",as.is = TRUE)
> data1
   年木材剩余物 年木材采伐量
1         26.13         61.4
2         23.49         48.3
3          2.97         51.8
4          7.18         35.9
5          6.80         17.0
6         18.43         55.0
7         11.69         32.7
8          7.99         17.0
9         12.15         27.3
10         6.80         21.5
11        17.20         35.5
12         9.50         30.0
13         5.52         13.8

但是这里要注意修改工作区域,我一开始直接从上面的工具栏修改区域,但是没有成功不知道为什么,然后就搜了一下,用下面两行代码就可以解决了

 > getwd()%这个可以查看默认的工作目录
 > setwd("C:\\Users\\你猜\\Desktop")%这个是将当前的工作目录改到我的桌面,因为的我都数据表在桌面上,当然也可以把数据放到刚才查看的工作目录去

修改变量名

我们需要把上面引入的数据用x,y来代替,比如年木材剩余物->y,年木材采伐量->x

> colnames(data1)<-c("y","x")
> data1
       y    x
1  26.13 61.4
2  23.49 48.3
3   2.97 51.8
4   7.18 35.9
5   6.80 17.0
6  18.43 55.0
7  11.69 32.7
8   7.99 17.0
9  12.15 27.3
10  6.80 21.5
11 17.20 35.5
12  9.50 30.0
13  5.52 13.8

画散点图

> plot(x,y)

一元线性回归 R语言_第1张图片

回归分析

> res<-lm(y~x)
> summary(res)

一元线性回归 R语言_第2张图片

回归系数 点估计
截距 1.5530
斜率 0.3034

回归方程为:Y=1.5530+0.3034x

是否有显著性的线性关系检验

检验统计量F=8.344,检验的p值=0.01474<0.05,说明y与x有显著性的线性关系

给定一个变量求对应的值以及求预测区间

> dat<-data.frame(x=38)
> pred<-predict(res,dat)
> pred
       1 
13.08055 
> predc<-predict(res,dat,interval="c",level=0.95)
> predc
       fit      lwr      upr
1 13.08055 9.516714 16.64438
> predp<-predict(res,dat,interval="prediction",level=0.95)
> predp
       fit        lwr      upr
1 13.08055 0.08782698 26.07327

当年木材采伐量为38万时,年木材剩余物的为13.08055,此时95%的置信区间为[9.516714,16.64438],预测区间为[0.08782698,26.07327]

你可能感兴趣的:(R,r语言,线性回归,开发语言)