R01:一元线性回归

data(snake); //引入数据集

dim(snake);//查看数据集的维度

str(snake);//查看数据集详情,head,tail,mean,max,min...

names(snake) <- c("content","yield");//为数据集的每列设置别名

attach(snake);//执行后可直接使用数据集别名

cor(snake);//查看数据集每列的相关性系数

cov(snake);//查看数据集每列的协方差

plot(snake);//查看数据分布情况

yield.fit <- lm(yield~content);//执行一元线性回归

yield.fit;//查看线性回归结果

plot(yield.fit);//查看线性回归结果

summary(yield.fit);//查看线性回归汇总


R01:一元线性回归_第1张图片
cor


R01:一元线性回归_第2张图片
rplot




R01:一元线性回归_第3张图片
yield

上图中,Intercept指截距,content指系数,即模型结果是yield=0.4981*content+0.7254


R01:一元线性回归_第4张图片
summary

上面是线性回归模型的汇总结果,重点关注划线的几个地方,解释如下:

1.Residuals是指模型残差,原则上应该符合正态分布,1Q应该与3Q差不多

2.Pr(>|t|用于描述系数显著性,越小越好,一般应小于0.05,约小说明模型系数越有效

3.Adjusted R-squared:说明模型拟合程度,越大说明拟合的越好,原则上应大于0.80

4.F统计的p-value也是描述模型显著性,越小越好,应低于0.05


同时满足上面几个条件可以说明,这个结论是可以接受的。

你可能感兴趣的:(R01:一元线性回归)