1.上周知识点回顾
# 数据结构代码的简单使用
p <- qplot(displ, hwy, data = mpg, colour= factor(cyl))
summary(p) # 简单查看其结构
#保存图形对象
save(p,file = "plot.rdata")
## 读入图形对象
load("plot.rdata")
## 将图片另存为其他格式
ggsave("plot.png", width = 5, height = 5)
2. ggplot的绘图实践和回归拟合
1.ggplot绘图操练
install.packages("ABC",repos="http://mirror.bjtu.edu.cn/ ") # 包的安装,指定镜像文件
x=runif(100) # 生成均匀分布随机数的函数
x=ts(x,start=1960+(3/12),frequency=12) #构造时间序列frequency=12即按个月份构造 options(digits=2)
# 图层的概念和使用
p <- ggplot(diamonds, aes(carat, price, colour = cut))
d <- ggplot(diamonds,aes(carat)) + xlim(0,4)
d + stat_bin(aes(ymax = ..count..), binwidth=0.1,geom = "area")
d + stat_bin(aes(ymax = ..density..), binwidth=0.1,geom = "point",position = "identity")
d + stat_bin(aes(y = 1, fill= ..count..),binwidth=0.1, geom = "tile",position= "identity")
一次绘制多条曲线(参考:用 ggplot2 在同一个图上画多条颜色不同的线)
相关函数: melt() 图层函数geom_line()
library(ggplot2) #导入ggplot2
library(reshape2) # 导入reshape2 用作数据的拆分合并(重塑)
dfidfm <- melt(data, id.vars="day")
ggplot(df, aes(x=a, y=value)) + geom_line(aes(color=variable))
2.多元线性拟合lm
相对比于一元线性回归(y~x+b),多元线性回归是用来确定2/多个变量间关系的统计分析方法。多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数学模型,然后进行参数估计找出相对应的参数模型系数(权重值)。并需要对估计出来的参数进行显著性检验,残差分析,异常点检测,最后确定回归方程进行模型预测。模型拟合方法--最小二乘估计法
# 导入数据
bigo= read.csv("文件路径/文件名.csv")
head(bigo) # 数据查看
# 进行数据拟合尝试
Lm_test = lm(RR~x1+x2+x3+x3+x4,data=bigo)
# 相关参数计算(三个平方和)
ssr = deviance(Lm_test)
r2 = summary(Lm_test)$r.squared
sst=ssr/(1-r2)
sse=sst-ssr
# 数据参数系数的置信区间
confint(Lm_test)
Lm_test # 可以输入 模型名称直接显示模型的构型和具体结果(截距+ 参数权重)
# 残差检验绘图
par(mfrow=c(2,2))
plot(Lm_test)
# 模型预测
par(mfrow=c(1,1)) #设置画面布局
# 预测计算
dfp<-predict(lm_test,interval="prediction")
# 合并数据
mdf<-merge(bigo$RR,dfp)