ggplot2 的学习与操作实践

1.上周知识点回顾

# 数据结构代码的简单使用

p <- qplot(displ, hwy, data = mpg, colour= factor(cyl))

summary(p) # 简单查看其结构

#保存图形对象

save(p,file = "plot.rdata")

## 读入图形对象

load("plot.rdata")

## 将图片另存为其他格式

ggsave("plot.png", width = 5, height = 5)

2. ggplot的绘图实践和回归拟合

1.ggplot绘图操练

install.packages("ABC",repos="http://mirror.bjtu.edu.cn/ ") # 包的安装,指定镜像文件

x=runif(100)  # 生成均匀分布随机数的函数

x=ts(x,start=1960+(3/12),frequency=12) #构造时间序列frequency=12即按个月份构造 options(digits=2) 

# 图层的概念和使用

p <- ggplot(diamonds, aes(carat, price, colour = cut))

d <- ggplot(diamonds,aes(carat)) + xlim(0,4)

d + stat_bin(aes(ymax = ..count..), binwidth=0.1,geom = "area")

d + stat_bin(aes(ymax = ..density..), binwidth=0.1,geom = "point",position = "identity")

d + stat_bin(aes(y = 1, fill= ..count..),binwidth=0.1, geom = "tile",position= "identity")

一次绘制多条曲线(参考:用 ggplot2 在同一个图上画多条颜色不同的线)

相关函数:  melt()    图层函数geom_line() 

library(ggplot2) #导入ggplot2 

library(reshape2) # 导入reshape2 用作数据的拆分合并(重塑)

dfidfm <- melt(data, id.vars="day")

 ggplot(df, aes(x=a, y=value)) + geom_line(aes(color=variable))

2.多元线性拟合lm

相对比于一元线性回归(y~x+b),多元线性回归是用来确定2/多个变量间关系的统计分析方法。多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数学模型,然后进行参数估计找出相对应的参数模型系数(权重值)。并需要对估计出来的参数进行显著性检验,残差分析,异常点检测,最后确定回归方程进行模型预测。模型拟合方法--最小二乘估计法

# 导入数据

bigo= read.csv("文件路径/文件名.csv")

head(bigo)  # 数据查看

# 进行数据拟合尝试

Lm_test = lm(RR~x1+x2+x3+x3+x4,data=bigo)

# 相关参数计算(三个平方和)

ssr = deviance(Lm_test) 

r2 = summary(Lm_test)$r.squared

sst=ssr/(1-r2)

sse=sst-ssr

# 数据参数系数的置信区间 

confint(Lm_test)

Lm_test  # 可以输入 模型名称直接显示模型的构型和具体结果(截距+ 参数权重)

# 残差检验绘图

par(mfrow=c(2,2))

plot(Lm_test)

# 模型预测

par(mfrow=c(1,1))  #设置画面布局

# 预测计算

dfp<-predict(lm_test,interval="prediction")

# 合并数据

mdf<-merge(bigo$RR,dfp)

你可能感兴趣的:(ggplot2 的学习与操作实践)