在之前的基本统计图形中简单介绍过点图画法。本节主要以
plot()
函数为基础,就双/多变量间的关系,绘制散点图与折线图。
要点一、散点图
1、二元变量的简单散点图
attach(mtcars)
plot(wt, mpg,
main="Basic Scatterplot of MPG vs. Weight",
xlab="Car Weight (lbs/1000)",
ylab="Miles Per Gallon ", pch=19) #绘制实心点图
abline(lm(mpg ~ wt), col="red", lwd=2, lty=1) #添加最佳拟合的线性直线
lines(lowess(wt, mpg), col="blue", lwd=2, lty=2) #添加平滑曲线
#标注点信息
identify(wt, mpg, rownames(mtcars)) #交互式标注
text(wt, mpg, rownames(mtcars)) #批量标注
detach(mtcars)
lowess()
与loess()
均为平滑曲线拟合函数,后者为前者的升级版,使用方式有所不同。
标注点本质上可以理解为为文本字符串提供坐标信息。
值得注意的是plot()与lines() 函数工作原理不同。plot()函数会创建一幅新图;lines()或者abline()是在已存在的图形上添加图线信息。因此其一般是在plot()函数后使用。有一种情况是利用plot先创建坐标轴框架(见折线图),再用专门lines()函数添加曲线。
2、不同水平下二元变量间的点图
将上述点,依据另外一个分类因子,分成几类点,分别做图。
library(car)
scatterplot(mpg ~ wt | cyl, data=mtcars, lwd=2,
main="Scatter Plot of MPG vs. Weight by # Cylinders",
xlab="Weight of Car (lbs/1000)",
ylab="Miles Per Gallon",
boxplots="xy",
legend=list(coords="topright"))
identify(mtcars$wt, mtcars$mpg, row.names(mtcars), cex=.7, pos = 4)
#设置交互式给点标注标签,前两个为点的标签,第三个为标签向量。
- 原文提及的
id.method=
identify`交互式标记参数报错了,可能更新的缘故。(p239)
3、多变量间两两变量散点图矩阵
(1)pairs() 法
pairs(~ mpg + disp + drat + wt, data=mtcars,
main="Basic Scatterplot Matrix")
(2)car包法
library(car)
scatterplotMatrix(~ mpg + disp + wt, data=mtcars,
regLine=TRUE, #回归直线,默认为true
smooth=list(smoother=loessLine, spread=FALSE),
main="Scatter Plot Matrix via car Package")
- 相比第一种方法,scatterplotMatrix能够添加线性回归与平滑拟合曲线;对角线为核密度图。值得注意书中使用的car包已经更新,见
?scatterplotMatrix
参数变化了,要学会学习。
4、高密度散点图
- 当观测点很多,一般散点图数据点重叠严重时,则无法识别出高低密度区,可以采用以下方法。
set.seed(1234) #保证结果可重现性
n <- 10000
c1 <- matrix(rnorm(n, mean=0, sd=.5), ncol=2)
c2 <- matrix(rnorm(n, mean=3, sd=2), ncol=2)
mydata <- rbind(c1, c2) #创建两列数据,10000的观测
mydata <- as.data.frame(mydata)
names(mydata) <- c("x", "y")
plot(mydata$x,mydata$y,pch=19,main="Scatter Plot witn 10000 Observations")
- 从上图可以看出不能很好地反映数据分布
(1)smoothScatter()颜色密度法
with(mydata,
smoothScatter(x, y, main="Scatter Plot colored by Smoothed Densities"))
(2)hexbin()六边形封箱法
library(hexbin)
with(mydata, {
bin <- hexbin(x, y, xbins=50)
plot(bin, main="Hexagonal Binning with 10,000 Observations")
})
5、三维散点图
5.1 常规三维散点图
library(scatterplot3d)
attach(mtcars)
scatterplot3d(wt, disp, mpg,
main="Basic 3D Scatter Plot")
#个人觉得可读性比较差
- 进一步修饰,增强美观与可读性。
s3d <-scatterplot3d(wt, disp, mpg,
pch=16,
highlight.3d=TRUE, #突出了效果的三维散点图,增强纵深感
type="h", #直方式垂线,type类型参见后面的折线图介绍
main="3D Scatter Plot with Vertical Lines and Regression Plane")
fit <- lm(mpg ~ wt+disp) #拟合关系
s3d$plane3d(fit) #添加回归面
detach(mtcars)
5.2 交互式旋转三维散点图
- 三维交互界面操作一般为:按住右键平移调整大小;按住左键平移调整视图方向。
(1)rgl包法
library(rgl)
attach(mtcars)
plot3d(wt, disp, mpg, col="red", size=5)
detach(mtcars)
(2)car包法
library(car)
with(mtcars,
scatter3d(wt, disp, mpg))
5.3 气泡图(bubble plot)
- 先创建一个二维散点图,然后通过点的大小来展示第三个变量的值大小。
- 可以这样想:圆圈越大的点代表越高的直线,将其想象立体化。
attach(mtcars)
r <- sqrt(disp/pi) #设定圆圈半径
symbols(wt, mpg, circle=r, inches=0.30, #inches是比例因子,控制圆圈大小(默认最大圆圈为1英寸)
fg="white", bg="lightblue",
main="Bubble Plot with point size proportional to displacement",
ylab="Miles Per Gallon",
xlab="Weight of Car (lbs/1000)")
text(wt, mpg, rownames(mtcars), cex=0.6) #添加标签名称
detach(mtcars)
要点二、折线图
1、type参数设置
点图与折线图的区别,就是有无type
参数
- 通过设置参数
type=
,来绘制不同类型的折线图。
l
表示只有线;o
表示实心点和线;b
表示空心点连线(常用);h
表示直方图式的直线
type=n
表示不生成任何点与线(创建框架)。详见p251
2、举例点图与折线图的对比
opar <- par(no.readonly=TRUE)
par(mfrow=c(1,2)) #设两幅图做对比
t1 <- subset(Orange, Tree==1) #取数据
# Orange数据集包含了五种橘树的树龄与年轮数据
plot(t1$age, t1$circumference,
xlab="Age (days)",
ylab="Circumference (mm)",
main="Orange Tree 1 Growth")
#点图
plot(t1$age, t1$circumference,
xlab="Age (days)",
ylab="Circumference (mm)",
main="Orange Tree 1 Growth",
type="b") #与点图的唯一区别
#折线图
par(opar)
3、绘制多条折线图
- 下述的R语言绘图代码值得仔细品味学习
Orange$Tree <- as.numeric(Orange$Tree) #将因子转化为数值型
ntrees <- max(Orange$Tree) #取树的种类数5
xrange <- range(Orange$age) #取年龄的范围,作为x轴取值
yrange <- range(Orange$circumference) #取年轮的范围,作为y轴取值
plot(xrange, yrange, #x与y轴取值
type="n", #不生成任何点和线
xlab="Age (days)", #轴标签
ylab="Circumference (mm)" #轴标签
)
colors <- rainbow(ntrees) #为取5种颜色做准备
linetype <- c(1:ntrees) #为取5种线条类型做准备
plotchar <- seq(18, 18+ntrees, 1) #为取5种点符号类型做准备
for (i in 1:ntrees) { #注意学习循环语句格式
tree <- subset(Orange, Tree==i) #树的种类
lines(tree$age, tree$circumference, #点的取值
type="b", #空心点连线
lwd=2, #线宽
lty=linetype[i], #线的类型
col=colors[i], #颜色
pch=plotchar[i] #点符号
)
}
title("Tree Growth", "example of line plot") #主标题(上)、副标题(下)
legend(xrange[1], yrange[2], #图例位置
1:ntrees,
cex=0.8,
col=colors,
pch=plotchar,
lty=linetype,
title="Tree"
)
以上是进阶散点图与折线图的学习内容,此外教材本章还介绍了相关图与马赛克图的画法,就不再深入学习了,详见p253。
参考教材为《R语言实战(第2版)》