R语言入门--第十节(点图与折线图)

在之前的基本统计图形中简单介绍过点图画法。本节主要以plot()函数为基础,就双/多变量间的关系,绘制散点图与折线图。

要点一、散点图

1、二元变量的简单散点图

attach(mtcars)                                                     
plot(wt, mpg, 
     main="Basic Scatterplot of MPG vs. Weight",       
     xlab="Car Weight (lbs/1000)", 
     ylab="Miles Per Gallon ", pch=19)     #绘制实心点图
abline(lm(mpg ~ wt), col="red", lwd=2, lty=1)  #添加最佳拟合的线性直线
lines(lowess(wt, mpg), col="blue", lwd=2, lty=2)  #添加平滑曲线

#标注点信息
identify(wt, mpg, rownames(mtcars))  #交互式标注
text(wt, mpg, rownames(mtcars))  #批量标注

detach(mtcars)

lowess()loess()均为平滑曲线拟合函数,后者为前者的升级版,使用方式有所不同。
标注点本质上可以理解为为文本字符串提供坐标信息。

简单散点图

值得注意的是plot()与lines() 函数工作原理不同。plot()函数会创建一幅新图;lines()或者abline()是在已存在的图形上添加图线信息。因此其一般是在plot()函数后使用。有一种情况是利用plot先创建坐标轴框架(见折线图),再用专门lines()函数添加曲线。

2、不同水平下二元变量间的点图

将上述点,依据另外一个分类因子,分成几类点,分别做图。

library(car) 
scatterplot(mpg ~ wt | cyl, data=mtcars, lwd=2,
            main="Scatter Plot of MPG vs. Weight by # Cylinders", 
            xlab="Weight of Car (lbs/1000)", 
            ylab="Miles Per Gallon",
            boxplots="xy",
            legend=list(coords="topright"))
identify(mtcars$wt, mtcars$mpg, row.names(mtcars), cex=.7, pos = 4)
#设置交互式给点标注标签,前两个为点的标签,第三个为标签向量。
  • 原文提及的id.method=identify`交互式标记参数报错了,可能更新的缘故。(p239)
    三水平散点图

3、多变量间两两变量散点图矩阵

(1)pairs() 法

pairs(~ mpg + disp + drat + wt, data=mtcars, 
      main="Basic Scatterplot Matrix") 
散点图矩阵1

(2)car包法

library(car)
scatterplotMatrix(~ mpg + disp + wt, data=mtcars,
                  regLine=TRUE,   #回归直线,默认为true
                  smooth=list(smoother=loessLine, spread=FALSE),
                  main="Scatter Plot Matrix via car Package")
  • 相比第一种方法,scatterplotMatrix能够添加线性回归与平滑拟合曲线;对角线为核密度图。值得注意书中使用的car包已经更新,见?scatterplotMatrix参数变化了,要学会学习。
    散点矩阵图2

4、高密度散点图

  • 当观测点很多,一般散点图数据点重叠严重时,则无法识别出高低密度区,可以采用以下方法。
set.seed(1234)  #保证结果可重现性
n <- 10000    
c1 <- matrix(rnorm(n, mean=0, sd=.5), ncol=2)
c2 <- matrix(rnorm(n, mean=3, sd=2), ncol=2)
mydata <- rbind(c1, c2)  #创建两列数据,10000的观测
mydata <- as.data.frame(mydata)
names(mydata) <- c("x", "y")
plot(mydata$x,mydata$y,pch=19,main="Scatter Plot witn 10000 Observations")
常规散点图
  • 从上图可以看出不能很好地反映数据分布

(1)smoothScatter()颜色密度法

with(mydata,
     smoothScatter(x, y, main="Scatter Plot colored by Smoothed Densities"))
颜色密度图

(2)hexbin()六边形封箱法

library(hexbin)  
with(mydata, {
  bin <- hexbin(x, y, xbins=50)
  plot(bin, main="Hexagonal Binning with 10,000 Observations")
}) 
六边形封箱图

5、三维散点图

5.1 常规三维散点图

library(scatterplot3d)
attach(mtcars)
scatterplot3d(wt, disp, mpg,
              main="Basic 3D Scatter Plot")
#个人觉得可读性比较差
常规三维散点图
  • 进一步修饰,增强美观与可读性。
s3d <-scatterplot3d(wt, disp, mpg,
                    pch=16,
                    highlight.3d=TRUE,     #突出了效果的三维散点图,增强纵深感
                    type="h",   #直方式垂线,type类型参见后面的折线图介绍
                    main="3D Scatter Plot with Vertical Lines and Regression Plane")
fit <- lm(mpg ~ wt+disp)    #拟合关系
s3d$plane3d(fit)    #添加回归面
detach(mtcars)
修饰

5.2 交互式旋转三维散点图

  • 三维交互界面操作一般为:按住右键平移调整大小;按住左键平移调整视图方向。
    (1)rgl包法
library(rgl)
attach(mtcars)
plot3d(wt, disp, mpg, col="red", size=5)
detach(mtcars)
rgl包法

(2)car包法

library(car)
with(mtcars,
     scatter3d(wt, disp, mpg))
car包法

5.3 气泡图(bubble plot)

  • 先创建一个二维散点图,然后通过点的大小来展示第三个变量的值大小。
  • 可以这样想:圆圈越大的点代表越高的直线,将其想象立体化。
attach(mtcars)
r <- sqrt(disp/pi)  #设定圆圈半径
symbols(wt, mpg, circle=r, inches=0.30,  #inches是比例因子,控制圆圈大小(默认最大圆圈为1英寸)
        fg="white", bg="lightblue",
        main="Bubble Plot with point size proportional to displacement",
        ylab="Miles Per Gallon",
        xlab="Weight of Car (lbs/1000)")
text(wt, mpg, rownames(mtcars), cex=0.6)  #添加标签名称
detach(mtcars)
气泡图

要点二、折线图

1、type参数设置
点图与折线图的区别,就是有无type参数

  • 通过设置参数type= ,来绘制不同类型的折线图。
    l 表示只有线;o 表示实心点和线;b 表示空心点连线(常用);h 表示直方图式的直线

type=n 表示不生成任何点与线(创建框架)。详见p251

2、举例点图与折线图的对比

opar <- par(no.readonly=TRUE)
par(mfrow=c(1,2))  #设两幅图做对比
t1 <- subset(Orange, Tree==1)   #取数据
# Orange数据集包含了五种橘树的树龄与年轮数据
plot(t1$age, t1$circumference,
     xlab="Age (days)",
     ylab="Circumference (mm)",
     main="Orange Tree 1 Growth")   
#点图
plot(t1$age, t1$circumference,
     xlab="Age (days)",
     ylab="Circumference (mm)",
     main="Orange Tree 1 Growth",
     type="b")   #与点图的唯一区别
#折线图
par(opar)
点图与折线图

3、绘制多条折线图

  • 下述的R语言绘图代码值得仔细品味学习
Orange$Tree <- as.numeric(Orange$Tree)  #将因子转化为数值型
ntrees <- max(Orange$Tree)    #取树的种类数5
xrange <- range(Orange$age)   #取年龄的范围,作为x轴取值
yrange <- range(Orange$circumference)  #取年轮的范围,作为y轴取值
plot(xrange, yrange,  #x与y轴取值
     type="n",    #不生成任何点和线
     xlab="Age (days)",     #轴标签
     ylab="Circumference (mm)"  #轴标签
)
colors <- rainbow(ntrees)   #为取5种颜色做准备
linetype <- c(1:ntrees)    #为取5种线条类型做准备
plotchar <- seq(18, 18+ntrees, 1)  #为取5种点符号类型做准备
for (i in 1:ntrees) {         #注意学习循环语句格式
  tree <- subset(Orange, Tree==i)     #树的种类
  lines(tree$age, tree$circumference,    #点的取值
        type="b",    #空心点连线
        lwd=2,    #线宽
        lty=linetype[i],   #线的类型 
        col=colors[i],  #颜色
        pch=plotchar[i]   #点符号
  )
}
title("Tree Growth", "example of line plot")   #主标题(上)、副标题(下)
legend(xrange[1], yrange[2],  #图例位置
       1:ntrees,
       cex=0.8,
       col=colors,
       pch=plotchar,
       lty=linetype,
       title="Tree"
)
五种橘树随时间推移的生长状况的折线图

以上是进阶散点图与折线图的学习内容,此外教材本章还介绍了相关图与马赛克图的画法,就不再深入学习了,详见p253。
参考教材为《R语言实战(第2版)》

你可能感兴趣的:(R语言入门--第十节(点图与折线图))