R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象

设定、映射、分组、匹配图形属性和图形对象

  • 设定和映射
  • 分组
    • 多个分组与单个图形属性
    • 不同图层上的不同分组
      • 给Oxboys数据添加光滑曲线(`smooth`)
    • 修改默认分组(`group`)
  • 匹配图形属性和图形对象
    • 用线性插值法做颜色渐变线条
    • fill构造叠加条形图

设定和映射

除了可以将一个图形属性映射到一个变量,你也可以在图层的参数里将其设定为一个单一值(例如,colour="red")。图形属性可以根据观测的不同而变化,但是参数则不行。下面的例子用图层里的colour参数设定了点的颜色:

p <- ggplot(mtcars, aes(mpg, wt))
p + geom_point(colour = "darkblue")

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第1张图片

注意这里将颜色映射到’darkblue’与上面将颜色设定给’darkblue’的区别

p + geom_point(aes(colour = "darkblue"))

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第2张图片

将颜色设定为'darkblue'(上)与将颜色映射到'darkblue'(下)的区别。

当颜色映射到'darkblue'时,'darkblue'将被看作一个普通的字符串,使用默认的颜色标度进行标度转换,结果得到了粉红色的点和图例。

分组

多个分组与单个图形属性

很多时候,我们都想将数据分成若干组,并用相同的方式对每个组进行渲染。当从总体上来查看数据时,我们通常希望区分每个个体而不是识别他们。这在含有多个个体的纵向数据中是很常见的,而这类图形也常被称为“细面图”。

下面的第一幅图是一个时间序列图,每条线代表一个男孩。通过这个图你可以看到每个男孩的成长轨迹,但是不能识别哪个男孩是哪条轨迹。生成这个图的代码是:

data(Oxboys, package = "nlme")

ggplot(Oxboys, aes(age, height, group = Subject)) + geom_line()
#或
qplot(age, height, data = Oxboys, group = Subject, geom = "line")

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第3张图片
正确分组时(分组变量group =Subject)每个个体的折线图(上)。错误的分组时连接所有观测点的折线图(下)。此处省略了分组图形属性,效果等同于group = 1

qplot(age, height, data = Oxboys, geom = "line")

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第4张图片

不同图层上的不同分组

给Oxboys数据添加光滑曲线(smooth)

上图用了和折线图同样的分组变量,得到了每个男孩的拟合直线。下图在平滑层里用了aes(group = 1),得到了所有男孩的拟合直线。

geom_smooth(aes(group = Subject), method = "lm", se = F)qplot(age, height, data = Oxboys, group = Subject, geom = "line") + geom_smooth(method = "lm", 
    se = F)

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第5张图片

p + geom_smooth(aes(group = 1), method = "lm", size = 2, se = F)qplot(age, height, data = Oxboys, group = Subject, geom = "line") + geom_smooth(aes(group = 1), method = "lm", size = 2, se = F)

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第6张图片

修改默认分组(group)

如果想用箱线图来查看每个时期的身高分布,默认的分组是正确的(上图)。

如果想用geom_line()添加每个男孩的轨迹,就需要在新图层里设定 aes(group = Subject)(下图)。

qplot(Occasion, height, data = Oxboys, geom = "boxplot")

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第7张图片

qplot(Occasion, height, data = Oxboys, geom = "boxplot") + 
    geom_line(aes(group = Subject), 
    colour = "#3366FF")

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第8张图片

boysbox <- ggplot(Oxboys, aes(Occasion, height)) + geom_boxplot()
boysbox + geom_line(aes(group = Subject), colour = "#3366FF")

匹配图形属性和图形对象

群组几何对象另一重要议题是,如何将个体的图形属性映射给整体的图形属性。对于个体几何对象而言这不是个问题,因为每一条观测都被一个单一的图形元素所表示。然而,高密度数据将会使得区别单个的点变得困难(或者不可能),这也意味着如果单个点几何对象变成一个群组几何对象,就变成了一大团点。

线条和路径遵循差一原则:观测点比线段数目多一,第一条线段将使用第一条观测的图形属性,第二条线段将使用第二条观测的图形属性,依次类推。这意味着最后一条观测的图形属性将不会被用到,如下图所示。路径和线条的另一个限制是每个个体的线条类型必须是一个常数,因为R不能绘制不同线条类型相连接的线条。

对于线条和路径,线段的图形属性是由起始点的图形属性决定的。

如果颜色是离散的(上图),在相邻的颜色间插入其他颜色是没有任何意义的。

如果颜色是连续的(下图),可以在相邻的颜色间进行插补,但默认条件下R不会这样做。

df <- data.frame(x = 1:3, y = 1:3, colour = c(1, 3, 5))
qplot(x, y, data = df, colour = factor(colour), size = I(5)) + geom_line(aes(group = 1), 
    size = 2)

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第9张图片

qplot(x, y, data = df, colour = colour, size = I(5)) + geom_line(size = 2)

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第10张图片

用线性插值法做颜色渐变线条

xgrid <- with(df, seq(min(x), max(x), length = 50))
interp <- data.frame(x = xgrid, y = approx(df$x, df$y, xout = xgrid)$y, colour = approx(df$x, df$colour, xout = xgrid)$y)
qplot(x, y, data = df, colour = colour, size = I(5)) + geom_line(data = interp, size = 2)

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第11张图片

fill构造叠加条形图

对于其他的群组几何对象,如多边形,只有当所有个体的图形属性都相同时,该图形属性才会被使用,否则将使用默认值。这适用于fill参数,因为它是整体对象的一个性质:考虑给多边形边界上的点填充不同的色没有任何意义。
当图形属性映射到连续型变量时,这类问题经常会被涉及。因为正如上所述,当映射对象是离散型的变量时,它将默认地把群组几何对象分解成更小的块。这对条形图和面积图的绘制非常有效,因为将每小块堆积起来就可得到和原来未分组前一样形状的图形,如下图所示。

一个条形图(上)按组分解后得到的叠加条形图(下),两者轮廓相同。

qplot(color, data = diamonds)
qplot(color, data = diamonds, fill = cut)

R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第12张图片
R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象_第13张图片

你可能感兴趣的:(R语言——ggplot2画图)