除了可以将一个图形属性映射到一个变量,你也可以在图层的参数里将其设定为一个单一值(例如,colour="red"
)。图形属性可以根据观测的不同而变化,但是参数则不行。下面的例子用图层里的colour
参数设定了点的颜色:
p <- ggplot(mtcars, aes(mpg, wt))
p + geom_point(colour = "darkblue")
注意这里将颜色映射到’darkblue’与上面将颜色设定给’darkblue’的区别
p + geom_point(aes(colour = "darkblue"))
将颜色设定为'darkblue'
(上)与将颜色映射到'darkblue'
(下)的区别。
当颜色映射到'darkblue'
时,'darkblue'
将被看作一个普通的字符串,使用默认的颜色标度进行标度转换,结果得到了粉红色的点和图例。
很多时候,我们都想将数据分成若干组,并用相同的方式对每个组进行渲染。当从总体上来查看数据时,我们通常希望区分每个个体而不是识别他们。这在含有多个个体的纵向数据中是很常见的,而这类图形也常被称为“细面图”。
下面的第一幅图是一个时间序列图,每条线代表一个男孩。通过这个图你可以看到每个男孩的成长轨迹,但是不能识别哪个男孩是哪条轨迹。生成这个图的代码是:
data(Oxboys, package = "nlme")
ggplot(Oxboys, aes(age, height, group = Subject)) + geom_line()
#或
qplot(age, height, data = Oxboys, group = Subject, geom = "line")
正确分组时(分组变量group =Subject
)每个个体的折线图(上)。错误的分组时连接所有观测点的折线图(下)。此处省略了分组图形属性,效果等同于group = 1
。
qplot(age, height, data = Oxboys, geom = "line")
smooth
)上图用了和折线图同样的分组变量,得到了每个男孩的拟合直线。下图在平滑层里用了aes(group = 1)
,得到了所有男孩的拟合直线。
geom_smooth(aes(group = Subject), method = "lm", se = F)
或
qplot(age, height, data = Oxboys, group = Subject, geom = "line") + geom_smooth(method = "lm",
se = F)
p + geom_smooth(aes(group = 1), method = "lm", size = 2, se = F)
或
qplot(age, height, data = Oxboys, group = Subject, geom = "line") + geom_smooth(aes(group = 1), method = "lm", size = 2, se = F)
group
)如果想用箱线图来查看每个时期的身高分布,默认的分组是正确的(上图)。
如果想用geom_line()
添加每个男孩的轨迹,就需要在新图层里设定 aes(group = Subject)
(下图)。
qplot(Occasion, height, data = Oxboys, geom = "boxplot")
qplot(Occasion, height, data = Oxboys, geom = "boxplot") +
geom_line(aes(group = Subject),
colour = "#3366FF")
boysbox <- ggplot(Oxboys, aes(Occasion, height)) + geom_boxplot()
boysbox + geom_line(aes(group = Subject), colour = "#3366FF")
群组几何对象另一重要议题是,如何将个体的图形属性映射给整体的图形属性。对于个体几何对象而言这不是个问题,因为每一条观测都被一个单一的图形元素所表示。然而,高密度数据将会使得区别单个的点变得困难(或者不可能),这也意味着如果单个点几何对象变成一个群组几何对象,就变成了一大团点。
线条和路径遵循差一原则:观测点比线段数目多一,第一条线段将使用第一条观测的图形属性,第二条线段将使用第二条观测的图形属性,依次类推。这意味着最后一条观测的图形属性将不会被用到,如下图所示。路径和线条的另一个限制是每个个体的线条类型必须是一个常数,因为R不能绘制不同线条类型相连接的线条。
对于线条和路径,线段的图形属性是由起始点的图形属性决定的。
如果颜色是离散的(上图),在相邻的颜色间插入其他颜色是没有任何意义的。
如果颜色是连续的(下图),可以在相邻的颜色间进行插补,但默认条件下R不会这样做。
df <- data.frame(x = 1:3, y = 1:3, colour = c(1, 3, 5))
qplot(x, y, data = df, colour = factor(colour), size = I(5)) + geom_line(aes(group = 1),
size = 2)
qplot(x, y, data = df, colour = colour, size = I(5)) + geom_line(size = 2)
xgrid <- with(df, seq(min(x), max(x), length = 50))
interp <- data.frame(x = xgrid, y = approx(df$x, df$y, xout = xgrid)$y, colour = approx(df$x, df$colour, xout = xgrid)$y)
qplot(x, y, data = df, colour = colour, size = I(5)) + geom_line(data = interp, size = 2)
对于其他的群组几何对象,如多边形,只有当所有个体的图形属性都相同时,该图形属性才会被使用,否则将使用默认值。这适用于fill
参数,因为它是整体对象的一个性质:考虑给多边形边界上的点填充不同的色没有任何意义。
当图形属性映射到连续型变量时,这类问题经常会被涉及。因为正如上所述,当映射对象是离散型的变量时,它将默认地把群组几何对象分解成更小的块。这对条形图和面积图的绘制非常有效,因为将每小块堆积起来就可得到和原来未分组前一样形状的图形,如下图所示。
一个条形图(上)按组分解后得到的叠加条形图(下),两者轮廓相同。
qplot(color, data = diamonds)
qplot(color, data = diamonds, fill = cut)