ggplot学习笔记(六)

前面所有国家的图包含了过多的曲线, 使得图形表现得很拥挤。 可以将一个作图区域拆分成若干个小块, 称为小图(facet), 按照某一个或两个分类变量的不同值将数据分为若干个子集, 每个数据子集分别在小图上作图。 对于上面的例子, 可以将每个大洲的图形分别放置在一个小图上。 小图不是一种变量映射, 而是一种图形摆放方法, 所以不设置在aes()函数内, 而是用facet_wrap()函数规定。 这种功能与group映射的功能有些重复, 所以有时需要与group映射配合使用, 有时则不需要。 程序如:

p<- ggplot(data = gapminder,mapping=aes(x=year, y=lifeExp,group=country))p+ geom_line() + facet_wrap(~ continent)

区分不同小图的标签写在每个小图的上方。 可以用facet_wrap()参数strip_position和参数switch调整标签的上下左右。 小图之间默认公用了横坐标和纵坐标且坐标范围保持一致。 如果不保持一致, 读者可能会有误解。 但是x轴或y轴映射为分类变量且不同小图的分类完全不同时, 可以令各小图中该轴的取值不统一。 facet_wrap()选项scales默认为"fixed", 即所有小图的x轴、y轴都范围一致, 取"free_x"则允许各小图的x轴不统一, "free_y"允许各小图的y轴不统一, "free"允许各小图的x轴和y轴都不统一。

在facet_wrap()中可以用ncol参数指定小图的列数, 用nrow指定小图的行数。 各个小图的次序应该设定为一定的合理次序, 比如用来分类的变量本身有序, 或者令各小图中的数据值有一定的增减次序。 下面的程序将曲线颜色变浅, 对每个大洲增加了拟合曲线, 增加了适当的标题和坐标轴标签。 注意,这时不能使用统一的group = country映射, 否则拟合曲线就是对每个国家都单独有一条拟合曲线, 而不是每幅小图中仅有一条拟合曲线。 办法是仅在geom_line()中给出group = country的映射, 但在geom_smooth()中则不用group维。 程序如下:

p<-ggplot(data=gapminder,mapping=aes(x=year,y=lifeExp))p+geom_line(mapping=aes(group=country),color="gray70") +geom_smooth(method="loess",color="cyan",se=FALSE,size=1.1)+facet_wrap(~continent,ncol=2)+labs(x="年份",y="期望寿命",title="五个大洲各国期望寿命变化趋势"    )

## `geom_smooth()` using formula 'y ~ x'

注意group = country的设置从ggplot()函数中转移到了geom_line()函数中, 否则就意味着拟合线也需要按照国家分组, 而不是按大洲分组。 facet_wrap()主要适用于按照一个分类变量的值将不同观测在不同小图中表现, 可以人为指定小图的行数和列数。 如果需要按照两个分类变量交叉分组分配小图, 可以用facet_grid()函数。 例如, 对gss_sm数据集,作小孩个数对年龄的散点图:

p<-ggplot(data=gss_sm,mapping=aes(x=age,y=childs))p+geom_point(alpha=0.2)

## Warning message:## Removed 18 rows containing missing values (geom_point).

有过多的重叠点。 将观测按照性别(sex)和种族(race)交叉分组, 分配到不同的小图上:

p+ geom_point(alpha =0.2) +facet_grid(sex~ race)

## Warning message:## Removed 18 rows containing missing values (geom_point).

交叉分组时作小图时, sex ~ race这种写法使得不同性别对应到不同行, 不同种族对应到不同列。 在图形中增加拟合曲线:

p+ geom_point(alpha =0.2) +  geom_smooth() +facet_grid(sex~ race)

## `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'## Warning messages:## 1: Removed 18 rows containing non-finite values (stat_smooth). ## 2: Removed 18 rows containing missing values (geom_point). 

这里虽然没有映射group维, 但还是按性别和种族对数据集分成了6个子集, 每个小图中仅有一个自己的数据。

你可能感兴趣的:(ggplot学习笔记(六))