今天我们来分享一种生信分析中不那么常见的图 -- 泡泡图。该图展示的内容类似barplot,只不过用圆圈的大小来替代柱子的长度来表述数据的多少。同时,该图的x和y轴是没有任何实际意义的,该图相当于一个圆形的treemap。
绘制泡泡图有个难点,就是将不同的数据点的用圆形排列出来。不过,已经有现成的 packcircles
包可以用来解决这个问题,该包能够给出每个数据点的圆心以及圆边的坐标。
绘图
我们使用随机生成的数据来展示绘图过程,话不多说,绘图代码如下:
library(packcircles)
library(ggplot2)
set.seed(21)
# 随机生成绘图数据
data <- data.frame(group=paste0("group", letters[1:20]), value=sample(seq(1,100),20))
head(data)
group value
1 groupA 66
2 groupB 71
3 groupC 98
4 groupD 6
5 groupE 15
6 groupF 27
# 生成数据点的圆心坐标,该函数可以生成不重叠的圆
center <- circleProgressiveLayout(data$value, sizetype='area')
head(center)
x y radius
1 -4.5834978 0.0000000 4.583498
2 4.7539459 0.0000000 4.753946
3 -0.1019535 -9.1278701 5.585192
4 -6.1924099 -5.7444136 1.381977
5 -9.5649358 -4.5824830 2.185097
6 -12.0973725 -0.1364168 2.931615
# 将数据与圆心坐标合并用以绘图
data <- cbind(data, center)
head(data)
group value x y radius
1 groupA 66 -4.5834978 0.0000000 4.583498
2 groupB 71 4.7539459 0.0000000 4.753946
3 groupC 98 -0.1019535 -9.1278701 5.585192
4 groupD 6 -6.1924099 -5.7444136 1.381977
5 groupE 15 -9.5649358 -4.5824830 2.185097
6 groupF 27 -12.0973725 -0.1364168 2.931615
# 生成每个数据点圆边的坐标
edge <- circleLayoutVertices(center, npoints=50)
head(edge)
x y id
1 0.00000000 0.0000000 1
2 -0.03614225 0.5744646 1
3 -0.14399901 1.1398696 1
4 -0.32186933 1.6872981 1
5 -0.56694807 2.2081169 1
6 -0.87537019 2.6941124 1
ggplot() + geom_polygon(data = edge, aes(x, y, group = id, fill=as.factor(id)), colour = "black", alpha = 0.6) +
geom_text(data = data, aes(x, y, size=value, label = group)) +
scale_size_continuous(range = c(1,4)) +
theme_void() +
theme(legend.position="none") +
coord_fixed()
结果如下:
轻轻松松的绘图过程就使得我们拿到了一个漂亮的泡泡图,这都源于我们站在巨人的肩膀上,不由得还是想夸赞一下packcircles
包的作者很厉害!使用该包的函数circleProgressiveLayout
可以轻松地确定每个数据点的圆心坐标及半径大小,而且这些圆并不会重叠。使用函数circleLayoutVertices
再为每个圆生成边的绘图坐标。这样完整的绘图数据就到手了,绘图也就水到渠成了,真的很nice!
排序
上面图中的气泡是随机排列的,如果我们想给气泡排个序怎么办呢?答案很简单,我们只需在生成绘图坐标前给数据排个序即可。话不多说,直接看代码:
data <- data.frame(group=paste0("group", letters[1:20]), value=sample(seq(1,100),20))
data <- data[order(data$value),]
center <- circleProgressiveLayout(data$value, sizetype='area')
data <- cbind(data, center)
edge <- circleLayoutVertices(center, npoints=50)
ggplot() + geom_polygon(data = edge, aes(x, y, group = id, fill=as.factor(id)), colour = "black", alpha = 0.6) +
geom_text(data = data, aes(x, y, size=value, label = group)) +
scale_size_continuous(range = c(1,4)) +
theme_void() +
theme(legend.position="none") +
coord_fixed()
效果如下:
排序只有两种效果,要不从里到外泡泡逐级变大,要不从内到外泡泡逐渐变小,如果想排序建议还是前一种吧!
椭圆
图中每个数据点的形状能不能变呢?答案是肯定的。首先来看看最简单的变化 -- 椭圆。代码如下:
ggplot() + geom_polygon(data = edge, aes(x, y, group = id, fill=as.factor(id)), colour = "black", alpha = 0.6) +
geom_text(data = data, aes(x, y, size=value, label = group)) +
scale_size_continuous(range = c(1,4)) +
theme_void() +
theme(legend.position="none") +
coord_fixed(2/3)
效果如下:
通过函数coord_fixed
来修改两个坐标的度量比,很容易实现由圆到椭圆的变化。
多边形
当然,我们也可以绘制其他的多边形,这里我们就以六边形为例,代码如下:
edge <- circleLayoutVertices(center, npoints=6)
ggplot() + geom_polygon(data = edge, aes(x, y, group = id, fill=as.factor(id)), colour = "black", alpha = 0.6) +
geom_text(data = data, aes(x, y, size=value, label = group)) +
scale_size_continuous(range = c(1,4)) +
theme_void() +
theme(legend.position="none") +
coord_fixed()
效果如下:
通过上面的代码,大家应该知道是怎么回事了,没错,npoints
参数的值是多少图形就是多少变形,只不过数字大了就接近圆形了,比如当值为50时看起来已经是圆了。
间隙
上面的图形都是边挨着边,好像显得有些拥挤,该如何让形图之间有间隙呢?这个需求采用数据处理的小技巧,便可轻松实现,代码如下:
center <- circleProgressiveLayout(data$value, sizetype='area')
center$radius <- 0.95 * center$radius
data <- cbind(data, center)
edge <- circleLayoutVertices(center, npoints=50)
ggplot() + geom_polygon(data = edge, aes(x, y, group = id, fill=as.factor(id)), colour = "black", alpha = 0.6) +
geom_text(data = data, aes(x, y, size=value, label = group)) +
scale_size_continuous(range = c(1,4)) +
theme_void() +
theme(legend.position="none") +
coord_fixed()
效果如下:
通过修改圆的半径大小,来生成圆圈之间的间隙,就是这么简单!关于泡泡图就分享这么多吧!
往期绘图
可视化:嵌套饼图
可视化:环状条形图
可视化:分组环状条形图
可视化:小提琴图
可视化:蜜蜂图