三元图,其实我不常见,主要在微生物相关的paper中看过。
所以先看定义。三元图用一个等边三角形描述三个变量的不同属性的比率关系,并将这种比率关系映射在等边三角形的特定空间中。我们可根据重心坐标来定位图中的点,将点作垂线到三个轴上,根据垂点位置可视化三个变量之间的比率。
接下来我们来具体说明。下面这个图是微生物paper中的一个图,反映了细菌OTUs在植物(Arabis alpina)根系区域的富集信息。图中,三个顶点分别代表土壤(Soil)、植物根际土壤(Rhizosphere)以及植物根组织内(Root)三种不同的根系微环境区域,每一个点表示一种OTU,点的位置由三种根系微环境对各OTU相对丰度的贡献确定,点的大小表示各OTU的相对丰度。根据各OTU在各根系微环境中的丰度数据进行统计检验后,得知各OTU分别在哪种微环境中显著富集,并据此在图中以不同颜色的点表示(土壤富集,黑色;根际区富集,红色;根内富集,绿色)。如此,各OTU的富集区域一目了然。
我们也用一组简单的微生物数据做测试,测试数据很简单,每个OTU在三个环境的丰度,然后表征在那个环境中富集(可以自己先做好统计检验),还有一列是代表OTU分类的列。
我们先测试第一个包,R的vcd包中提供了绘制三元图的命令ternaryplot()。我们通过ternaryplot()实现三元图的绘制。
dat <- read.table("data.txt", sep = '\t', header=T)
##ternaryplot() 三元图
library(vcd)
dat1 <- dat
#点的大小用于表示 OTUs 丰度
#由于各 OTUs 丰度差异过大,还有cex调控比较敏感,我取了均值的对数除以2
dat1$size <- apply(dat1[2:4], 1, mean)
dat1$size2 <- log10(dat1$size)/2
#颜色表示各 OTUs 的富集样本
dat1[which(dat1$rich == 'env1'),'color'] <- 'red'
dat1[which(dat1$rich == 'env2'),'color'] <- 'blue'
dat1[which(dat1$rich == 'env3'),'color'] <- 'green3'
dat1[which(dat1$rich == '0'),'color'] <- 'gray'
#ternaryplot() 示例,按 OTUs 富集区域着色
ternaryplot(dat1[2:4], col = dat1$color)
但是还没设置大小,所以是同等大小的
ternaryplot(dat1[2:4], scale = NULL, col = dat1$color, prop_size = FALSE, cex = dat1$size2, main = 'Enriched OTUs')
#其中scale代表显示scale的范围不;prop_size 要和cex联合使用(当prop_size参数为TRUE时,自动忽略cex参数)。
grid_legend(x = 0.8, y = 0.7, pch = c(19, 19, 19), col = c('red', 'blue', 'green3'), label = c('env1', 'env2', 'env3'), title = FALSE, frame = FALSE)
下面我们测试另外一个包。Ternary包提供了从头绘制三元图的方法,作图数据集需要分别构建,再通过TernaryPlot()、AddToTernary()等作图命令一步步绘制三元图组件。缺点是点文件,size和col文件都需要自己准备。
library(Ternary)
dat2 <- dat
#计算点坐标,根据变量在三个样本中的相对比率,再乘以 100,即可得到
dat2$sum <- apply(dat1[2:4], 1, sum)
dat2$env1 <- 100 * dat2$env1/dat2$sum
dat2$env2 <- 100 * dat2$env2/dat2$sum
dat2$env3 <- 100 * dat2$env3/dat2$sum
otu <- list() #输入需要list格式
for (i in 1:nrow(dat2)) {
otu[[i]] <- as.vector(unlist(dat2[i,c(2:4)]))
names(otu)[i] <- as.vector(dat2[i,1])
}
#赋值点颜色,颜色表示各 OTUs 的富集样本
dat2[which(dat2$rich == 'env1'),'color'] <- 'red'
dat2[which(dat2$rich == 'env2'),'color'] <- 'blue'
dat2[which(dat2$rich == 'env3'),'color'] <- 'green3'
dat2[which(dat2$rich == '0'),'color'] <- 'gray'
color <- c()
for (i in 1:nrow(dat2)) {
color[i] <- dat2[i,'color']
names(color)[i] <- as.vector(dat2[i,1])
}
#赋值点大小
size = c()
for (i in 1:nrow(dat2)) {
size[i] <- log10(apply(dat1[i,2:4], 1, mean) )
names(size)[i] <- as.vector(dat2[i,1])
}
#作图
TernaryPlot(atip = 'env1', btip = 'env2', ctip = 'env3', col = NA, grid.col = 'gray', grid.minor.col = NA, axis.col = 'black')
AddToTernary(points, otu, col = color, cex = size, pch = 20)
下面介绍一个可能像我更常用的ggtern。ggtern是在ggplot2的基础上开发的,其语法和ggplot2几乎一致,且功能也像ggplot2一样的强大,因此对于习惯使用ggplot2作图的肯定也会更倾向于使用ggtern绘制三元图。
library(ggtern)
dat3 <- dat
#点的大小用于表示 OTUs 丰度
dat3$size <- log10(apply(dat3[2:4], 1, mean))/2
下面我们就测试如何来画这个三元图。
ggtern(dat3, aes(env3, env1, env2)) +
geom_point(aes(color = rich, size = size), alpha = 0.8)
这就是一个最基本的控制颜色和size的三元图了,但是不太好看,需要调整一些参数。
ggtern(dat3, aes(env3, env1, env2)) +
#geom_point(aes(color = rich, size = size), alpha = 0.8) +
#theme_legend_position("topright") +
geom_point(aes(color = rich, size = size), alpha = 0.8, show.legend = FALSE) +
scale_size(range = c(0, 6)) +
scale_colour_manual(values = c('red', 'blue', 'green3', 'gray'), limits = c('env1', 'env2', 'env3', '0')) +
theme_bw() +
#theme_rgbw( ) +
geom_mask() +
theme(axis.text = element_blank(), axis.ticks = element_blank())+
theme(text = element_text(size = 20))
ggtern(dat3, aes(env3, env1, env2)) +
geom_point(aes(color = taxonomy, size = size), alpha = 0.8) +
#theme_legend_position("topright") +
#geom_point(aes(color = taxonomy, size = size), alpha = 0.8, show.legend = FALSE) +
scale_size(range = c(0, 10)) +
scale_colour_manual(values = rainbow(14)) +
theme_bw() +
#theme_rgbw( ) +
geom_mask() +
theme(axis.text = element_blank(), axis.ticks = element_blank())+
theme(text = element_text(size = 20))+
guides(size = 'none')
我们把color改成了按照taxonomy来着色了,看下不同种群的差异情况。