【R画图学习12】三元图(Ternary Plot)

三元图,其实我不常见,主要在微生物相关的paper中看过。

所以先看定义。三元图用一个等边三角形描述三个变量的不同属性的比率关系,并将这种比率关系映射在等边三角形的特定空间中。我们可根据重心坐标来定位图中的点,将点作垂线到三个轴上,根据垂点位置可视化三个变量之间的比率。

接下来我们来具体说明。下面这个图是微生物paper中的一个图,反映了细菌OTUs在植物(Arabis alpina)根系区域的富集信息。图中,三个顶点分别代表土壤(Soil)、植物根际土壤(Rhizosphere)以及植物根组织内(Root)三种不同的根系微环境区域,每一个点表示一种OTU,点的位置由三种根系微环境对各OTU相对丰度的贡献确定,点的大小表示各OTU的相对丰度。根据各OTU在各根系微环境中的丰度数据进行统计检验后,得知各OTU分别在哪种微环境中显著富集,并据此在图中以不同颜色的点表示(土壤富集,黑色;根际区富集,红色;根内富集,绿色)。如此,各OTU的富集区域一目了然。

文献:Root microbiota dynamics of perennial Arabis alpina are dependent on soil residence time but independent of flowering time

我们也用一组简单的微生物数据做测试,测试数据很简单,每个OTU在三个环境的丰度,然后表征在那个环境中富集(可以自己先做好统计检验),还有一列是代表OTU分类的列。

我们先测试第一个包,R的vcd包中提供了绘制三元图的命令ternaryplot()。我们通过ternaryplot()实现三元图的绘制。

dat <- read.table("data.txt", sep = '\t', header=T)

##ternaryplot() 三元图

library(vcd)

dat1 <- dat

#点的大小用于表示 OTUs 丰度

#由于各 OTUs 丰度差异过大,还有cex调控比较敏感,我取了均值的对数除以2

dat1$size <- apply(dat1[2:4], 1, mean)

dat1$size2 <- log10(dat1$size)/2

#颜色表示各 OTUs 的富集样本

dat1[which(dat1$rich == 'env1'),'color'] <- 'red'

dat1[which(dat1$rich == 'env2'),'color'] <- 'blue'

dat1[which(dat1$rich == 'env3'),'color'] <- 'green3'

dat1[which(dat1$rich == '0'),'color'] <- 'gray'

#ternaryplot() 示例,按 OTUs 富集区域着色

ternaryplot(dat1[2:4], col = dat1$color)

但是还没设置大小,所以是同等大小的

ternaryplot(dat1[2:4], scale = NULL, col = dat1$color, prop_size = FALSE, cex = dat1$size2, main = 'Enriched OTUs')

#其中scale代表显示scale的范围不;prop_size 要和cex联合使用(当prop_size参数为TRUE时,自动忽略cex参数)。

grid_legend(x = 0.8, y = 0.7, pch = c(19, 19, 19), col = c('red', 'blue', 'green3'), label = c('env1', 'env2', 'env3'), title = FALSE, frame = FALSE)

下面我们测试另外一个包。Ternary包提供了从头绘制三元图的方法,作图数据集需要分别构建,再通过TernaryPlot()、AddToTernary()等作图命令一步步绘制三元图组件。缺点是点文件,size和col文件都需要自己准备。

library(Ternary)

dat2 <- dat

#计算点坐标,根据变量在三个样本中的相对比率,再乘以 100,即可得到

dat2$sum <- apply(dat1[2:4], 1, sum)

dat2$env1 <- 100 * dat2$env1/dat2$sum

dat2$env2 <- 100 * dat2$env2/dat2$sum

dat2$env3 <- 100 * dat2$env3/dat2$sum

otu <- list()   #输入需要list格式

for (i in 1:nrow(dat2)) {

        otu[[i]] <- as.vector(unlist(dat2[i,c(2:4)]))

        names(otu)[i] <- as.vector(dat2[i,1])

}

#赋值点颜色,颜色表示各 OTUs 的富集样本

dat2[which(dat2$rich == 'env1'),'color'] <- 'red'

dat2[which(dat2$rich == 'env2'),'color'] <- 'blue'

dat2[which(dat2$rich == 'env3'),'color'] <- 'green3'

dat2[which(dat2$rich == '0'),'color'] <- 'gray'

color <- c()

for (i in 1:nrow(dat2)) {

        color[i] <- dat2[i,'color']

        names(color)[i] <- as.vector(dat2[i,1])

}

#赋值点大小

size = c()

for (i in 1:nrow(dat2)) {

        size[i] <- log10(apply(dat1[i,2:4], 1, mean) )

        names(size)[i] <- as.vector(dat2[i,1])

}

#作图

TernaryPlot(atip = 'env1', btip = 'env2', ctip = 'env3', col = NA, grid.col = 'gray', grid.minor.col = NA, axis.col = 'black')

AddToTernary(points, otu, col = color, cex = size, pch = 20)

下面介绍一个可能像我更常用的ggtern。ggtern是在ggplot2的基础上开发的,其语法和ggplot2几乎一致,且功能也像ggplot2一样的强大,因此对于习惯使用ggplot2作图的肯定也会更倾向于使用ggtern绘制三元图。

library(ggtern)

dat3 <- dat

#点的大小用于表示 OTUs 丰度

dat3$size <- log10(apply(dat3[2:4], 1, mean))/2

下面我们就测试如何来画这个三元图。

ggtern(dat3, aes(env3, env1, env2)) +

geom_point(aes(color = rich, size = size), alpha = 0.8)

这就是一个最基本的控制颜色和size的三元图了,但是不太好看,需要调整一些参数。

ggtern(dat3, aes(env3, env1, env2)) +

#geom_point(aes(color = rich, size = size), alpha = 0.8) +

#theme_legend_position("topright") +

geom_point(aes(color = rich, size = size), alpha = 0.8, show.legend = FALSE) +

scale_size(range = c(0, 6)) +

scale_colour_manual(values  = c('red', 'blue', 'green3', 'gray'), limits = c('env1', 'env2', 'env3', '0')) +

theme_bw() +

#theme_rgbw( ) +

geom_mask() +

theme(axis.text = element_blank(), axis.ticks = element_blank())+

theme(text = element_text(size = 20))

ggtern(dat3, aes(env3, env1, env2)) +

geom_point(aes(color = taxonomy, size = size), alpha = 0.8) +

#theme_legend_position("topright") +

#geom_point(aes(color = taxonomy, size = size), alpha = 0.8, show.legend = FALSE) +

scale_size(range = c(0, 10)) +

scale_colour_manual(values  = rainbow(14)) +

theme_bw() +

#theme_rgbw( ) +

geom_mask() +

theme(axis.text = element_blank(), axis.ticks = element_blank())+

theme(text = element_text(size = 20))+

guides(size = 'none')

我们把color改成了按照taxonomy来着色了,看下不同种群的差异情况。

你可能感兴趣的:(【R画图学习12】三元图(Ternary Plot))