ggtern ,用于创建三元图的ggplot2的扩展包,详细参数和用法见 官方说明文档 。
三元图是可以绘制三种不同元素或化合物的混合成分的特征图,由于第3维是线性的并且仅依赖于另外两维,因此可以在2D空间中表示具有三个自由度的坐标系。
主要记录几个重要的geom
Installation和准备
# install.packages('ggtern')
# require("ggtern")
df = data.frame(x = runif(50),
y = runif(50),
z = runif(50),
f = seq(1:50),
Value = runif(50,1,10),
Group = as.factor(round(runif(50,1,2))))
labs <- labs(x = "X", y = "Y", z = "Z", title = "Title")
普通三元图
P_Tern <- ggtern(data = df,aes(x, y, z)) +
geom_point(aes(color = Group)) +
labs()
微生物多样性分析中:
此处,不同的点代表不同的分类水平(可以通过点的颜色来体现),点的大小代表了该分类水平在不同分组当中平均丰度。三元相图只能对三个分组或者三个样品当中物种的相对丰度进行展示,点的位置代表了该属在不同分组当中的相对丰度大小。
简单来说:如果大多数的点集中在三角形的中间,说明物种在三个分组当中分布较均匀。如果靠近某个顶点那么这个物种在该顶点中的相对丰度较大。
置信区间 - 误差线
没有找到ggtern是怎么做置信区间的,但有个 统计学课程讲到三元图置信区间制作,原理应该差不多。|ू・ω・` )
- calculate the arithmetic mean of the data;
- calculate the standard deviation (σ) for each of the three individual components (Qt = quartz, Rnc = Rock fragments/”rest” [my shorthand], Rc = Rock fragments/carbonate) ;
- plot the pair of parallel lines defining the appropriate variance window (e.g., ±2σ = 95%) for each component; and
- truncate each line where it intersects those for the other two components at the same confidence level.
P_Inter <- ggtern(data = df,aes(x, y, z )) +
geom_point(aes(color = Group)) +
geom_confidence_tern(aes(fill = Group))+
labs()
2D kernel density
使用kde2d进行计算的2D核密度估计图对处理重叠图很有用,根据需求附加的质感可以实现更好的权重比例呈现。
ggtern(data=df,aes(x, y, z)) +
geom_point(aes(color = Group)) +
stat_density_tern(
geom = 'polygon',
aes(fill = ..level..),
bins = 5,
color = 'grey',
alpha = 0.5)+
labs ()
向三元图中再插值(interpolating)
在ggtern(data=df,aes(x, y, z, value = f) )+ geom_point()中,value不像分组变量,它不是一个基础美学变量,所以value的值并没有在图像中表现出来。
ggtern(data=df,aes(x,y,z, value=f)) +
stat_interpolate_tern(geom="polygon",
formula=value~x+y,
method=lm,n=100,
#指定连续变量分级
breaks=seq(0,50,by=2.5),
aes(fill=..level..),expand=1)+
geom_point()+labs()
(根本搞不懂是个啥!!)
添加只线类似abline
geom_Tline()
geom_Lline()
geom_Rline()
添加等比例线
为每个三元轴创建等比例线。
geom_Tisoprop()
geom_Lisoprop()
geom_Risoprop()
error bar
难点可能不在error bar 的代码上,数据处理是个问题。
geom_errorbarT()
geom_errorbarL()
geom_errorbarR()
geom_smooth
geom_point_swap
用于复杂的(如:多重颜色需求)fill或者color的处理。
geom_label_viewport + geom_text_viewport
散点或图片位点标签。
geom_mean_ellipse
geom_hex_tern- geom_tri_tern
类似三元热图,将平面分成规则的六(3)边形,计算每个六(3)边形的点数,然后(默认情况下)将散点数映射到颜色深度。
ggtern(data = df,aes(x, y, z)) +
geom_hex_tern(aes(fill =Group),
binwidth=0.1, alpha = 0.5)+
geom_point(aes(color = Group)) +
labs()
geom_polygon_closed
花里胡哨!!
扩增子(OTU)数据三元图
- OTU丰度表:每一行代表一个OTU,每一列代表一个样本。
- 分组信息,需要和样本信息一一匹配。
set.seed(13)
otu <- matrix(sample(c(0:1000), 1200, replace = TRUE),
ncol = 12, nrow = 100,
dimnames =
list(row_names = paste0("OTU",seq(1:100)),
col_names = paste0("sample",seq(1:12))))
otu <- as.data.frame(otu)
# 提取OTU信息或者分类水平名字
otu$OTU <- rownames(otu)
otu <- pivot_longer(data = otu,
cols = -OTU,
names_to = "variable",
values_to = "value")
# 创建分组信息数据集
group <- data.frame(variable = paste0("sample",seq(1:12)),
group = rep(c("Control", "Treat", "normal"),
each = 4))
# 按同类项进行合并
otu <- merge(otu, group, by = "variable")
head(otu)
otu <- subset(otu, select = -variable)
head(otu)
# 创建三元图作图数据集
otu %>%
group_by(group, OTU) %>%
mutate(index = row_number()) %>%
pivot_wider(names_from = group,
values_from = value) %>%
select(-index) -> otu_tern
# 取3 个样本的平均值定义点的大小,来看OTU富集位置和丰度情况
otu_tern$size <- (apply(otu_tern[2:4], 1, mean))
library(ggtern)
ggtern(data = otu_tern,
aes(x = Control, y = Treat, z = normal)) +
geom_mask() + # 可将超出边界的点正常显示出来
geom_point(aes(color = OTU, size = size),
alpha = 0.8, show.legend = TRUE) +
scale_size(range = c(0, 6)) +
# 去掉颜色legend
guides(colour = "none") +
theme_bw() +
theme(axis.text = element_blank(),
axis.ticks = element_blank())