论文是
Environmental factors shaping the gut microbiome in a Dutch population
数据和代码的github主页链接
https://github.com/GRONINGEN-MICROBIOME-CENTRE/DMP
这个也是数据代码的下载链接,可以看目录结构
https://zenodo.org/record/5910709#.YmAcp4VBzic
今天的推文重复一下论文中的figure1b
数据集
这里误差线的范围是平均值加减标准差,数据提前算好,整理到csv文件中
读取数据
library(readr)
dat01<-read_csv("newdataset/MockData_Fig_1B_microbiome_rarefaction_datatable.csv")
head(dat01)
分组折线图
library(ggplot2)
ggplot(data=dat01,aes(x=nr,y=spec.nr.mn,color=Taxon))+
geom_line(size=1.5,linetype=dat01$linetype)
添加误差线
ggplot(data=dat01,aes(x=nr,y=spec.nr.mn,color=Taxon))+
geom_line(size=1.5,linetype=dat01$linetype)+
geom_errorbar(aes(ymin=spec.nr.mn-spec.nr.sd,
ymax=spec.nr.mn+spec.nr.sd),
size=1.05, colour="black")
再叠加一层散点图
ggplot(data=dat01,aes(x=nr,y=spec.nr.mn,color=Taxon))+
geom_line(size=1.5,linetype=dat01$linetype)+
geom_errorbar(aes(ymin=spec.nr.mn-spec.nr.sd,
ymax=spec.nr.mn+spec.nr.sd),
size=1.05, colour="black")+
geom_point(shape=21,size=1.75,fill="white")
更改坐标轴标题
ggplot(data=dat01,aes(x=nr,y=spec.nr.mn,color=Taxon))+
geom_line(size=1.5,linetype=dat01$linetype)+
geom_errorbar(aes(ymin=spec.nr.mn-spec.nr.sd,
ymax=spec.nr.mn+spec.nr.sd),
size=1.05, colour="black")+
geom_point(shape=21,size=1.75,fill="white")+
xlab("Number of samples") + ylab("Number of features")
最后是美化调整细节
ggplot(data=dat01,aes(x=nr,y=spec.nr.mn,color=Taxon))+
geom_line(size=1.5,linetype=dat01$linetype)+
geom_errorbar(aes(ymin=spec.nr.mn-spec.nr.sd,
ymax=spec.nr.mn+spec.nr.sd),
size=1.05, colour="black")+
geom_point(shape=21,size=1.75,fill="white")+
xlab("Number of samples") + ylab("Number of features")+
scale_color_manual(values = c("#56B4E9", "#009E73", "#0072B2", "#D55E00", "#CC79A7", "#E69F00"))+
theme_bw()+
theme(text = element_text(size = 17))
制作封面图
ggplot(data=dat01,aes(x=nr,y=spec.nr.mn,color=Taxon))+
geom_line(size=1.5,linetype=dat01$linetype)+
geom_errorbar(aes(ymin=spec.nr.mn-spec.nr.sd,
ymax=spec.nr.mn+spec.nr.sd),
size=1.05, colour="black")+
geom_point(shape=21,size=1.75,fill="white")+
xlab("Number of samples") + ylab("Number of features") -> p1
print(p1)
ggplot(data=dat01,aes(x=nr,y=spec.nr.mn,color=Taxon))+
geom_line(size=1.5,linetype=dat01$linetype)+
geom_errorbar(aes(ymin=spec.nr.mn-spec.nr.sd,
ymax=spec.nr.mn+spec.nr.sd),
size=1.05, colour="black")+
geom_point(shape=21,size=1.75,fill="white")+
xlab("Number of samples") + ylab("Number of features")+
scale_color_manual(values = c("#56B4E9", "#009E73", "#0072B2", "#D55E00", "#CC79A7", "#E69F00"))+
theme_bw()+
theme(text = element_text(size = 17)) -> p2
print(p2)
library(patchwork)
p1+p2
今天推文的示例数据和代码可以在公众号后台留言
20220509
获取
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!