论文是
Environmental factors shaping the gut microbiome in a Dutch population
数据和代码的github主页链接
https://github.com/GRONINGEN-MICROBIOME-CENTRE/DMP
这个也是数据代码的下载链接,可以看目录结构
https://zenodo.org/record/5910709#.YmAcp4VBzic
今天的推文重复一下论文中的 figureS3c 误差线图
部分示例数据集如下
读取数据集
disease_enterotype<-readr::read_csv("newdataset/FigureS3c.csv")
根据P值的大小给数据集增加一列表示分组
disease_enterotype$Sig=NA
disease_enterotype$Sig[disease_enterotype$Pvalue<0.5]="Significant"
disease_enterotype$Sig[disease_enterotype$Pvalue>=0.5]="Non-Significant"
这里的p值我选择0.5是因为论文中的数据是模拟数据,没啥实际意义。自己真实的数据集需要酌情考虑
根据Odds ratio的大小排序
disease_enterotype=disease_enterotype[order(disease_enterotype$OR),]
删除带有缺失值的行
disease_enterotype=na.omit(disease_enterotype)
赋予因子水平
disease_enterotype$Disease=factor(disease_enterotype$Disease,levels = disease_enterotype$Disease)
作图代码
library(ggplot2)
g <- ggplot(disease_enterotype, aes(x = OR, y = Disease,color=Sig)) +
geom_vline(aes(xintercept = 1), size = .25, linetype = "dashed") +
geom_errorbarh(aes(xmax = `CI_up`, xmin = `CI_low`), size = .3,
height = 0.2) +
geom_point(size = 3.5,shape=7) +
theme_bw()+ theme(panel.grid.minor = element_blank()) +
ylab("") + xlab("Odds ratio")+scale_color_lancet()
print(g)
论文中的图x轴还有一些注释信息,可以出图后借助其他软件编辑,如果先用代码实现的话可以借助annotate_custom()
函数,上一篇推文由关于这个函数的介绍,可以找来参考
论文中figureS3的布局,上面已经有两个图,下面这个图可能改成水平方向的会美观一点
g+coord_flip()+
theme(legend.position = "top",
axis.text.x = element_text(angle=90,
hjust=1,vjust=0.5))
示例数据和代码可以在公众号后台回复 20220525 获取
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!