扩增子统计绘图1箱线图:Alpha多样性

本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或“宏基因组”公众号阅读;

写在前面

优秀的作品都有三部分曲,如骇客帝国、教父、指环王等。

扩增子系列课程也分为三部曲:

第一部《扩增子图表解读》:加速大家对同行文章的解读能力。

第二部《扩增子分析解读》:学习数据分析的基本思路和流程。

第三部《扩增子统计绘图》:即是对结果进行可视和统计检验,达到出版级的图表结果。

《扩增子统计绘图》系列文章介绍

《扩增子统计绘图》是之前发布的《扩增子图表解读》和《扩增子分析解读》的进阶篇,是在大家可以看懂文献图表,并能开展标准扩增子分析的基础上,进行结果的统计与可视化。其章节设计与《扩增子图表解读》对应,为八节课八种常用图形(箱线图、散点图、热图、曼哈顿图、火山图、维恩图、三元图和网络图),基本满足文章常用的图片种类需求。

也适合对公司标准化分析返回结果的进一步统计、可视化及美化,达到出版级别,冲击高分文章。

本部分练习所需文件位于百度网盘,链接:http://pan.baidu.com/s/1hs1PXcw 密码:y33d。

绘制Alpha多样性线箱图

绘图和统计全部为R语言,建议复制代码,在Rstuido中运行,并设置工作目录为存储之前分析结果文件的result目录。

# 运行前,请在Rstudio中菜单栏选择“Session - Set work directory -- Choose directory”,弹窗选择之前分析目录中的result文件夹

# 安装相关软件包,如果末安装改为TRUE运行即可安装
if (FALSE){
    source("https://bioconductor.org/biocLite.R")
    biocLite(c("ggplot2"))
}

# 加载相关软件包
library("ggplot2") # load related packages

# 读入实验设计和Alpha多样性值
design = read.table("design.txt", header=T, row.names= 1, sep="\t") 
alpha = read.table("alpha.txt", header=T, row.names= 1, sep="\t")

# 以Observed OTU为例进行可视化和统计分析,其它指数将observed_otus替换为shannon, chao1, PD_whole_tree即可计算

# 合并Alpha指数与实验设计
index = cbind(alpha, design[match(rownames(alpha), rownames(design)), ]) 
# 绘图代码、预览、保存PDF
p = ggplot(index, aes(x=genotype, y=observed_otus, color=genotype))+
  geom_boxplot(alpha=1, outlier.size=0, size=0.7, width=0.5, fill="transparent") +  
  geom_jitter( position=position_jitter(0.17), size=1, alpha=0.7)+
  labs(x="Groups", y="observed_otus index")
p
ggsave(paste("alpha_observed_otus.pdf", sep=""), p, width = 5, height = 3)

# 统计组间是否显著差异
# anova对指数与分组统计
observed_otus_stats <- aov(observed_otus ~ genotype, data = index)
# 使用TukeyHSD对组间进行检验,效正pvalue
Tukey_HSD_observed_otus <- TukeyHSD(observed_otus_stats, ordered = FALSE, conf.level = 0.95)
# 结果中提取需要的结果
Tukey_HSD_observed_otus_table <- as.data.frame(Tukey_HSD_observed_otus$genotype)
# 预览结果
Tukey_HSD_observed_otus_table
# 保存结果到文件,按Pvaule值由小到大排序
write.table(Tukey_HSD_observed_otus_table[order(Tukey_HSD_observed_otus_table$p, decreasing=FALSE), ], file="alpha_observed_otus_stats.txt",append = FALSE, quote = FALSE, sep="\t",eol = "\n", na = "NA", dec = ".", row.names = TRUE,col.names = TRUE)

Observed OTU多样性箱线图
image

详细的图片讲解,可参考1箱线图:Alpha多样性,老板再也不操心我的文献阅读

各组间的统计结果如下:主要看最后一列p adj(Adjust P-value)是否显著,本文数据不显著

diff    lwr     upr     p adj
OE-KO   -7.52380952380952       -24.480725165752        9.43310611813294        0.515429907536906
WT-KO   -6.11111111111111       -21.9728532782553       9.75063105603303        0.604309699204896
WT-OE   1.4126984126984 -15.5442172292441       18.3696140546409        0.976169656924344

其它箱线图绘制教程

推荐阅读并实际操作陈同博士写的文章:
R语言学习 - 箱线图(小提琴图、抖动图、区域散点图)
R语言学习 - 箱线图一步法

Reference

  1. http://mp.weixin.qq.com/s/5PkLAQ0yOxyGfl9MAH7veQ
  2. http://mp.weixin.qq.com/s/Zvmht0kOyOf02P8jQNjaOw
  3. http://mp.weixin.qq.com/s/8w6jV9MtJZ4h3ATaPP_Rsw
  4. http://mp.weixin.qq.com/s/MJWyUzeBZ7WJQhpAGX6Fgg

想了解更多宏基因组、16S文献阅读和分析相关文章,快关注“宏基因组”公众号,干货第一时间推送。
image

系统学习生物信息,快关注“生信宝典”,那里有几千志同道合的小伙伴一起学习。
image

你可能感兴趣的:(扩增子统计绘图1箱线图:Alpha多样性)