宏基因组分析软件概总

摘抄于:公众号见下
https://mp.weixin.qq.com/s?__biz=MzI3Mzc1MzczMA==&mid=2247484757&idx=1&sn=e812eb8622053b9b640dde80a555987b&chksm=eb1f36b8dc68bfae243d896ba8c7d6f522f47e347751030768ac1040ef490eab389a2733720b&scene=21#wechat_redirect

  1. 流程:QIIME和Mothur
    在扩增子数据分析中,分析点相对成熟,软件繁多,盘点下来不止百种。一一安装又浪费资源又浪费时间,打包了多种软件的流程式软件备受青睐。这其中最为有名的便是QIIME和Mothur, 基本上可能用到的分析点大多都打包进去了。

  2. 拼接:flash
    目前最为主流的拼接软件仍为flash,但如果扩增片段过长或过短时,flash拼接效果可能不尽如人意,针对这些情况用pear或pandaseq拼接可能会有惊喜

  3. 序列比对:Muscle和Mafft
    几款序列比对软件都打包在了QIIME中,调用即可得到。几款软件中,Pynast和Infernal类似,都是基于参考库比对,但Infernal运行速度要慢得多,应用也少很多。Muscle和Mafft都是不依赖于参考库的全局比对软件。

  4. 嵌合体的去除:usearch。VSEARCH
    主要是de novo和基于参考库两种方法,结合了两种方法的usearch61被打包在qiime中(identify_chimeric_seqs.py),是目前主流的方法之一。但是注意,上面说到过,usearch的64位版本是收费的!前几年专门用uchime去嵌合体也应用较多,但现在官网上已指出不推荐单独安装uchime,推荐直接下载usearch。VSEARCH是作为替代usearch的开源软件推出的,与usearch运算速度不分上下,是mothur中嵌合体去除和聚类的推荐方法,建议大家可以试试。

  5. OTUs聚类:uparse、uclust、mothur
    的方法有非常多,主要分为启发式算法和层次聚类算法两种,前者有uparse、uclust、CD-HIT等,后者如mothur和oclust等。从应用情况来看,目前主流上的聚类软件还是以uparse、uclust、mothur几种为主。

  6. 物种注释:PICRUSt需要与Greengene配合使用,Tax4fun推荐与Silva配合使用
    扩增子分析中,16S序列注释以Greegene、Silva和 RDP为主,早期Greegene用的最多,当然这与打包在QIIME中密不可分,2013年5月后就一直没有更新,做分析的童鞋纷纷转去用Silva注释,Silva基本上每年还是都有更新的,好玩的是,后面我们会讲到两个比较有名的功能预测软件,PICRUSt需要与Greengene配合使用,Tax4fun推荐与Silva配合使用。另外,真菌ITS注释主要还是应用Unite数据库。功能基因早期用NT库注释效果惨不忍睹,
    近几年Fungene不断完善,基本上是功能基因扩增子测序物种注释的不二选择了。

  7. 功能预测:
    由于扩增子本身是对物种层面的分析,如能实现对其功能的预测,能解决的科学问题就多了。目前来说,功能预测软件仍以PICRUSt应用最多,但随着大家对古菌、真菌等多种非细菌群体的关注和注释数据库的更迭,其他软件应用也变多了。比如,上面我们说到,随着注释数据库的变更,Tax4Fun应用增多;专注于于环境样本的生物地球化学循环过程的FAPROTAX,真菌功能预测的FUNGuild等。

  8. 常用作图及统计软件

1、基础作图类
R ggplot2:
https://cran.rproject.org/web/packages/ggplot2/
Perl SVG: https://metacpan.org/pod/SVG
Python matplotlib: https://matplotlib.org/
QIIME: http://qiime.org/

2、物种统计及可视化
STAMP: kiwi.cs.dal.ca/Software/STAMP
LefSE:
http://huttenhower.sph.harvard.edu/galaxy/
Metastat: http://clovr.org/docs/metastats/
QIIME: http://qiime.org/

3、多样性分析
QIIME:http://qiime.org/
Mothur: https://www.mothur.org/
Usearch: http://drive5.com/usearch/

4、系统发生树可视化
GraPhlAn:http://huttenhower.org/galaxy/
iTOL: https://itol.embl.de/

5、环境因子分析
R vegan:
https://cran.r-project.org/web/packages/vegan/
Canoco5: http://www.canoco5.com/

6、网络互作分析
Cytoscape: http://www.cytoscape.org/
Gephi:https://gephi.org/

老司机点评:这部分给大家列了一些常见的软件,一般来说,如果得到了物种注释后的otu_table和序列比对后构建的发生树rep_phylo.tre,基础的分析部分就已经做完了,后续分析主要是基于物种统计及展示、组间比较(多样性--alpha_div,群落结构--beta_div等)、关联分析(网络互作、环境因子等),根据需求可能还会有功能预测分析等,结合其他验证类实验解释微生物多样性变化相关联的科学问题。

摘抄:
9个模块+40余款软件+老司机辣评 | 16S信息分析流程软件和数据库合集
原创: Sonia
微信公众号:生信者言 2017-09-14 08:00:00

你可能感兴趣的:(宏基因组分析软件概总)