在获得了binning结果之后,下一步应该进行什么分析呢?本文将针对binning之后的分析思路进行梳理。
参考文献:Genomic inference of the metabolism and evolution of the archaeal phylum Aigarchaeota
文献讲解:Nat Commun:宏基因组学提示曙古菌门的代谢和进化(中大李文均组)
请参考?
Microbiome:宏基因组分箱流程MetaWRAP分析实战和结果解读
分箱获得结果:
代谢潜能分析需要基于prokka的结果进行KEGG等数据库注释,一般针对某一高丰度门进行分析
根据基因存在与否进行代谢通路构建,一般关注主要C,N,S,能量代谢通路,还可以根据研究对象所处环境进行针对性分析
关注点:厌氧/需氧,自养/异养,利用的C源等
需要手动整理,非常画时间
保守区域比对:CDD库
代谢物合成基因簇:
antiSMASH数据库:微生物次生代谢物合成基因组簇查询和预测
参考:Novel soil bacteria possess diverse genes for secondary metabolite biosynthesis
中文解读:土壤微生物:我就是 “药神”!
当bin的物种注释结果明确时:根据bin物种注释结果选择
当bin的物种注释结果只到kingdom水平时:
选择1: ncbi-genome-download
选择2: ncbi_download.py 根据accession编号下载,需要python3环境
#ncbi_download.py使用
#------------------------
python ./ncbi_download.py --convert -g 21516 SAMN02440951
#-g后跟list of genome accession numbers,空格隔开
#--convert 写上的话会根据提供编号查找use NCBI Entrez to get BioSample ID
#如果不写上,只会查找ftp://ftp.ncbi.nih.gov/genomes/genbank/assembly_summary_genbank.txt中有的accessions编号
#注意:如果是python2环境,需要根据报错修改脚本
补充:
进化树构建首先要选择保守序列然后串联起来,或者选择16S rRNA
软件使用参考:RNAmmer的安装和使用
blast+教程:Blast+的使用教程
rRNA数据库比较: 史上最详细的微生物扩增子数据库整理
RDP数据下载: 微生物多样性专题-扩增子测序分析实战(二)数据库整理之RDP
关于核糖体marker genes提取:A simple, fast, and accurate method of phylogenomic inference,the 16 ribosomal proteins chosen as single-copy phylogenetic marker genes (RpL2, 3, 4, 5, 6, 14, 15, 16, 18, 22, and 24, and RpS3, 8, 10, 17, and 19)
根据核糖体marker gene构建进化树参考文献:A new view of the tree of life
参考:一文读懂进化树
用在线RaxML构建系统发育树
Evolview:提升系统进化树颜值
Evolview:进化树美化进阶
教你用iTOL轻松绘制高颜值系统进化树
iTOL快速绘制颜值最高的进化树!
对于感兴趣的草图,如果质量高,而且可以找到相似的物种基因组,那么可以放在一起画基因组草图,用相似物种的基因组做为contig顺序的参考。
可视化可以选择:
CGviewer
anvio需要自己整理anvi-interactive输入数据
补充说明:
How are bacterial species defined?
这部分分析还是要为文章内容服务,非常画时间