16S测序分析(六)用PICRUSt预测菌群KEGG代谢通路

导读

PICRUSt (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States) 的原理基于已测细菌基因组的16S rRNA全长序列,推断它们的共同祖先的基因(同源基因)功能谱,对Greengenes数据库中其它未测物种的基因功能谱进行推断,构建古菌和细菌域全谱系的基因功能预测谱,最后,将测序得到的菌群组成“映射”到数据库中,对菌群代谢功能进行预测。

文献:
Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nature Biotechnology 2013

一、数据准备

1 QIIME2 DADA2分析的输出文件

1.1 rep-seqs.qza ## 代表性序列
1.2 table.qza ## 代表性序列丰度表,如下:

(导出qza文件的方法将在下面介绍)

2. Greengene细菌模板数据

下载地址:https://docs.qiime2.org/2019.1/data-resources/

下载得到gg_13_5_otus.tar.gz(最新版,大小为304M)后将其解压得到97_otus.fasta(最新版,大小约为139M),文件获取如下:

二、工作流程

1. 格式转换

将97_otus.fasta命名为gg_13_5_97_otus.fasta,并将其格式转化成QIIME2 qza格式

qiime tools import \
 --type 'FeatureData[Sequence]' \
 --input-path gg_13_5_97_otus.fasta \
 --output-path gg_13_5_97_otus.qza

2. 聚类

参考QIIME2官方文档:https://docs.qiime2.org/2018.8/tutorials/otu-clustering/

qiime vsearch cluster-features-closed-reference \
 --i-sequences rep-seqs.qza \
 --i-table table.qza \
 --i-reference-sequences gg_13_5_97_otus.qza \
 --p-perc-identity 0.97 \
 --p-threads 10 \
 --output-dir picrust/closed_ref_97_otu

3. 将qza格式转换biom格式

qiime tools export --input-path closed_ref_*_otu/clustered_table.qza --output-path closed_ref_*_otu/

4. 将biom格式转成tsv格式

biom convert --to-tsv -i feature-table.biom -o feature-table.tsv

这样就得到了OTU丰度表feature-table.tsv。接下来用PICRUSt(网址:http://huttenhower.sph.harvard.edu/galaxy/)进行在线菌群代谢功能预测,步骤如下:

三、PICRUSt预测菌群KEGG通路

1 上传数据

1.1 点击上传控件

1.2 选择上传格式和需要上传的本地文件;点击Start开始上传;点击Close返回

2 数据标准化

按如下操作:

3 KEGG代谢通路预测

按如下要求操作:

4 功能分类

按如下要求操作:

5 下载预测结果

6 菌群KEGG预测结果

相关阅读:
16S测序分析(一)菌属丰度表获取
16S测序分析(二)菌群多样性分析
16S测序分析(三)用LEfSe寻找组间差异细菌
16S测序分析(四)用MaAsLin寻找组间差异细菌
16S测序分析(五)用RandomForest寻找关键细菌

你可能感兴趣的:(16S测序分析(六)用PICRUSt预测菌群KEGG代谢通路)