Qiime2 (三)-DADA2降噪(Denoise)流程

Dada 2 流程

DADA2数据处理不以序列相似度聚类,只进行去重(或相当于以100%序列相似度聚类),生成的是以ASV为单元的表格;
Vsearch数据处理与Usearch类似,以序列间相似度聚类(默认序列相似度为97%),生成的是OTU为单元的矩阵文件。
DADA2去噪分析分辨率更高,准确性更强。

双端数据命令示例:

1.降噪

输入:导入QIIME 2的 raw reads(summary_pe.qza)

time qiime dada2 denoise-paired \
--i-demultiplexed-seqs summary_pe.qza \
--o-table table-dada2_pe.qza \
--o-representative-sequences rep-seqs-dada2_pe.qza \
--o-denoising-stats dada2-stats_pe.qza \
--p-trim-left-f 0 \
--p-trim-left-r 4 \
--p-trunc-len-f 220 \
--p-trunc-len-r 240 

参数解释:

–p-trim-left-f 0 :表示从forward左端的第0位置开始裁剪
–p-trim-left-r 0: 表示从reverse左端的第0位置开始裁剪
–p-trunc-len-f 250 :表示forward总共保留的长度为250
–p-trunc-len-r 250:表示reverse总共保留的长度为250

输出:

table-dada2_pe.qza:特征表:即后缀名为biom的OTU table文件。
rep-seqs-dada2_pe.qza: 代表序列文件
dada2-stats_pe.qza: 过程统计文件

上面的参数(非0数字(—p-n-threads除外))因个人的测序而定

2.过程统计文件可视化:

qiime metadata tabulate \
--m-input-file dada2-stats.qza \
--o-visualization dada2-stats.qzv
dada2-stats.png

3. 导出otu table文件并转化格式

QIIME 2 的产物 qza 后缀文件相当于一个压缩包,可以使用 “ unzip ”命令解压。
特征表文件 feature_table.qza 或 table.qza 文件解压后,在 data/ 目录下会获得一个后缀为.biom的文件,将其转换为 tsv 文件的命令是:

unzip table-dada2.qza
biom convert -i feature-table.biom -o table.tsv --to-tsv 

4. otu table和代表序列可视化

qiime feature-table summarize \
  --i-table table-dada2.qza \
  --o-visualization table.qzv \
  --m-sample-metadata-file sample-metadata.tsv
qiime feature-table tabulate-seqs \
  --i-data rep-seqs.qza \
  --o-visualization rep-seqs-dada2.qza

单端数据命令示例:

qiime dada2 denoise-single \
--i-demultiplexed-seqs demux-summary.qza \
--p-trim-left 0 \
--p-trunc-len 120 \
--o-representative-sequences rep-seqs-dada2.qza \
--o-table table.qza \
--o-denoising-stats dada2-stats.qza 

你可能感兴趣的:(Qiime2 (三)-DADA2降噪(Denoise)流程)