QIIME 2教程. 17鉴定和过滤嵌合体序列q2-vsearch(2020.2)

文章目录

  • 前情提要
  • 鉴定和过滤嵌合体序列`q2-vsearch`
    • 数据下载
    • 无参嵌合体鉴定
    • 可视化统计结果
    • 过滤特征表和序列
      • 过滤嵌合体和可疑序列
      • 过滤嵌合但保留可疑序列
    • Reference
    • 译者简介
    • 猜你喜欢
    • 写在后面

前情提要

以下是前面几节的微信推送文章:

  • NBT:QIIME 2可重复、交互式的微生物组分析平台
  • 1简介和安装Introduction&Install
  • 2插件工作流程概述Workflow
  • 3老司机上路指南Experienced
  • 4人体各部位微生物组分析Moving Pictures,Genome Biology:人体各部位微生物组时间序列分析
  • 5粪菌移植分析练习FMT,Microbiome:粪菌移植改善自闭症
  • 6沙漠土壤分析Atacama soil,mSystems:干旱对土壤微生物组的影响
  • 7帕金森小鼠教程Parkinson’s Mouse,Cell:肠道菌群促进帕金森发生ParkinsonDisease
  • 8差异丰度分析gneiss
  • 9数据导入Importing data
  • 10数据导出Exporting data
  • 11元数据Metadata
  • 12数据筛选Filtering data
  • 13训练特征分类器Training feature classifiers
  • 14数据评估和质控Evaluating and controlling
  • 15样品分类和回归q2-sample-classifier
  • 16纵向和成对样本比较q2-longitudinal

鉴定和过滤嵌合体序列q2-vsearch

Identifying and filtering chimeric feature sequences with q2-vsearch

https://docs.qiime2.org/2020.2/tutorials/chimera/

注:最好按本教程顺序学习,想直接学习本章,至少完成本系列《1简介和安装》。

在QIIME 2中进行嵌合体检验基于FeatureTable[Frequency]FeatureData[Sequences]对象。QIIME 2内嵌了vsearch的Uchime无参(de novo)和有参(reference)去嵌合体流程。对于此过程的细节,详见Uchime的论文和vsearch的帮助文档。(推荐USEARCH软件主页有比较详细的教程,vsearch帮助读起来不方便)

本节使用《6沙漠土壤分析Atacama soil》中的特征表。

数据下载

Obtain the data

mkdir -p qiime2-chimera-filtering-tutorial
cd qiime2-chimera-filtering-tutorial

wget -c \
  -O "atacama-table.qza" \
  "https://data.qiime2.org/2020.2/tutorials/chimera/atacama-table.qza"

wget -c \
  -O "atacama-rep-seqs.qza" \
  "https://data.qiime2.org/2020.2/tutorials/chimera/atacama-rep-seqs.qza"

无参嵌合体鉴定

Run de novo chimera checking

# 20s
time qiime vsearch uchime-denovo \
  --i-table atacama-table.qza \
  --i-sequences atacama-rep-seqs.qza \
  --output-dir uchime-dn-out

输入对象:

  • atacama-rep-seqs.qza: 代表序列。 查看 | 下载
  • atacama-table.qza: 特征表。 查看 | 下载
  • uchime-dn-out/nonchimeras.qza: 去嵌合序列。 查看 | 下载
  • uchime-dn-out/chimeras.qza: 嵌合序列。 查看 | 下载
  • uchime-dn-out/stats.qza: 统计。 查看 | 下载

注:基于参考序列(有参,Reference-based)的嵌合体鉴定方法详见vsearch uchime-ref

可视化统计结果

Visualize summary stats

qiime metadata tabulate \
  --m-input-file uchime-dn-out/stats.qza \
  --o-visualization uchime-dn-out/stats.qzv

输入可视化:

  • uchime-dn-out/stats.qzv: 统计。 查看 | 下载

QIIME 2教程. 17鉴定和过滤嵌合体序列q2-vsearch(2020.2)_第1张图片

过滤特征表和序列

Filter input tables and sequences

过滤嵌合体和可疑序列

Exclude chimeras and “borderline chimeras”

qiime feature-table filter-features \
  --i-table atacama-table.qza \
  --m-metadata-file uchime-dn-out/nonchimeras.qza \
  --o-filtered-table uchime-dn-out/table-nonchimeric-wo-borderline.qza
qiime feature-table filter-seqs \
  --i-data atacama-rep-seqs.qza \
  --m-metadata-file uchime-dn-out/nonchimeras.qza \
  --o-filtered-data uchime-dn-out/rep-seqs-nonchimeric-wo-borderline.qza
qiime feature-table summarize \
  --i-table uchime-dn-out/table-nonchimeric-wo-borderline.qza \
  --o-visualization uchime-dn-out/table-nonchimeric-wo-borderline.qzv

输出对象:

  • uchime-dn-out/rep-seqs-nonchimeric-wo-borderline.qza:过滤嵌合体的序列。 查看 | 下载
  • uchime-dn-out/table-nonchimeric-wo-borderline.qza:过滤嵌合体的特征表。 查看 | 下载

输出可视化结果:

  • uchime-dn-out/table-nonchimeric-wo-borderline.qzv:特征表统计。 查看 | 下载

过滤嵌合但保留可疑序列

Exclude chimeras but retain “borderline chimeras”

qiime feature-table filter-features \
  --i-table atacama-table.qza \
  --m-metadata-file uchime-dn-out/chimeras.qza \
  --p-exclude-ids \
  --o-filtered-table uchime-dn-out/table-nonchimeric-w-borderline.qza
qiime feature-table filter-seqs \
  --i-data atacama-rep-seqs.qza \
  --m-metadata-file uchime-dn-out/chimeras.qza \
  --p-exclude-ids \
  --o-filtered-data uchime-dn-out/rep-seqs-nonchimeric-w-borderline.qza
qiime feature-table summarize \
  --i-table uchime-dn-out/table-nonchimeric-w-borderline.qza \
  --o-visualization uchime-dn-out/table-nonchimeric-w-borderline.qzv

输出对象:

  • uchime-dn-out/table-nonchimeric-w-borderline.qza:过滤嵌合体的序列。 查看 | 下载
  • uchime-dn-out/rep-seqs-nonchimeric-w-borderline.qza:过滤嵌合体的特征表。 查看 | 下载

输出可视化结果:

  • uchime-dn-out/table-nonchimeric-w-borderline.qzv:特征表统计。 查看 | 下载

Reference

https://docs.qiime2.org/2020.2/

Evan Bolyen*, Jai Ram Rideout*, Matthew R. Dillon*, Nicholas A. Bokulich*, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

译者简介

刘永鑫,博士。2008年毕业于东北农大微生物学,2014年于中科院遗传发育所获生物信息学博士,2016年遗传学博士后出站留所工作,任宏基因组学实验室工程师。目前主要研究方向为微生物组数据分析、分析方法开发与优化和科学传播,QIIME 2项目参与人。目前在***Science、Nature Biotechnology、Cell Host & Microbe、Current Opinion in Microbiology*** 等杂志发表论文20余篇。2017年7月创办“宏基因组”公众号,目前分享宏基因组、扩增子原创文章500余篇,代表博文有《扩增子图表解读、分析流程和统计绘图三部曲(21篇)》、《Nature综述:手把手教你分析菌群数据(1.8万字)》、《QIIME2中文教程(22篇)》等,关注人数8万+,累计阅读1300万+。

猜你喜欢

  • 10000+: 菌群分析
    宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑
  • 系列教程:微生物组入门 Biostar 微生物组 宏基因组
  • 专业技能:生信宝典 学术图表 高分文章 不可或缺的人
  • 一文读懂:宏基因组 寄生虫益处 进化树
  • 必备技能:提问 搜索 Endnote
  • 文献阅读 热心肠 SemanticScholar Geenmedical
  • 扩增子分析:图表解读 分析流程 统计绘图
  • 16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
  • 在线工具:16S预测培养基 生信绘图
  • 科研经验:云笔记 云协作 公众号
  • 编程模板: Shell R Perl
  • 生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

你可能感兴趣的:(扩增子分析)