QIIME 2教程. 24Python命令行模式Artifact API(2020.2)

文章目录

  • 前情提要
  • Python命令行模式
    • Reference
    • 译者简介
    • 猜你喜欢
    • 写在后面

前情提要

  • NBT:QIIME 2可重复、交互式的微生物组分析平台
  • 1简介和安装Introduction&Install
  • 2插件工作流程概述Workflow
  • 3老司机上路指南Experienced
  • 4人体各部位微生物组分析Moving Pictures
  • Genome Biology:人体各部位微生物组时间序列分析
  • 5粪菌移植分析练习FMT
  • Microbiome:粪菌移植改善自闭症
  • 6沙漠土壤分析Atacama soil
  • mSystems:干旱对土壤微生物组的影响
  • 7帕金森小鼠教程Parkinson’s Mouse
  • Cell:肠道菌群促进帕金森发生ParkinsonDisease
  • 8差异丰度分析gneiss
  • 9数据导入Importing data
  • 10数据导出Exporting data
  • 11元数据Metadata
  • 12数据筛选Filtering data
  • 13训练特征分类器Training feature classifiers
  • 14数据评估和质控Evaluating and controlling
  • 15样品分类和回归q2-sample-classifier
  • 16纵向和成对样本比较q2-longitudinal
  • 17鉴定和过滤嵌合体序列q2-vsearch
  • 18序列双端合并read-joining
  • 19使用q2-vsearch聚类OTUs
  • 20实用程序Utilities
  • 21进化树推断q2-phylogeny
  • 22命令行界面q2cli
  • 23图形界面q2studio

Python命令行模式

Artifact API

https://docs.qiime2.org/2020.2/interfaces/artifact-api/

注:本指南假定您已执行“4人体各部位微生物组分析Moving Pictures ”教程中的步骤。在此使用该教程中生成的table.qzasample-metadata.tsv文件。

Artifact API是QIIME 2的Python 3应用程序程序员接口(API)。Artifact API支持使用Python 3编程语言与QIIME 2进行交互式计算。该API供高级/技术用户使用。该API是自动生成的,其可用性取决于当前安装的QIIME 2插件。它已针对Jupyter Notebook中的使用进行了优化,Jupyter Notebook目前是我们使用此API的主要目标。 Artifact API是QIIME 2框架的一部分;无需安装其他软件即可使用它。

现在,我们将探索“4人体各部位微生物组分析Moving Pictures”教程中介绍的相同方法和可视化工具,这次使用Python解释器而不是命令行界面。首先,我们将加载QIIME 2 Artifact,在本例中为功能表。然后,我们将其传递给q2-feature-table插件的rarefy方法,该方法将返回新的对象。

>>> from qiime2.plugins import feature_table
>>> from qiime2 import Artifact
>>> unrarefied_table = Artifact.load('table.qza')
>>> rarefy_result = feature_table.methods.rarefy(table=unrarefied_table, sampling_depth=100)
>>> rarefied_table = rarefy_result.rarefied_table

虽然我们建议直接使用QIIME 2 Artifacts,但是可以在一个或多个兼容视图(Python对象/数据结构或文件格式)中访问基础数据。 例如,您可能要访问刚刚作为biom.Table对象创建的稀疏功能表。 您可以按照以下步骤进行操作:

>>> import biom
>>> biom_table = rarefied_table.view(biom.Table)
>>> print(biom_table.head())
# Constructed from biom file
#OTU ID      L1S105  L1S140  L1S208  L1S257  L1S281
b32621bcd86cb99e846d8f6fee7c9ab8     25.0    31.0    27.0    29.0    23.0
99647b51f775c8ddde8ed36a7d60dbcd     0.0     0.0     0.0     0.0     0.0
d599ebe277afb0dfd4ad3c2176afc50e     0.0     0.0     0.0     0.0     0.0
51121722488d0c3da1388d1b117cd239     0.0     0.0     0.0     0.0     0.0
1016319c25196d73bdb3096d86a9df2f     11.0    17.0    12.0    4.0     2.0

使用pandas.DataFrame查看对象

>>> import pandas as pd
>>> df = rarefied_table.view(pd.DataFrame)
>>> df.head()
        b32621bcd86cb99e846d8f6fee7c9ab8  99647b51f775c8ddde8ed36a7d60dbcd  \
L1S105                              25.0                               0.0
L1S140                              31.0                               0.0
L1S208                              27.0                               0.0
L1S257                              29.0                               0.0
L1S281                              23.0                               0.0
...

QIIME 2的强大功能是,您可以从QIIME对象导出查看不同类型,如下所示,然后对结果数据类型进行操作,然后将这些数据导入QIIME。 如果查看的数据类型上有一些可用的操作(例如pandas.DataFrame)无法通过QIIME API使用,则此功能非常有用。 一个重要的警告是,您将在此过程中失去所有对象的出处,因为QIIME无法跟踪QIIME之外的数据发生了什么。 您可以将pandas.DataFrame重新导入到新的QIIME对象中,如下所示:

imported_artifact = Artifact.import_data("FeatureTable[Frequency]", df)

可以将稀疏表rarefied_table对象传递给其他QIIME 2插件的方法。 在这里,我们将使用q2-diversity插件计算Observed OTU的Alpha多样性指标。 生成的对象将为·SampleData [AlphaDiversity]·类型,我们可以访问pd.Series作为该对象的查看器。

>>> from qiime2.plugins import diversity
>>> alpha_result = diversity.methods.alpha(table=rarefied_table, metric='observed_otus')
>>> alpha_diversity = alpha_result.alpha_diversity
>>> alpha_diversity.view(pd.Series)
L1S105    24
L1S140    19
L1S208    25
L1S257    30
L1S281    29
L1S57     23
L1S76     20
L1S8      17

最后,我们可以将对象保存为.qza文件,并按如下所示退出解释器:

>>> rarefied_table.save('rare.qza')
'rare.qza'
>>> alpha_diversity.save('oo.qza')
'oo.qza'
>>> exit

QIIME 2的另一个强大功能是可以组合接口。 例如,您可以开发一个Python脚本来像我们刚才那样自动处理文件以生成结果,然后使用命令行界面或QIIME 2 Studio对这些文件进行分析。 例如,您现在可以继续分析并在命令行上查看一些结果,如下所示:

qiime diversity alpha-group-significance --i-alpha-diversity oo.qza --m-metadata-file sample-metadata.tsv  --o-visualization oo-group-significance.qzv

作为API调用的上述命令是:

>>> from qiime2 import Metadata
>>> metadata = Metadata.load('sample-metadata.tsv')
>>> group_significance = diversity.actions.alpha_group_significance(alpha_diversity=alpha_diversity, metadata=metadata)

Reference

https://docs.qiime2.org/2020.2/

Evan Bolyen*, Jai Ram Rideout*, Matthew R. Dillon*, Nicholas A. Bokulich*, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

译者简介

刘永鑫,博士。2008年毕业于东北农业大学微生物学专业,2014年于中国科学院大学获生物信息学博士学位,2016年中科院遗传发育所博士后出站留所任工程师。目前主要研究方向有微生物组数据分析、方法开发和科学传播。目前以第一作者(含共同)或微生物组数据分析负责人在ScienceNature BiotechnologyCell Host & Microbe 等杂志发表论文20余篇,引用千余次。作为中国唯一单位代表参与微生物组分析平台QIIME 2开发。受邀以第一作者和/或通讯作者(含共同)在Protein & CellCurrent Opinion in Microbiology遗传 等杂志发表微生物组研究方法综述。2017年7月创办“宏基因组”公众号,目前分享本领域相关原创文章1800余篇,代表作品有《微生物组图表解读、分析流程和统计绘图》、《QIIME2中文教程》等系列,关注人数9万+,累计阅读1400万+。

猜你喜欢

  • 10000+: 菌群分析
    宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑
  • 系列教程:微生物组入门 Biostar 微生物组 宏基因组
  • 专业技能:生信宝典 学术图表 高分文章 不可或缺的人
  • 一文读懂:宏基因组 寄生虫益处 进化树
  • 必备技能:提问 搜索 Endnote
  • 文献阅读 热心肠 SemanticScholar Geenmedical
  • 扩增子分析:图表解读 分析流程 统计绘图
  • 16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
  • 在线工具:16S预测培养基 生信绘图
  • 科研经验:云笔记 云协作 公众号
  • 编程模板: Shell R Perl
  • 生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

你可能感兴趣的:(扩增子分析)