刘永鑫Adam

QIIME 2教程. 31名词Glossary(2020.2)

文章目录

前情提要
名词解释

Reference
译者简介
猜你喜欢
写在后面

前情提要

NBT：QIIME 2可重复、交互式的微生物组分析平台
1简介和安装Introduction&Install
2插件工作流程概述Workflow
3老司机上路指南Experienced
4人体各部位微生物组分析Moving Pictures
Genome Biology：人体各部位微生物组时间序列分析
5粪菌移植分析练习FMT
Microbiome：粪菌移植改善自闭症
6沙漠土壤分析Atacama soil
mSystems：干旱对土壤微生物组的影响
7帕金森小鼠教程Parkinson’s Mouse
Cell：肠道菌群促进帕金森发生ParkinsonDisease
8差异丰度分析gneiss
9数据导入Importing data
10数据导出Exporting data
11元数据Metadata
12数据筛选Filtering data
13训练特征分类器Training feature classifiers
14数据评估和质控Evaluating and controlling
15样品分类和回归q2-sample-classifier
16纵向和成对样本比较q2-longitudinal
17鉴定和过滤嵌合体序列q2-vsearch
18序列双端合并read-joining
19使用q2-vsearch聚类OTUs
20实用程序Utilities
21进化树推断q2-phylogeny
22命令行界面q2cli
23图形界面q2studio
24Python命令行模式Artifact API
25可用和开发中插件AvailableFuturePlugins
26开发新插件DevelopingPlugin
27语义类型Semantic
28社区Community
29参考数据库DataResources
30补充资源SupplementaryResources

名词解释

User Glossary

https://docs.qiime2.org/2020.2/glossary/

译者注：以下是QIIME 2中经常会用到的术语，由于有些术语无法准确翻译为中文，有的即使翻译成了中文，意思也会和原意有偏差，所以鼓励大家使用英文原文。

动作(Action)

这是对方法(method)、可视化工具(visualizer)或流程(pipeline)的统称。Action是由QIIME 2插件定义的。

对象(Artifact)

对象(Artifact)是QIIME 2的“结果”，它用于表示分析产生的中间产物（译者注：类似于化学反应的中间产物）。之所以称之为“artifact”，是因为它是QIIME 2软件产生的，而且被QIIME 2程序所使用的数据，而不是我们人类直接可读的结果。Artifact可以产生于导入数据后产生的文件，也可是QIIME 2输出的文件。Artifact一般以.qza作为扩展名，这种扩展名代表是QIIME 2压缩的artifact文件。Artifact可以作为action的输入文件，用QIIME 2 Artifact API的工具加载后供Python 3使用，或者用qiime2R加载供R使用。Artifact也可以作为QIIME 2的输出文件供其他软件使用。

数据来源/出处(data provenance)

详见下面的“去中心化数据来源（decentralized data provenance）”部分。

数据格式(data format)

说到数据格式，这是用“文件”的角度来谈artifact，即artifact被作为一个或多个文件存储在磁盘上。QIIME 2支持许多文件格式，对于给定的语义类型来说，QIIME 2的输入或输出文件有多种数据格式可用。

数据类型(data type)

这是从计算机内存的角度来谈artifact。数据类型的讲法只有Artifact API用户或插件开发者才会用到。QIIME 2支持许多数据类型，对于给定的语义类型，有多种数据类型可供查看QIIME 2对象（Artifact）使用。

去中心化数据溯源(decentralized data provenance)

这是描述QIIME 2“结果”信息是如何被产生的。这将包括所有QIIME 2 动作的细节信息，比如所有参数的值、作为UUIDs的结果和所有输入文件的参考文献。关于UUIDs的信息下文有详述。数据来源还包括QIIME 2结果的文献引用信息。这些引用信息必须列举在你发表的论文中。所有QIIME 2结果都包含内嵌的数据来源信息，可以用QIIME 2 View来可视化这些信息。数据来源是内嵌在“结果”中的，而不是存储在维护所有结果的中心化数据库中。QIIME 2的数据来源信息是去中心化的。

特征(feature)

“特征"是指一个观测单位，比如一个OTU、一个序列变异(ASV)、一个基因、一个代谢物等。QIIME 2使用这种通用的术语（指”特征“）是由于QIIME 2支持许多类型的"特征”。

输入文件(input)

供一个动作（action）分析用的对象（artifact）就是输入文件。比如，表格是 q2-feature-table插件中filter-features动作（action）的输入文件。译者注：其实简单说，用于QIIME 2分析的都是输入文件。

方法(method)

是QIIME 2“动作（action）”的一种类型，这里讲的“动作”是用一个或多个对象/参数作为输入，然后产生一个或多个“对象”作为“输出”。比如，在q2-feature-table插件中的filter-features动作就是一个“方法”。

输出(output)

运行一个“动作”产生的结果叫“输出”。比如，filtered-table是q2-feature-table中filter-features动作的一个输出。

参数(Parameter)

一种人为可调整的“原始型（primitive type）”，以便让“动作（action）”产生不同输出结果。比如，min-frequency是q2-feature-table中filter-features动作的一个参数。关于“原始型（primitive type）”的介绍请见下面内容。

流程(Pipeline)

是一种QIIME 2动作，它通常整合两个或多个动作。而一个流程是将一个或多个对象（artifact）或参数（parameter）作为输入，然后产生一个或多个结果（比如对象或可视化结果）作为输出。比如， q2-diversity插件中的 core-metrics action就是一个流程。译者注：如果把动作（action）比喻为糖葫芦上的一个山楂，那流程就是一串糖葫芦；或者再讲的直白点，流程就是一系统分析方法的串联集合，让每个分析过程无缝衔接，类似于流水线，高效完成分析任务，仅此而已。

插件(Plugin)

插件以动作（action）的形式提供分析功能。所有插件可以通过所有界面进入。插件可以有任何人开发和分发。在撰写本文时，在安装QIIME 2时提供了称为“核心发行版”的一系列插件。其他插件也可以安装到QIIME 2中。能够帮助发现其他插件的主要资源是QIIME 2库。具有QIIME 2论坛帐户的任何人都可以在QIIME 2库上共享其插件。我们计划逐步通过QIIME 2库分发所有QIIME 2插件，从而逐步淘汰核心分发。

数据溯源(provenance)

见上面“decentralized data provenance”部分。

原始型(primitive type)

是调整动作（action）中参数的具体数值，比如字符串（比如文本）、整数、布尔逻辑（真、假）等。原始型仅作为动作的输入，不是QIIME 2产生的输出信息。

qza

QIIME 2中对象的文件格式，详见上面artifact。

qzv

QIIME 2中可视化对象的文件格式，详见下文visualization。

分析结果(result)

是artifact或visualization的总称。

样品/样本(sample)

这个太好理解了，不翻译了哈。

semantic type 语义类型

语义类型描述了QIIME 2中数据的含义。QIIME2中的所有结果都有一个与之关联的语义类型，并且当将数据导入QIIME 2时，用户必须提供该数据的语义类型。

QIIME 2对语义类型的使用提供了与他人就数据进行通信的明确方式，并允许QIIME 2对数据进行推断并帮助用户防止产生错误。一个示例有助于说明什么是语义类型以及QIIME 2如何使用它们。QIIME 2包含两种相关的语义类型Phylogeny[Rooted]和 Phylogeny[Unrooted]，分别代表有根和无根的系统发育树。有根和无根系统树都可以存储在newick文件中，并且不解析该文件就无法轻松判断系统树是否有根。一些动作（action），如插件q2-diversity中β-系统发生法应仅应用于有根的系统发育树。通过将语义类型与系统发生树对象（artifact）相关联，QIIME 2可以确定是否向动作（action）提供了正确的数据类型，而无需首先解析文件（解析很慢，因此会延迟将错误呈现给用户），然后可能根据观察到的结果做出假设。如果用户不小心提供了QIIME 2 动作不可接受的语义类型的数据，则QIIME 2可以快速检测到此不匹配，并向用户提供有关错误以及如何纠正错误的详细信息。

语义类型不应与定义如何在磁盘上表示数据的数据格式混淆。例如，FeatureTable[Frequency]可以将另一个QIIME 2语义类型写入到BIOM格式的文件或制表符分隔的文本文件中。通过区分数据格式和语义类型，QIIME 2可以支持根据用户需求导入和导出不同的文件格式。语义类型也不应与数据类型混淆。例如， FeatureTable[Frequency]语义类型可以在内存中表示为biom.Table对象或pandas.DataFrame对象，对于不同的应用，这些表示中的一种可能比另一种更有用。无论使用哪种内存表示形式，数据的含义都是相同的。通过区分数据类型和语义类型，QIIME 2允许开发人员和用户选择对于给定任务最方便的数据结构。

类型(type)

类型是一个不明确的术语，因此我们尽量避免使用它来支持更具体的术语、语义类型、原始类型、数据格式或数据类型。

UUID

QIIME 2使用UUID，即“通用唯一标识符(Universally Unique Identifiers)”来引用所有结果以及执行的动作。采用数据溯源法，UUID可以用于追踪对象（artifact）的来源。UUID是一种标记QIIME 2 结果的好方法（译者注：即给每个结果打上唯一“标签”），因为UUID永远不会改变，除非让一个QIIME 2对象失效。UUID与文件名不同，文件名易于更改，因此用于追踪和溯源是不可靠的。

视图(view)

对象数据的特定表示形式，例如，数据格式或数据类型。

可视化工具(Visualizer)

把数据绘制成图表方便查看的分析方法。一种QIIME 2动作，它将一个或多个对象或参数作为输入，并产生一个可视化效果作为输出。例如，q2-feature-table插件中的summary操作是可视化工具。

Visualization 可视化

可视化结果（visualization，也叫可视化文件）是QIIME 2分析的最终输出结果，它的意思是该结果是由QIIME 2产生的，而且是被人类可以阅读的结果（与QIIME 2或其他软件可以读取的相反）。可视化结果只能由可视化工具或流程产生。可视化结果（visualization）以.qzv作为扩展名，它代表QIIME 2 zip压缩的可视化结果（visualization）。可视化文件可以用QIIME 2 View https://view.qiime2.org/将其呈现出来，使用QIIME 2 View不需要安装QIIME 2软件。QIIME 2界面通常支持这种可视化，这需要用到qiime tools view命令行。

Reference

https://docs.qiime2.org/2020.2

Evan Bolyen*, Jai Ram Rideout*, Matthew R. Dillon*, Nicholas A. Bokulich*, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

译者简介

刘永鑫，博士。2008年毕业于东北农业大学微生物学专业，2014年于中国科学院大学获生物信息学博士学位，2016年中科院遗传发育所博士后出站留所任工程师。目前主要研究方向有微生物组数据分析、方法开发和科学传播。目前以第一作者(含共同)或微生物组数据分析负责人在Science、Nature Biotechnology、Cell Host & Microbe 等杂志发表论文20余篇，引用千余次。作为中国唯一单位代表参与微生物组分析平台QIIME 2开发。受邀以第一作者和/或通讯作者(含共同)在Protein & Cell、Current Opinion in Microbiology、遗传等杂志发表微生物组研究方法综述。2017年7月创办“宏基因组”公众号，目前分享本领域相关原创文章1800余篇，代表作品有《微生物组图表解读、分析流程和统计绘图》、《QIIME2中文教程》等系列，关注人数9万+，累计阅读1400万+。

写在后面

为鼓励读者交流、快速解决科研困难，我们建立了“宏基因组”专业讨论群，目前己有国内外5000+ 一线科研人员加入。参与讨论，获得专业解答，欢迎分享此文至朋友圈，并扫码加主编好友带你入群，务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助，首先阅读《如何优雅的提问》学习解决问题思路，仍末解决群内讨论，问题不私聊，帮助同行。

学习扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

谈谈数次生信线下活动的收获和体会生信宝典
http://blog.genesino.com/2018/03/ampliconseqsumamry/从2017年11月份到2018年3月份，共进行了5次培训研讨活动，内容依次为转录组高级分析、生物信息作图系列R、Cytoscape及图形排版、应用Python处理生物信息数据和作图、微生物组扩增子分析、应用Linux处理生物信息数据和分析流程。从培训网站的课程顺序可以看到，最开始设计是从Linu
扩增子分析小王的学习杂记
16srDNA普遍存在于原核生物中，在生物进化中保持不变；具有高度保守序列，又有中度保守和高度变化的序列区域，因而它适用于进化距离不同的各类生物亲缘关系的研究；（9个可变区10个保守区）相对分子量大小适中，约1.5kb左右，便于测序和序列分析；种类少，含量大（约占细菌RNA含量的80％），素在大多数原核生物中rDNA都具有多个拷贝，5S、16S、23SrDNA的拷贝数相同。参考：https://m
扩增子分析 nitrostarch
exportPATH=/home/llt/miniconda2/bin:$PATHsourceactivateqiime1质控拼接join_paired_ends.py-f1_1.fq.gz-r2_2.fq.gz-mfastq-join-ojoinextract_barcodes.py-fjoin_paired/fastqjoin.join.fastq-cbarcode_single_end--b
《零基础免费学扩增子分析》视频课（含ppt及相应代码），无需转发，直接获取... 生信修炼手册人工智能大数据机器学习编程语言 java
扩增子测序是一种二代靶向测序技术，它使用PCR技术来生成称为扩增子的DNA序列。它简单、快速、应用广泛。扩增子测序可以有效地识别微生物高可变区并有效获取微生物物种的信息。扩增子测序包括16SrDNA,18SrDNA以及ITS的测序。16SrDNA是细菌分类学研究中最常用分类的marker基因信息，其序列包含9个可变区（Variableregion）和10个保守区（constantregion）。可
解读16S扩增子分析表格+代码实现 Les baleines tombent #16S
16s分析结果详解文章目录16s分析结果详解OTU表解读物种柱状图韦恩图稀释曲线Shannon-Winner曲线Rank-Abundance曲线Alpha多样性（样本内多样性）Chao1ShannonAceSimpsonAlpha多样性指数差异箱形图Beta多样性分析（样品间差异分析）PCoA分析PCA分析NMDS分析（非度量多维尺度分析）排序分析样本-物种丰度关联circos弦装图Ternary
加量不加价！扩增子新版分析流程结果解读（一） SHANGHAILINGEN 宏基因组学微生物 PacBio 科技其他
在上期内容中，我们简要介绍了扩增子新版分析流程，升级后的分析内容包含十大模块，120+分析内容，下面一起来看看具体的升级细节吧！01、差异分析基于样本分组，通过多种方法识别组间差异物种，升级前的差异分析结果中通常只包含lefse分析、anova方差分析和wilcoxon秩和检验结果，展示方式稍显单一。升级后的扩增子分析流程分别对门（Phylum）、纲（Class）、目（Order）、科（Famil
扩增子分析流程 —— 数据处理（vsearch）卢严砖扩增子分析其他
本篇文章是笔者学习了刘永鑫老师的扩增子教程以后，根据自己的学习过程总结了一篇使用vsearch工具处理序列数据得出OTU表的文章。笔者这篇文章会根据笔者自身的学习思路，每一步的数据处理都会从三个方面（是什么、为什么和怎么做）去分析展开。因为笔者以前没有接触过生信相关知识，所有生物知识还停留在高中水平，所以笔者所写的内容会比较偏向基础一些。如果本文章不符合你的需求，可以看刘永鑫老师的扩增子教程，不仅
扩增子分析全面升级！加量不加价，数据更多新玩法 SHANGHAILINGEN PacBio 微生物宏基因组学科技其他
加量不加价！扩增子标准分析流程全面升级！微生物是一类以分解代谢为主的生物类群，在微生物群落研究中，扩增子一直是了解微生物群落构成及分布的重要手段。基于markergene的扩增子测序可以反映系统中的微生物多样性的组成。常见Markergene包括细菌16SrRNA，真菌ITS和18S，功能基因包括AOA、AOB、nirK、nifH、McrA等。基于扩增子研究，我们能够得到微生物群落中物种的组成结构
加量不加价！扩增子新版分析流程结果解读（二） SHANGHAILINGEN 三代测序 PacBio 16s基因全长测序其他科技
在上期内容中，我们介绍了升级后的扩增子分析结果中的差异分析和环境因子关联分析，今天继续来了解其他的分析内容吧！一、随机森林分析随机森林是机器学习算法的一种，目的是根据已有的数据建立模型，从而实现对数据的分类和对其它指标的预测。如果目标变量是分类变量，随机森林可以进行分类；如果目标变量是连续变量，随机森林可以进行回归预测，此外在建立随机森林模型的过程中，还可以找出能够区分不同组样本间差异的关键物种或
扩增子分析2 树懒吃糖_
多个扩增子交叉设计可能存在突变漏检情况测试工具：vardictamplicon模式Filter标签在交叉区域的突变存在“AMPbias”，在不同扩增子中表现不同。
扩增子培训小结见龙在田007er2770
扩增子的定义：扩增子（amplicon）为DNA或RNA扩增的一段核苷酸序列。扩增子分析扩增子分析，指的是对生物高度保守的DNA序列进行分析，鉴定生物的种类与含量的方法，是宏基因组学的研究方法之一。amplicon.jpg注：以下扩增子均指微生物16SrDNA片段。扩增子的分析流程：采样采集微生物标本信息。提取DNA提取样本中的DNA。加接头（adapter）接头，是一段短的序列已知的核酸链，用于
基于qiime2的扩增子流程 kkkkkkang
写在前面：扩增子在微生物组领域就像分子生物学里面的PCR一样常见、有用，像繁琐的PCR一样（虽然有说明书告诉你引物、Taq酶、dNTPs等的加入量，但是每次都加也很繁琐），扩增子分析的流程也是很复杂。逐渐发展后，PCR有了mix（有了它，你只需要加水和模板就能PCR了）。为了方便自我和大家，我也把扩增子这个繁琐的流程整合成了像mix一样的东西-Amp.sh。只需要输入几个简单的参数，就可以坐等结果
Graphpad，经典绘图工具初学初探生信宝典
大多数科研文章都离不开图表，尤其是图，熟悉一些绘图软件，并将图在文章和PPT中展示出来，是科研训练的重要内容。漂亮的文章配图能给自己的工作加不少分，生信宝典推出R的系列教程ggplot2高效实用指南(可视化脚本、工具、套路、配色)讲解通过R语言绘制高颜值图。后来为了更加方便使用，生信宝典团队开发了在线绘图工具www.ehbio.com/ImageGP，支持14中常见图形和部分扩增子分析，深受欢迎，
扩增子分析：qiime2平台全流程分析华仔少年
Ampliconsequencinganalysispipelinethroughqiime2platformqiime2是扩增子数据分析的最佳平台之一，其提供了大量从原始data到统计分析的插件，尤其是它的可重复分析且可扩展插件的理念使得其成为扩增子分析首选的平台。更多知识分享请到https://zouhua.top/。Platformqiime2是扩增子数据分析的最佳平台之一，其提供了大量从原
扩增子分析：16s rRNA分析snakemake流程华仔少年
扩增子测序是分析环境微生物的常见手段，通常使用的是16srRNA片段。16srRNA分析主要有质控、去冗余、聚类OTU、去嵌合体、生成OTU表和物种注释等步骤。更多知识分享请到https://zouhua.top/。出发点最开始听人讲扩增子分析，我是云里雾里完全听不懂的蒙蔽状态。后来有幸认识了一位不辞辛苦或者说对“傻子”友好的技术达人，在他的帮助下了解了扩增子分析内的16srRNA的具体流程等。加
扩增子分析高锰酸钾配甲醛_ab83
微生太扩增子分析系列第八节：QIIME2+GalaxyPICRUSt进行16S功能预测扩增子测序是一种二代靶向测序技术，它使用PCR技术来生成称为扩增子的DNA序列，它简单、快速、应用广泛。扩增子测序可以有效地识别微生物高可变区并有效获取微生物物种的信息。扩增子测序主要包括16SrDNA测序、18SrDNA测序、ITS测序及目标区域扩增子测序等。16SrDNA是细菌分类学研究中最常用分类的mark
Rank abundance tianzhanlan
扩增子分析中，rankabundance已经是必备的一项分析内容，它可以从OTU的层面总体反应出物种的分布情况(丰度和均匀度)，如下图：image.png注：横坐标：OTU等级，“500”代表样本中按照丰度排列第500位的OTU；纵坐标：该等级OTU中序列数的相对百分含量，即属于该OTU的序列数除以总序列数，纵坐标轴上数字，例如“100”代表相对丰度为100%，“10”代表相对丰度为10%，依次类
扩增子分析——usearch+vsearch+qiime1 wanghaihua888
参考文章：1.https://www.jianshu.com/p/c72bb359f0502.http://blog.sciencenet.cn/blog-3334560-1071618.htmlusearch下载地址：https://drive5.com/software.htmlusearch安装：1.解压缩2.chmod+x/apps/users/user01/wanghhh/softwar
16S扩增子分析 | 02 去噪和聚类小虎牙儿 python linux java 数据分析 shell
读前须知nohup后台运行nohup后台运行时，要将qiime2-2019.7环境激活，否则会报错！一定要记得激活！激活！激活！nohupbash01.sh&nohup指不间断地运行，是nohangup的缩写。当运行一个进程的时候，不想让其在你退出账号时关闭，即可用nohup。nohup在不规定的情况下，所有输出内容会保存到nohup.out中。后缀&是让程序后台运行，但注意，后台运行不代表不受S
16S扩增子分析 | 05 Alpha和Beta多样性分析小虎牙儿可视化 python 机器学习大数据数据分析
利用宏基因组、16SrRNA测序等高通量测序技术分析微生物群体结构的时候，常见的有α和β多样性两个指标。Alpha多样性分析Alpha多样性主要反映样本内多样性。在肠道菌群分析中，是用来衡量个体内菌群的多样性，注意是单个个体，不涉及个体间的比较。Alpha多样性主要与两个因素有关：一是种类数目，即丰富度；二是多样性，群落中个体分配上的均匀性。通常有三类相关指数，测序深度指数（Observedspi
USEARCH —— 最简单易学的扩增子分析流程(中国总代理) 刘永鑫Adam 编程语言人工智能大数据 xhtml 机器学习
USEARCH——最简单易学的扩增子分析流程USEARCH中文帮助文档(USEARCHChinesemanual)USEARCH官方英文主页：http://www.drive5.com/usearch/本站经USEARCH作者RobertEdgar授权，由《宏基因组》公众号翻译的中文帮助文档和系列教程。USEARCH简介USEARCH是最好用的扩增子分析流程，在体积仅1MB的软件中实现了近200种
你想要的宏基因组-微生物组知识全在这(180901) 刘永鑫Adam 新闻
征稿、转载、合作文章分类导航目录精选文章推荐培训、会议、招聘广告科研经验软件和数据库扩增子分析宏基因组分析R统计绘图实验设计与技术基础知识必读综述高分文章套路解读科普视频-寓教于乐写在后面旧文删除友军文章汇总推荐欢迎点击上方蓝色”宏基因组”关注我们！本文“宏基因组”原创，更多文章点我跳转公众号阅读宏基因组/微生物组是当今世界科研最热门的研究领域之一，为加强本领域的技术交流与传播，推动中国微生物组计
扩增子统计绘图1箱线图：Alpha多样性刘永鑫Adam
本网对Markdown排版支持较差，对格式不满意的用户请跳转至或“宏基因组”公众号阅读；写在前面优秀的作品都有三部分曲，如骇客帝国、教父、指环王等。扩增子系列课程也分为三部曲：第一部《扩增子图表解读》：加速大家对同行文章的解读能力。第二部《扩增子分析解读》：学习数据分析的基本思路和流程。第三部《扩增子统计绘图》：即是对结果进行可视和统计检验，达到出版级的图表结果。《扩增子统计绘图》系列文章介绍《扩
扩增子统计绘图3热图：样品相关分析，差异OTU 刘永鑫Adam
写在前面优秀的作品都有三部分曲，如骇客帝国、教父、指环王等。扩增子系列课程也分为三部曲：第一部《扩增子图表解读》：加速大家对同行文章的解读能力。第二部《扩增子分析解读》：学习数据分析的基本思路和流程。第三部《扩增子统计绘图》：即是对结果进行可视和统计检验，达到出版级的图表结果。《扩增子统计绘图》系列文章介绍《扩增子统计绘图》是之前发布的《扩增子图表解读》和《扩增子分析解读》的进阶篇，是在大家可以看
微生物组核心OTU鉴定usearch otutab_core 刘永鑫Adam software
扩增子分析神器USEARCH简介v11新功能v11命令大全扩增子分析神器VSEARCH分析流程2.8.1中文帮助文档otutab_corehttp://www.drive5.com/usearch/manual/cmd_otutab_core.html鉴定核心微生物组——大多数样品中出现的OTUs，这也是Usearch11新增的功能。本质上是统计每个OTUs在大量样品中出现的频率。比如在所有样本中
易生信-扩增子教程02-真菌引物选择刘永鑫Adam 经验
距离上次《生信宝典》联合《宏基因组》组织的扩增子分析线下培训结束己经有三个多月了。为方便广大读者的学习，现在开始陆续分享上次培训的内部资料——理论课程课件。希望对想自学分析的朋友起到一定帮助作用。首先讲一下真菌的定义，真菌通常指的是真菌界的生物，是一类单细胞或多细胞异养真核微生物,无光合色素，细胞壁含几丁质和纤维素。按功能划分，可大致分为3类，病原菌、共生菌和腐生菌。真菌具有很高的物种多样性，据估
易生信-扩增子教程01-背景介绍刘永鑫Adam 扩增子
距离上次《生信宝典》联合《宏基因组》组织的扩增子分析线下培训结束己经有三个多月了。为方便广大读者的学习，现在开始陆续分享上次培训的内部资料——理论课程课件。希望对想自学分析的朋友起到一定帮助作用。猜你喜欢10000+：肠道细菌人体上的生命宝宝与猫狗梅毒狂想曲提DNA发Nature实验分析谁对结果影响大Cell微生物专刊系列教程：微生物组入门Biostar微生物组宏基因组专业技能：生信宝典学术图表高
16s扩增子分析注意事项和经验总结Tips 刘永鑫Adam 宏基因组 16S 扩增子分析经验
个人1年多16s/ITS扩增子分析中积累的点点滴滴，此文适合新人了解相关零散知识，也适合有分析经验的人交流与讨论。以下分析的经验，是以测序数据类型为IlluminaHiSeq2500产出的双端250数据类型(PE250)为基础。扩增测序技术选择：推荐使用PE250，性价比超高；原始数据使用fastqc质量评估，会发现数据右端末端质量较差，这是测序仪原理导致，我们在双端合并时还会利用另一端高质量序列
扩增子分析还聚OTU就真OUT了，试试unoise3 刘永鑫Adam 扩增子 software
宏基因组领域是当今热门领域，也正是方法快速发展和变革的时代。之前还把97%聚类OTU作为扩增子行业的金标准。转眼间各位大佬纷纷向OTU聚类方法拍砖，都不建议再使用。Feature代替OTU是趋势之前我翻译整理的QIIME2官方帮助文档——宏基因组扩增子最新分析流程QIIME2-了解分析趋势，读过的朋友会发现，里面的每个分析流程中都不再使用聚类方法生成OTU，而是调用DADA2[1]对原始数据进行去
扩增子分析解读2提取barcode,质控及样品拆分,切除扩增引物刘永鑫Adam 扩增子
本网对Markdown排版支持较差，请跳转“宏基因组”公众号阅读；写在前面之前发布的《扩增子图表解读》系列，相信很多朋友都看过了(链接直达7月文章目录)。这些内容的初衷是写给本领域刚进实验室的学生读，加速大家对同行文章的解读能力。如果连同行的结果都看不懂，何谈对数据的理解，对科学问题的解释。希望刚入行的小伙伴多读高水平文章，配合我的解读，定能让理解上升一个层次。《扩增子分析解读》系列文章介绍扩增子
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc