刘永鑫Adam

QIIME 2教程. 19使用q2-vsearch聚类OTUs(2020.2)

文章目录

前情提要
使用`q2-vsearch`聚类序列为OTUs

下载数据
序列去冗余
特征[频率]和特征数据[序列]的聚类

无参/从头聚类
有参聚类
半有参/开放参考聚类

Reference
译者简介
猜你喜欢
写在后面

前情提要

以下是前面几节的微信推送文章：

NBT：QIIME 2可重复、交互式的微生物组分析平台
1简介和安装Introduction&Install
2插件工作流程概述Workflow
3老司机上路指南Experienced
4人体各部位微生物组分析Moving Pictures，Genome Biology：人体各部位微生物组时间序列分析
5粪菌移植分析练习FMT，Microbiome：粪菌移植改善自闭症
6沙漠土壤分析Atacama soil，mSystems：干旱对土壤微生物组的影响
7帕金森小鼠教程Parkinson’s Mouse，Cell：肠道菌群促进帕金森发生ParkinsonDisease
8差异丰度分析gneiss
9数据导入Importing data
10数据导出Exporting data
11元数据Metadata
12数据筛选Filtering data
13训练特征分类器Training feature classifiers
14数据评估和质控Evaluating and controlling
15样品分类和回归q2-sample-classifier
16纵向和成对样本比较q2-longitudinal
17鉴定和过滤嵌合体序列q2-vsearch
18序列双端合并read-joining

使用`q2-vsearch`聚类序列为OTUs

Clustering sequences into OTUs using q2-vsearch

目前QIIME2支持三个聚类方式：无参(De novo), 有参(closed-reference), 和半有参(open-reference clustering，即先有参比对再将无法比对序列进行无参聚类)。

目前运行vsearch仅能对拆分和质控后的数据进行OTUs聚类 (如SampleData[Sequences]对象), 或质控后的特征表和代表性序列(如FeatureTable[Frequency]和FeatureData[Sequence]对象, 这些文件可以由qiime dada2 denoise-*或qiime deblur denoise-*命令产生)。第一选择需要两步（在将来可能一步就搞定）。第二选择只需一步完成。

QIIME 1用户：在QIIME1中，由split_libraries*.py命令进行样本序列拆分、质量过滤，生成文件为seqs.fna。

在学习完本教程之后，您将知道如何运行从头，封闭参考和开放参考集群。这将从一个QIIME 1 seqs.fna文件开始进行说明，该文件将被读取到SampleData [Sequences]工件中。如果您已经具有要聚类的FeatureTable [Frequency]和FeatureData [Sequence]工件，则可以跳到本教程的FeatureTable [Frequency]和FeatureData [Sequence]聚类。

下载数据

mkdir -p qiime2-otu-clustering-tutorial
cd qiime2-otu-clustering-tutorial

wget -c \
  -O "seqs.fna" \
  "https://data.qiime2.org/2020.2/tutorials/otu-clustering/seqs.fna"

wget -c \
  -O "85_otus.qza" \
  "https://data.qiime2.org/2020.2/tutorials/otu-clustering/85_otus.qza"

序列去冗余

Dereplicating a SampleData[Sequences] artifact

如果您开始分析时使用的是样本拆分、质量控制的序列，例如QIIME 1的seqs.fna文件中的序列，那么第一步是将数据导入为QIIME 1对象。这里使用的语义类型是SampleData[Sequences]，表示数据是一个或多个样本的序列集合。

# 5s
time qiime tools import \
  --input-path seqs.fna \
  --output-path seqs.qza \
  --type 'SampleData[Sequences]'

输出对象：

85_otus.qza: 按85%相似度聚类的OTU。查看 | 下载
seqs.qza: 导入的序列文件。查看 | 下载

导入后，使用dereplicate-sequences进行序列去冗余

# 6s
time qiime vsearch dereplicate-sequences \
  --i-sequences seqs.qza \
  --o-dereplicated-table table.qza \
  --o-dereplicated-sequences rep-seqs.qza

输出结果:

rep-seqs.qza: 代表序列。查看 | 下载
table.qza: 特征表。查看 | 下载

序列去冗余dereplicate-sequences的输出是一个FeatureTable[Frequency]和一个FeatureData[Sequence]对象。FeatureTable[Frequency]对象是特征表，指示在每个样本中观察到的每个Amplicon序列变体（ASV）的次数。FeatureData[Sequence]对象包含每个功能标识符到定义该特征序列变量的映射。这些文件类似于qiime dada2 denoise-*和qiime deblur denoise-*生成的文件，只是在去噪过程中没有应用去噪、去除嵌合体或其他质量控制。（在本例中，这些数据的唯一质量控制是在导入import步骤之前，即在QIIME 2之外的程序进行的）

特征[频率]和特征数据[序列]的聚类

Clustering of FeatureTable[Frequency] and FeatureData[Sequence]

QIIME2中的OTU聚类目前应用于一个 FeatureTable[Frequency]对象和一个FeatureData[Sequence]对象。这些对象可以来自各种分析流程，包括qiime vsearch dereplicate-sequences（如上所示）、qiime dada2 denoise-*和qiime deblur denoise-*，或者下面所示的一个聚类过程（例如，以较低的百分比序列一致率对数据进行重新聚类）。

FeatureData[Sequence]对象中的序列两两比对（de novo 聚类）或比对参考数据库（closed-reference聚类），然后可折叠特征表FeatureTable中的特征，从而形成输入特征的新特征聚类。

无参/从头聚类

De novo clustering

特性表的无参(从头/新)聚类(De novo clustering)可以用如下命令实现。在这个例子中，聚类是按序列相似度99%的水平执行的，以创建99%的OTU。

# 5s
time qiime vsearch cluster-features-de-novo \
  --i-table table.qza \
  --i-sequences rep-seqs.qza \
  --p-perc-identity 0.99 \
  --o-clustered-table table-dn-99.qza \
  --o-clustered-sequences rep-seqs-dn-99.qza

输出对象:

table-dn-99.qza: 99%相似度聚类的OTUs表。查看 | 下载
rep-seqs-dn-99.qza: 99%相似度聚类的代表序列。查看 | 下载

该过程的输出是FeatureTable [Frequency]对象和FeatureData [Sequence]对象。 FeatureData [Sequence]对象将包含定义每个OTU聚类的**质心(centroid)**序列，即最高丰度序列。

有参聚类

Closed-reference clustering

特性表的有参聚类可以用如下方法执行。在这个例子中，聚类是在85%的一致性下对GreenGenes 13_8 85%的OTU参考数据库进行比对的。参考数据库作为FeatureData[Sequence]对象。

注释：有参OTU聚类通常以更高的相似度合并，但这里使用85%，因此本教程的用户不必下载更大的参考数据库。通常，在某个百分比处对聚集在同一百分比相似度的参考数据库执行聚类，但这并没有正确地进行基准测试，以确定它是否是执行有参聚类的最佳方法。

# 10s
time qiime vsearch cluster-features-closed-reference \
  --i-table table.qza \
  --i-sequences rep-seqs.qza \
  --i-reference-sequences 85_otus.qza \
  --p-perc-identity 0.85 \
  --o-clustered-table table-cr-85.qza \
  --o-clustered-sequences rep-seqs-cr-85.qza \
  --o-unmatched-sequences unmatched-cr-85.qza

输出对象:

table-cr-85.qza: 特征表。查看 | 下载
unmatched-cr-85.qza: 无法比对的序列。查看 | 下载
rep-seqs-cr-85.qza: 代表序列。查看 | 下载

cluster-features-closed-reference输出的结果是一个FeatureTable[Frequency]对象和一个FeatureData[Sequence]对象。在这种情况下，序列FeatureData[Sequence]对象不是定义FeatureTable中特征的序列，而是特征ID及其按85%相似度匹配序列的集合。作为输入提供的参考序列被用作定义有参OTU中的特征序列。

半有参/开放参考聚类

Open-reference clustering

像上面的有参聚类示例一样，可以使用qiime vsearch cluster-features-open-reference命令执行半有参(开放参考)聚类。

注：半有参OTU聚类通常以更高的百分比一致率执行，但这里使用85%，因此本教程的用户不必下载更大的参考数据库。通常，在某个百分比一致率对有相同百分比一致率聚类的参考数据库执行聚类，但这并没有正确地进行基准测试，以确定它是否是执行半有参(开放参考)聚类的最佳方法。

# 13s
time qiime vsearch cluster-features-open-reference \
  --i-table table.qza \
  --i-sequences rep-seqs.qza \
  --i-reference-sequences 85_otus.qza \
  --p-perc-identity 0.85 \
  --o-clustered-table table-or-85.qza \
  --o-clustered-sequences rep-seqs-or-85.qza \
  --o-new-reference-sequences new-ref-seqs-or-85.qza

输出对象:

new-ref-seqs-or-85.qza: 新参考序列。查看 | 下载
rep-seqs-or-85.qza: 代表序列。查看 | 下载
table-or-85.qza: 特征表。查看 | 下载

cluster-features-open-reference输出结果是一个FeatureTable[Frequency]对象和两个FeatureData[Sequence]对象。其中一FeatureData[Sequence]对象表示聚集的序列，而另一个对象表示新的参考序列，由用于输入的参考序列以及作为内部重新聚集步骤的一部分聚集的序列组成。

Reference

https://docs.qiime2.org/2020.2

Evan Bolyen*, Jai Ram Rideout*, Matthew R. Dillon*, Nicholas A. Bokulich*, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

译者简介

刘永鑫，博士。2008年毕业于东北农大微生物学，2014年于中科院遗传发育所获生物信息学博士，2016年遗传学博士后出站留所工作，任宏基因组学实验室工程师。目前主要研究方向为微生物组数据分析、分析方法开发与优化和科学传播，QIIME 2项目参与人。目前在***Science、Nature Biotechnology、Cell Host & Microbe、Current Opinion in Microbiology*** 等杂志发表论文20余篇。2017年7月创办“宏基因组”公众号，目前分享宏基因组、扩增子原创文章500余篇，代表博文有《扩增子图表解读、分析流程和统计绘图三部曲(21篇)》、《Nature综述：手把手教你分析菌群数据(1.8万字)》、《QIIME2中文教程(22篇)》等，关注人数8万+，累计阅读1300万+。

写在后面

为鼓励读者交流、快速解决科研困难，我们建立了“宏基因组”专业讨论群，目前己有国内外5000+ 一线科研人员加入。参与讨论，获得专业解答，欢迎分享此文至朋友圈，并扫码加主编好友带你入群，务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助，首先阅读《如何优雅的提问》学习解决问题思路，仍末解决群内讨论，问题不私聊，帮助同行。

学习扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

谈谈数次生信线下活动的收获和体会生信宝典
http://blog.genesino.com/2018/03/ampliconseqsumamry/从2017年11月份到2018年3月份，共进行了5次培训研讨活动，内容依次为转录组高级分析、生物信息作图系列R、Cytoscape及图形排版、应用Python处理生物信息数据和作图、微生物组扩增子分析、应用Linux处理生物信息数据和分析流程。从培训网站的课程顺序可以看到，最开始设计是从Linu
扩增子分析小王的学习杂记
16srDNA普遍存在于原核生物中，在生物进化中保持不变；具有高度保守序列，又有中度保守和高度变化的序列区域，因而它适用于进化距离不同的各类生物亲缘关系的研究；（9个可变区10个保守区）相对分子量大小适中，约1.5kb左右，便于测序和序列分析；种类少，含量大（约占细菌RNA含量的80％），素在大多数原核生物中rDNA都具有多个拷贝，5S、16S、23SrDNA的拷贝数相同。参考：https://m
扩增子分析 nitrostarch
exportPATH=/home/llt/miniconda2/bin:$PATHsourceactivateqiime1质控拼接join_paired_ends.py-f1_1.fq.gz-r2_2.fq.gz-mfastq-join-ojoinextract_barcodes.py-fjoin_paired/fastqjoin.join.fastq-cbarcode_single_end--b
《零基础免费学扩增子分析》视频课（含ppt及相应代码），无需转发，直接获取... 生信修炼手册人工智能大数据机器学习编程语言 java
扩增子测序是一种二代靶向测序技术，它使用PCR技术来生成称为扩增子的DNA序列。它简单、快速、应用广泛。扩增子测序可以有效地识别微生物高可变区并有效获取微生物物种的信息。扩增子测序包括16SrDNA,18SrDNA以及ITS的测序。16SrDNA是细菌分类学研究中最常用分类的marker基因信息，其序列包含9个可变区（Variableregion）和10个保守区（constantregion）。可
解读16S扩增子分析表格+代码实现 Les baleines tombent #16S
16s分析结果详解文章目录16s分析结果详解OTU表解读物种柱状图韦恩图稀释曲线Shannon-Winner曲线Rank-Abundance曲线Alpha多样性（样本内多样性）Chao1ShannonAceSimpsonAlpha多样性指数差异箱形图Beta多样性分析（样品间差异分析）PCoA分析PCA分析NMDS分析（非度量多维尺度分析）排序分析样本-物种丰度关联circos弦装图Ternary
加量不加价！扩增子新版分析流程结果解读（一） SHANGHAILINGEN 宏基因组学微生物 PacBio 科技其他
在上期内容中，我们简要介绍了扩增子新版分析流程，升级后的分析内容包含十大模块，120+分析内容，下面一起来看看具体的升级细节吧！01、差异分析基于样本分组，通过多种方法识别组间差异物种，升级前的差异分析结果中通常只包含lefse分析、anova方差分析和wilcoxon秩和检验结果，展示方式稍显单一。升级后的扩增子分析流程分别对门（Phylum）、纲（Class）、目（Order）、科（Famil
扩增子分析流程 —— 数据处理（vsearch）卢严砖扩增子分析其他
本篇文章是笔者学习了刘永鑫老师的扩增子教程以后，根据自己的学习过程总结了一篇使用vsearch工具处理序列数据得出OTU表的文章。笔者这篇文章会根据笔者自身的学习思路，每一步的数据处理都会从三个方面（是什么、为什么和怎么做）去分析展开。因为笔者以前没有接触过生信相关知识，所有生物知识还停留在高中水平，所以笔者所写的内容会比较偏向基础一些。如果本文章不符合你的需求，可以看刘永鑫老师的扩增子教程，不仅
扩增子分析全面升级！加量不加价，数据更多新玩法 SHANGHAILINGEN PacBio 微生物宏基因组学科技其他
加量不加价！扩增子标准分析流程全面升级！微生物是一类以分解代谢为主的生物类群，在微生物群落研究中，扩增子一直是了解微生物群落构成及分布的重要手段。基于markergene的扩增子测序可以反映系统中的微生物多样性的组成。常见Markergene包括细菌16SrRNA，真菌ITS和18S，功能基因包括AOA、AOB、nirK、nifH、McrA等。基于扩增子研究，我们能够得到微生物群落中物种的组成结构
加量不加价！扩增子新版分析流程结果解读（二） SHANGHAILINGEN 三代测序 PacBio 16s基因全长测序其他科技
在上期内容中，我们介绍了升级后的扩增子分析结果中的差异分析和环境因子关联分析，今天继续来了解其他的分析内容吧！一、随机森林分析随机森林是机器学习算法的一种，目的是根据已有的数据建立模型，从而实现对数据的分类和对其它指标的预测。如果目标变量是分类变量，随机森林可以进行分类；如果目标变量是连续变量，随机森林可以进行回归预测，此外在建立随机森林模型的过程中，还可以找出能够区分不同组样本间差异的关键物种或
扩增子分析2 树懒吃糖_
多个扩增子交叉设计可能存在突变漏检情况测试工具：vardictamplicon模式Filter标签在交叉区域的突变存在“AMPbias”，在不同扩增子中表现不同。
扩增子培训小结见龙在田007er2770
扩增子的定义：扩增子（amplicon）为DNA或RNA扩增的一段核苷酸序列。扩增子分析扩增子分析，指的是对生物高度保守的DNA序列进行分析，鉴定生物的种类与含量的方法，是宏基因组学的研究方法之一。amplicon.jpg注：以下扩增子均指微生物16SrDNA片段。扩增子的分析流程：采样采集微生物标本信息。提取DNA提取样本中的DNA。加接头（adapter）接头，是一段短的序列已知的核酸链，用于
基于qiime2的扩增子流程 kkkkkkang
写在前面：扩增子在微生物组领域就像分子生物学里面的PCR一样常见、有用，像繁琐的PCR一样（虽然有说明书告诉你引物、Taq酶、dNTPs等的加入量，但是每次都加也很繁琐），扩增子分析的流程也是很复杂。逐渐发展后，PCR有了mix（有了它，你只需要加水和模板就能PCR了）。为了方便自我和大家，我也把扩增子这个繁琐的流程整合成了像mix一样的东西-Amp.sh。只需要输入几个简单的参数，就可以坐等结果
Graphpad，经典绘图工具初学初探生信宝典
大多数科研文章都离不开图表，尤其是图，熟悉一些绘图软件，并将图在文章和PPT中展示出来，是科研训练的重要内容。漂亮的文章配图能给自己的工作加不少分，生信宝典推出R的系列教程ggplot2高效实用指南(可视化脚本、工具、套路、配色)讲解通过R语言绘制高颜值图。后来为了更加方便使用，生信宝典团队开发了在线绘图工具www.ehbio.com/ImageGP，支持14中常见图形和部分扩增子分析，深受欢迎，
扩增子分析：qiime2平台全流程分析华仔少年
Ampliconsequencinganalysispipelinethroughqiime2platformqiime2是扩增子数据分析的最佳平台之一，其提供了大量从原始data到统计分析的插件，尤其是它的可重复分析且可扩展插件的理念使得其成为扩增子分析首选的平台。更多知识分享请到https://zouhua.top/。Platformqiime2是扩增子数据分析的最佳平台之一，其提供了大量从原
扩增子分析：16s rRNA分析snakemake流程华仔少年
扩增子测序是分析环境微生物的常见手段，通常使用的是16srRNA片段。16srRNA分析主要有质控、去冗余、聚类OTU、去嵌合体、生成OTU表和物种注释等步骤。更多知识分享请到https://zouhua.top/。出发点最开始听人讲扩增子分析，我是云里雾里完全听不懂的蒙蔽状态。后来有幸认识了一位不辞辛苦或者说对“傻子”友好的技术达人，在他的帮助下了解了扩增子分析内的16srRNA的具体流程等。加
扩增子分析高锰酸钾配甲醛_ab83
微生太扩增子分析系列第八节：QIIME2+GalaxyPICRUSt进行16S功能预测扩增子测序是一种二代靶向测序技术，它使用PCR技术来生成称为扩增子的DNA序列，它简单、快速、应用广泛。扩增子测序可以有效地识别微生物高可变区并有效获取微生物物种的信息。扩增子测序主要包括16SrDNA测序、18SrDNA测序、ITS测序及目标区域扩增子测序等。16SrDNA是细菌分类学研究中最常用分类的mark
Rank abundance tianzhanlan
扩增子分析中，rankabundance已经是必备的一项分析内容，它可以从OTU的层面总体反应出物种的分布情况(丰度和均匀度)，如下图：image.png注：横坐标：OTU等级，“500”代表样本中按照丰度排列第500位的OTU；纵坐标：该等级OTU中序列数的相对百分含量，即属于该OTU的序列数除以总序列数，纵坐标轴上数字，例如“100”代表相对丰度为100%，“10”代表相对丰度为10%，依次类
扩增子分析——usearch+vsearch+qiime1 wanghaihua888
参考文章：1.https://www.jianshu.com/p/c72bb359f0502.http://blog.sciencenet.cn/blog-3334560-1071618.htmlusearch下载地址：https://drive5.com/software.htmlusearch安装：1.解压缩2.chmod+x/apps/users/user01/wanghhh/softwar
16S扩增子分析 | 02 去噪和聚类小虎牙儿 python linux java 数据分析 shell
读前须知nohup后台运行nohup后台运行时，要将qiime2-2019.7环境激活，否则会报错！一定要记得激活！激活！激活！nohupbash01.sh&nohup指不间断地运行，是nohangup的缩写。当运行一个进程的时候，不想让其在你退出账号时关闭，即可用nohup。nohup在不规定的情况下，所有输出内容会保存到nohup.out中。后缀&是让程序后台运行，但注意，后台运行不代表不受S
16S扩增子分析 | 05 Alpha和Beta多样性分析小虎牙儿可视化 python 机器学习大数据数据分析
利用宏基因组、16SrRNA测序等高通量测序技术分析微生物群体结构的时候，常见的有α和β多样性两个指标。Alpha多样性分析Alpha多样性主要反映样本内多样性。在肠道菌群分析中，是用来衡量个体内菌群的多样性，注意是单个个体，不涉及个体间的比较。Alpha多样性主要与两个因素有关：一是种类数目，即丰富度；二是多样性，群落中个体分配上的均匀性。通常有三类相关指数，测序深度指数（Observedspi
USEARCH —— 最简单易学的扩增子分析流程(中国总代理) 刘永鑫Adam 编程语言人工智能大数据 xhtml 机器学习
USEARCH——最简单易学的扩增子分析流程USEARCH中文帮助文档(USEARCHChinesemanual)USEARCH官方英文主页：http://www.drive5.com/usearch/本站经USEARCH作者RobertEdgar授权，由《宏基因组》公众号翻译的中文帮助文档和系列教程。USEARCH简介USEARCH是最好用的扩增子分析流程，在体积仅1MB的软件中实现了近200种
你想要的宏基因组-微生物组知识全在这(180901) 刘永鑫Adam 新闻
征稿、转载、合作文章分类导航目录精选文章推荐培训、会议、招聘广告科研经验软件和数据库扩增子分析宏基因组分析R统计绘图实验设计与技术基础知识必读综述高分文章套路解读科普视频-寓教于乐写在后面旧文删除友军文章汇总推荐欢迎点击上方蓝色”宏基因组”关注我们！本文“宏基因组”原创，更多文章点我跳转公众号阅读宏基因组/微生物组是当今世界科研最热门的研究领域之一，为加强本领域的技术交流与传播，推动中国微生物组计
扩增子统计绘图1箱线图：Alpha多样性刘永鑫Adam
本网对Markdown排版支持较差，对格式不满意的用户请跳转至或“宏基因组”公众号阅读；写在前面优秀的作品都有三部分曲，如骇客帝国、教父、指环王等。扩增子系列课程也分为三部曲：第一部《扩增子图表解读》：加速大家对同行文章的解读能力。第二部《扩增子分析解读》：学习数据分析的基本思路和流程。第三部《扩增子统计绘图》：即是对结果进行可视和统计检验，达到出版级的图表结果。《扩增子统计绘图》系列文章介绍《扩
扩增子统计绘图3热图：样品相关分析，差异OTU 刘永鑫Adam
写在前面优秀的作品都有三部分曲，如骇客帝国、教父、指环王等。扩增子系列课程也分为三部曲：第一部《扩增子图表解读》：加速大家对同行文章的解读能力。第二部《扩增子分析解读》：学习数据分析的基本思路和流程。第三部《扩增子统计绘图》：即是对结果进行可视和统计检验，达到出版级的图表结果。《扩增子统计绘图》系列文章介绍《扩增子统计绘图》是之前发布的《扩增子图表解读》和《扩增子分析解读》的进阶篇，是在大家可以看
微生物组核心OTU鉴定usearch otutab_core 刘永鑫Adam software
扩增子分析神器USEARCH简介v11新功能v11命令大全扩增子分析神器VSEARCH分析流程2.8.1中文帮助文档otutab_corehttp://www.drive5.com/usearch/manual/cmd_otutab_core.html鉴定核心微生物组——大多数样品中出现的OTUs，这也是Usearch11新增的功能。本质上是统计每个OTUs在大量样品中出现的频率。比如在所有样本中
易生信-扩增子教程02-真菌引物选择刘永鑫Adam 经验
距离上次《生信宝典》联合《宏基因组》组织的扩增子分析线下培训结束己经有三个多月了。为方便广大读者的学习，现在开始陆续分享上次培训的内部资料——理论课程课件。希望对想自学分析的朋友起到一定帮助作用。首先讲一下真菌的定义，真菌通常指的是真菌界的生物，是一类单细胞或多细胞异养真核微生物,无光合色素，细胞壁含几丁质和纤维素。按功能划分，可大致分为3类，病原菌、共生菌和腐生菌。真菌具有很高的物种多样性，据估
易生信-扩增子教程01-背景介绍刘永鑫Adam 扩增子
距离上次《生信宝典》联合《宏基因组》组织的扩增子分析线下培训结束己经有三个多月了。为方便广大读者的学习，现在开始陆续分享上次培训的内部资料——理论课程课件。希望对想自学分析的朋友起到一定帮助作用。猜你喜欢10000+：肠道细菌人体上的生命宝宝与猫狗梅毒狂想曲提DNA发Nature实验分析谁对结果影响大Cell微生物专刊系列教程：微生物组入门Biostar微生物组宏基因组专业技能：生信宝典学术图表高
16s扩增子分析注意事项和经验总结Tips 刘永鑫Adam 宏基因组 16S 扩增子分析经验
个人1年多16s/ITS扩增子分析中积累的点点滴滴，此文适合新人了解相关零散知识，也适合有分析经验的人交流与讨论。以下分析的经验，是以测序数据类型为IlluminaHiSeq2500产出的双端250数据类型(PE250)为基础。扩增测序技术选择：推荐使用PE250，性价比超高；原始数据使用fastqc质量评估，会发现数据右端末端质量较差，这是测序仪原理导致，我们在双端合并时还会利用另一端高质量序列
扩增子分析还聚OTU就真OUT了，试试unoise3 刘永鑫Adam 扩增子 software
宏基因组领域是当今热门领域，也正是方法快速发展和变革的时代。之前还把97%聚类OTU作为扩增子行业的金标准。转眼间各位大佬纷纷向OTU聚类方法拍砖，都不建议再使用。Feature代替OTU是趋势之前我翻译整理的QIIME2官方帮助文档——宏基因组扩增子最新分析流程QIIME2-了解分析趋势，读过的朋友会发现，里面的每个分析流程中都不再使用聚类方法生成OTU，而是调用DADA2[1]对原始数据进行去
扩增子分析解读2提取barcode,质控及样品拆分,切除扩增引物刘永鑫Adam 扩增子
本网对Markdown排版支持较差，请跳转“宏基因组”公众号阅读；写在前面之前发布的《扩增子图表解读》系列，相信很多朋友都看过了(链接直达7月文章目录)。这些内容的初衷是写给本领域刚进实验室的学生读，加速大家对同行文章的解读能力。如果连同行的结果都看不懂，何谈对数据的理解，对科学问题的解释。希望刚入行的小伙伴多读高水平文章，配合我的解读，定能让理解上升一个层次。《扩增子分析解读》系列文章介绍扩增子
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1