刘永鑫Adam

QIIME 2教程. 09数据导入Importing data(2020.2)

文章目录

前情提要
QIIME 2用户文档. 9数据导入

导入带质量值的FASTQ测序数据

EMP标准混样单端数据
EMP混样双端数据
Casava1.8单端混样数据
Casava 1.8双端拆分后数据
**Fastq样品文件清单格式**

格式说明
**SingleEndFastqManifestPhred33V2**
**SingleEndFastqManifestPhred64V2**

fasta格式序列
代表性序列

格式说明
导入数据

对齐的fasta格式文件

格式说明
导入数据

特征表 Feature table data

BIOM v1.0.0
BIOM v2.1.0

系统发育树
其它数据类型
Reference
译者简介
猜你喜欢
写在后面

前情提要

NBT：QIIME 2可重复、交互式的微生物组分析平台
1简介和安装Introduction&Install
2插件工作流程概述Workflow
3老司机上路指南Experienced
4人体各部位微生物组分析Moving Pictures，Genome Biology：人体各部位微生物组时间序列分析
5粪菌移植分析练习FMT，Microbiome：粪菌移植改善自闭症
6沙漠土壤分析Atacama soil，mSystems：干旱对土壤微生物组的影响
7帕金森小鼠教程Parkinson’s Mouse，Cell：肠道菌群促进帕金森发生ParkinsonDisease
8差异丰度分析gneiss

QIIME 2用户文档. 9数据导入

Importing data

原文地址：https://docs.qiime2.org/2020.2/tutorials/importing/

为了使用QIIME 2，输入数据必须存储在QIIME 2对象（即qza文件）中。这是实现支持分布式和自动来源跟踪、以及语义类型验证和数据格式之间的转换所必须（有关QIIME 2对象的更多详细信息，请参阅《1简介和安装》中核心概念部分）。本教程演示如何将各种数据格式导入到QIIME 2对象中，以便使用QIIME 2开展分析。

注：本教程并没有描述QIIME 2中当前支持的所有数据格式。这是一项正在进行的工作，描述了一些最常用的可用数据格式。我们还积极支持其他数据格式。如果您需要导入的数据格式不在这里介绍，请发到QIIME 2论坛寻求帮助。

导入通常与初始化数据一起进行（例如，从测序仪获取的原始序列），但也可以在分析流程的任何步骤中执行导入。例如，如果合作者向您提供.biom格式的特征表，您可以将其导入到QIIME 2对象中，以执行对特征表进行操作的“下游”统计分析。

可以使用任何QIIME 2接口完成导入。本教程将重点介绍使用QIIME 2命令行界面（q2cli）使用qiime tools import方法导入数据。下面的每一节简要描述了一种数据格式，提供了下载示例数据的命令，并演示了如何将数据导入到QIIME 2对象中。

启动工作环境并创建工作目录

# 定义工作目录变量，方便以后多次使用
wd=~/github/QIIME2ChineseManual/2020.2
mkdir -p $wd
# 进入工作目录，是不是很简介，这样无论你在什么位置就可以快速回到项目文件夹
cd $wd

# 方法1. 进入QIIME 2 conda工作环境
conda activate qiime2-2020.2
# 这时我们的命令行前面出现 (qiime2-2020.2) 表示成功进入工作环境

# 方法2. conda版本较老用户，使用source进入QIIME 2
source activate qiime2-2020.2

# 方法3. 如果是docker安装的请运行如下命令，默认加载当前目录至/data目录
docker run --rm -v $(pwd):/data --name=qiime -it  qiime2/core:2020.2

# 创建本节学习目录
mkdir qiime2-importing-tutorial
cd qiime2-importing-tutorial

导入带质量值的FASTQ测序数据

Sequence data with sequence quality information (i.e. FASTQ)

使用QIIME 2，可以导入不同类型的fastq数据：

采用地球微生物组计划(EMP)标准方法产生的FASTQ格式数据
CASAVA 1.8多样本混合格式的FASTQ数据
任何其他类型的fastq数据

EMP标准混样单端数据

“EMP protocol” multiplexed single-end fastq

此类数据标准包括两个文件，扩展名均为fastq.gz，

一个是barcode文件，
另一个是样品混样测序数据文件。

此部分的数据己经在《4人体各部位微生物组分析》中下载过，可直接链接过来，或使用如下命令下载

# 建样品目录
mkdir -p emp-single-end-sequences

# 方法1. 链接之前第4节中的文件
ln ../qiime2-moving-pictures-tutorial/emp-single-end-sequences/*.gz emp-single-end-sequences/

# 方法2. 从头下载
# 下载 barcode文件
wget -c \
  -O "emp-single-end-sequences/barcodes.fastq.gz" \
  "https://data.qiime2.org/2019.7/tutorials/moving-pictures/emp-single-end-sequences/barcodes.fastq.gz"

# 下载序列文件
wget -c \
  -O "emp-single-end-sequences/sequences.fastq.gz" \
  "https://data.qiime2.org/2019.7/tutorials/moving-pictures/emp-single-end-sequences/sequences.fastq.gz"

导入EMP单端测序文件命令格式

# 25M，8s
time qiime tools import \
  --type EMPSingleEndSequences \
  --input-path emp-single-end-sequences \
  --output-path emp-single-end-sequences.qza

输出对象：

emp-single-end-sequences.qza：导入的EMP单端序列。查看 | 下载

EMP混样双端数据

“EMP protocol” multiplexed paired-end fastq

此类数据标准包括三个文件，扩展名均为fastq.gz，

一个是fastq.gz的正向序列文件；
一个是fastq.gz的反向序列文件；
一个是barcode文件，与序列对应。

此部分的数据己经在《6沙漠土壤分析Atacama soil》未更新中下载过，可直接硬链过来，或使用如下命令下载

# 建样品目录
mkdir -p emp-paired-end-sequences

# 方法1. 链接之前第4节中的文件
ln ../qiime2-atacama-tutorial/emp-paired-end-sequences/*.gz emp-paired-end-sequences/

# 方法2. 从头下载
# 下载序列正向和反向文件
wget -c \
  -O "emp-paired-end-sequences/forward.fastq.gz" \
  "https://data.qiime2.org/2020.2/tutorials/atacama-soils/1p/forward.fastq.gz"
wget -c \
  -O "emp-paired-end-sequences/reverse.fastq.gz" \
  "https://data.qiime2.org/2020.2/tutorials/atacama-soils/1p/reverse.fastq.gz"

# 下载barcode文件
wget -c \
-O "emp-paired-end-sequences/barcodes.fastq.gz" \
  "https://data.qiime2.org/2020.2/tutorials/atacama-soils/1p/barcodes.fastq.gz"

导入EMP双端序列为QIIME2对象

# 50M， 11s
time qiime tools import \
  --type EMPPairedEndSequences \
  --input-path emp-paired-end-sequences \
  --output-path emp-paired-end-sequences.qza

输出对象：

emp-paired-end-sequences.qza：导入的EMP单端序列。查看 | 下载

Casava1.8单端混样数据

Casava 1.8 single-end demultiplexed fastq

格式描述
在Casava 1.8单样本（单端）的格式中，有一个fastq.gz文件的包含每个样品的单端序列。样品文件名包括标识符，看起来像L2S357_15_L001_R1_001.fastq.gz。文件名中下划线分隔的区域代表的意义如下：

在样品编号；
标签barcode序列或编号；
lane编号；
序列方向（如仅有R1是由于单端序列）
子集编号。

下载并解压示例数据

# 20M
wget -c \
-O "casava-18-single-end-demultiplexed.zip" \
  "https://data.qiime2.org/2020.2/tutorials/importing/casava-18-single-end-demultiplexed.zip"

unzip -q casava-18-single-end-demultiplexed.zip

导入数据，因为样品名包括在文件名中，可直接导入

# 20M, 6s
time qiime tools import \
  --type 'SampleData[SequencesWithQuality]' \
  --input-path casava-18-single-end-demultiplexed \
  --input-format CasavaOneEightSingleLanePerSampleDirFmt \
  --output-path demux-single-end.qza

输出对象：

demux-single-end.qza：导入的EMP单端序列。查看 | 下载

Casava 1.8双端拆分后数据

Casava 1.8 paired-end demultiplexed fastq

格式同上面单端，只是每个样本有一对文件。R1和R2代表正向和反向测序结果。

下载并解压示例数据

# 9.3 M
wget -c \
-O "casava-18-paired-end-demultiplexed.zip" \
  "https://data.qiime2.org/2020.2/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

unzip -q casava-18-paired-end-demultiplexed.zip

导入数据，因为样品名包括在文件名中，可直接导入

# 9M, 6s
time qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path casava-18-paired-end-demultiplexed \
  --input-format CasavaOneEightSingleLanePerSampleDirFmt \
  --output-path demux-paired-end.qza

输出对象：

demux-paired-end.qza：导入的EMP单端序列。查看 | 下载

Fastq样品文件清单格式

“Fastq manifest” formats

划重点，这应该是普通用户最常用的格式。而且导入方式也有更新，请以最新版为准

如果你不是EMP或CASAVA格式的数据，则需要先创建一个“清单文件（“manifest file）”，然后使用qiime tools import命令，手动将数据导入到QIIME 2。

格式说明

首先，您将创建一个名为“清单文件”的文本文件，它将示例标识符映射到fastq.gz或fastq的绝对文件路径(absolute filepaths)，其中包含示例的序列和质量数据（即，这些是fastq文件）。清单文件还指示每个fastq.gz或fastq文件中的读取方向。清单文件通常由您创建，它被设计为一种简单的格式，不会拆分好的fastq.gz/fastq文件的命名设置限制，因为这些文件没有广泛使用的命名约定。您可以随意调用清单文件。同时，清单文件也是元数据格式兼容的，因此你可以清单文件作为样本元数据(Sample Metadata)的起始。

清单文件是制表符分隔（即.tsv）的文本文件。每行的第一个字段是样本名，第二个字段是绝对文件路径，第三个字段可选的反应序列文件路径。此格式与QIIME 2元数据格式]兼容。

fastq.gz文件位置的绝对文件路径可以包含环境变量（例如 $H O M E 或$ PWD）。下面的示例说明了一个简单的fastq清单文件，用于两个示例的双端数据。

sample-id     forward-absolute-filepath       reverse-absolute-filepath
sample-1      $PWD/some/filepath/sample0_R1.fastq.gz  $PWD/some/filepath/sample1_R2.fastq.gz
sample-2      $PWD/some/filepath/sample2_R1.fastq.gz  $PWD/some/filepath/sample2_R2.fastq.gz
sample-3      $PWD/some/filepath/sample3_R1.fastq.gz  $PWD/some/filepath/sample3_R2.fastq.gz
sample-4      $PWD/some/filepath/sample4_R1.fastq.gz  $PWD/some/filepath/sample4_R2.fastq.gz

在文件清单中，fastq.gq文件绝对路径必须准确，下面的示例说明了一个示例的fastq单端数据的清单文件。

sample-id     absolute-filepath
sample-1      $PWD/some/filepath/sample1_R1.fastq
sample-2      $PWD/some/filepath/sample2_R1.fastq

FastQ数据有四种常用格式变体，导入时必须将其指定为QIIME 2的类型。我们提供其中两种导入的示例：SingleEndFastqManifestPhred33V2和PairedEndFastqManifestPhred64V2，因为他们是相似的

SingleEndFastqManifestPhred33V2

质量值33类型的单端数据

注：V2是为了区别于旧版csv清单文件格式的导入。建议以新教程为准，更合理。

在这个fastq清单格式的变体中，读取方向必须都是正向或反向的。此格式假定用于所有fastq.gz/fastq文件中位置质量分数的偏移量为33(注：质量值多为大写字母)。

# 下载fastq单双端样本压缩包zip文件，和文件清单文件mainfest
wget -c \
-O "se-33.zip" \
  "https://data.qiime2.org/2020.2/tutorials/importing/se-33.zip"
wget -c \
-O "se-33-manifest" \
  "https://data.qiime2.org/2020.2/tutorials/importing/se-33-manifest"

unzip -q se-33.zip

导入质量值不同编码的两类文件Phred33/64 (一般Phred33比较常见，只有非常老的数据才有Phred64格式或测序公司非正常设置的结果，建议转换成了这个主流格式)

# 导入Phred33格式单端测序结果
qiime tools import \
  --type 'SampleData[SequencesWithQuality]' \
  --input-path se-33-manifest \
  --output-path single-end-demux.qza \
  --input-format SingleEndFastqManifestPhred33V2

输出对象：

single-end-demux.qza：导入标准fastq单端输入文件。查看 | 下载

SingleEndFastqManifestPhred64V2

质量值64类型的单端数据

在这个fastq清单格式的变体中，读取方向必须都是正向或反向的。此格式假定用于所有fastq.gz/fastq文件中位置质量分数的分段偏移量为64。在导入过程中，QIIME 2会将phred 64编码的质量分数转换为phred 33编码的质量分数。这种转换将很慢，但只会发生一次(非主流，很多软件如usearch都不支持，外部可以使用fastp、vsearch等程序转换，QIIME2会自动转换后再进行分析，查看文件质量值多为小写字母的为64类型)。

PairedEndFastqManifestPhred33V2

质量值33类型的双端数据，划重点，此类型最为常用

在这种fastq文件清单格式的变体中，每个样本ID必须有正向和反向读取fastq.gz/fastq文件。此格式假定用于所有fastq.gz/fastq文件中位置质量分数的分段偏移量为33。

PairedEndFastqManifestPhred64V2

质量值64类型的双端数据

在这种fastq文件清单格式的变体中，每个样本ID必须有正向和反向读取fastq.gz/fastq文件。此格式假定用于所有fastq.gz/fastq文件中位置质量分数的分段偏移量为64。在导入过程中，QIIME 2会将phred 64编码的质量分数转换为phred 33编码的质量分数。这种转换将很慢，但只会发生一次。

wget -c \
 -O "pe-64.zip" \
  "https://data.qiime2.org/2020.2/tutorials/importing/pe-64.zip"
wget \
 -O "pe-64-manifest" \
  "https://data.qiime2.org/2020.2/tutorials/importing/pe-64-manifest"
unzip -q pe-64.zip

# 4s
time qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path pe-64-manifest \
  --output-path paired-end-demux.qza \
  --input-format PairedEndFastqManifestPhred64V2

paired-end-demux.qza：导入标准fastq单端输入文件。查看 | 下载

fasta格式序列

Sequences without quality information (i.e. FASTA)

QIIME 2目前支持导入QIIME 1 seqs.fna文件格式，该格式由一个fasta文件组成，每条记录只有两行：header和sequence。每个序列必须正好一行，不能拆分多行。每条序列的ID必须遵循格式_的要求。是序列所属样本的标识符，是其样本中序列的标识符。

在OTU聚类教程中可以找到导入和去冗余此类数据的示例。

目前不支持其他fasta格式，如具有不同格式序列名的fasta文件或按样本分离的fasta文件（即每个样本一个fasta文件）。

代表性序列

Per-feature unaligned sequence data (i.e., representative FASTA sequences)

格式说明

未对齐的序列数据包含未对齐的DNA序列（即不包含-或.）的fasta格式文件）。序列可能包含未知的核苷酸特征，如N，但某些QIIME 2功能不支持这类字符。有关fasta格式的更多信息，请参阅scikit bio fasta格式说明。

获取示例数据

# 175 kb
wget -c \
 -O "sequences.fna" \
  "https://data.qiime2.org/2020.2/tutorials/importing/sequences.fna"

导入数据

# 5s
time qiime tools import \
  --input-path sequences.fna \
  --output-path sequences.qza \
  --type 'FeatureData[Sequence]'

输出对象：

sequences.qza：导入标准fastq单端输入文件。查看 | 下载

对齐的fasta格式文件

Per-feature aligned sequence data (i.e., aligned representative FASTA sequences)

格式说明

对齐序列数据是从一个fasta格式的文件中导入的，该文件包含相互对齐的DNA序列。所有对齐序列的长度必须完全相同。序列可能包含未知的核苷酸特征，如N，但某些QIIME 2功能不支持这类字符。有关fasta格式的更多信息，请参阅scikit bio fasta格式说明。

获取示例数据

wget -c \
  -O "aligned-sequences.fna" \
  "https://data.qiime2.org/2020.2/tutorials/importing/aligned-sequences.fna"

可能有的人不了解对齐的fasta格式，如下：有-字符，且等长

>New.CleanUp.ReferenceOTU0 K3.H_3016
-CTGGACCGTGTCTCAGTT-CCAGTGTGGCTGATCATCCT---------CTCAGACCAGC
TACCGATCGTCGCC-TTGGTGGG-CTCTTA-CCC-C-GCCAACTAGCTAATCGGGCATCG
-G-CTCATTC-AATCGCGCAAGGTCCG-----AA----------------G-ATC-CCCT
>New.CleanUp.ReferenceOTU1 K3.Z_32919
-CTGGACCGTGTCTCAGTT-CCAGTGTGGCCGTTCATCCT---------CTCAGACCGGC
TACTGATCGTTGGT-TTGGTGGG-CCGTTA-CCC-C-ACCAACTGCCTAATCAGACGCAA
-A-CCCCTCT-TCAGGCGATAGCTTACAGGTAGAGGCTA-------------CCC-TTTC

导入数据

# 4s
time qiime tools import \
  --input-path aligned-sequences.fna \
  --output-path aligned-sequences.qza \
  --type 'FeatureData[AlignedSequence]'

输出对象：

aligned-sequences.qza：对齐的fasta序列。查看 | 下载

特征表 Feature table data

你可以导入预处理的特征进入QIIME 2分析

BIOM v1.0.0

关于BIOM格式说明，详见《BIOM：生物观测矩阵——微生物组数据通用数据格式》，或BIOM v1.0.0 format specification英文格式说明。

下载数据并导入为QIIME2的qza格式

wget -c \
  -O "feature-table-v100.biom" \
  "https://data.qiime2.org/2020.2/tutorials/importing/feature-table-v100.biom"
  
time qiime tools import \
  --input-path feature-table-v100.biom \
  --type 'FeatureTable[Frequency]' \
  --input-format BIOMV100Format \
  --output-path feature-table-1.qza

输出对象：

feature-table-1.qza：导入特征表。查看 | 下载

BIOM v2.1.0

BIOM v2.1.0 格式详细信息

wget -c \
  -O "feature-table-v210.biom" \
  "https://data.qiime2.org/2020.2/tutorials/importing/feature-table-v210.biom"

time qiime tools import \
  --input-path feature-table-v210.biom \
  --type 'FeatureTable[Frequency]' \
  --input-format BIOMV210Format \
  --output-path feature-table-2.qza

输出对象：

feature-table-2.qza：导入的特征表。查看 | 下载

系统发育树

Phylogenetic trees

通常为newick格式。详细说明见scikit-bio newick格式描述

wget -c \
  -O "unrooted-tree.tre" \
  "https://data.qiime2.org/2020.2/tutorials/importing/unrooted-tree.tre"
  
time qiime tools import \
  --input-path unrooted-tree.tre \
  --output-path unrooted-tree.qza \
  --type 'Phylogeny[Unrooted]'

输出对象：

unrooted-tree.qza：导入的无根树文件。查看 |
下载

其它数据类型

Other data types

QIIME2支持多达58种数据格式，可用如下命令查看

qiime tools import \
  --show-importable-formats

支持的68种格式如下：

AlignedDNAFASTAFormat
AlignedDNASequencesDirectoryFormat
AlphaDiversityDirectoryFormat
AlphaDiversityFormat
BIOMV100DirFmt
BIOMV100Format
BIOMV210DirFmt
BIOMV210Format
BooleanSeriesDirectoryFormat
BooleanSeriesFormat
CasavaOneEightLanelessPerSampleDirFmt
CasavaOneEightSingleLanePerSampleDirFmt
DADA2StatsDirFmt
DADA2StatsFormat
DNAFASTAFormat
DNASequencesDirectoryFormat
DeblurStatsDirFmt
DeblurStatsFmt
DifferentialDirectoryFormat
DifferentialFormat
DistanceMatrixDirectoryFormat
EMPPairedEndCasavaDirFmt
EMPPairedEndDirFmt
EMPSingleEndCasavaDirFmt
EMPSingleEndDirFmt
ErrorCorrectionDetailsDirFmt
FastqGzFormat
FirstDifferencesDirectoryFormat
FirstDifferencesFormat
HeaderlessTSVTaxonomyDirectoryFormat
HeaderlessTSVTaxonomyFormat
ImportanceDirectoryFormat
ImportanceFormat
LSMatFormat
MultiplexedPairedEndBarcodeInSequenceDirFmt
MultiplexedSingleEndBarcodeInSequenceDirFmt
NewickDirectoryFormat
NewickFormat
OrdinationDirectoryFormat
OrdinationFormat
PairedDNASequencesDirectoryFormat
PairedEndFastqManifestPhred33
PairedEndFastqManifestPhred33V2
PairedEndFastqManifestPhred64
PairedEndFastqManifestPhred64V2
PlacementsDirFmt
PlacementsFormat
PredictionsDirectoryFormat
PredictionsFormat
ProbabilitiesDirectoryFormat
ProbabilitiesFormat
QIIME1DemuxDirFmt
QIIME1DemuxFormat
QualityFilterStatsDirFmt
QualityFilterStatsFmt
SampleEstimatorDirFmt
SeppReferenceDirFmt
SingleEndFastqManifestPhred33
SingleEndFastqManifestPhred33V2
SingleEndFastqManifestPhred64
SingleEndFastqManifestPhred64V2
SingleLanePerSamplePairedEndFastqDirFmt
SingleLanePerSampleSingleEndFastqDirFmt
TSVTaxonomyDirectoryFormat
TSVTaxonomyFormat
TaxonomicClassiferTemporaryPickleDirFmt
UchimeStatsDirFmt
UchimeStatsFmt

可导入的文件类型有哪些呢？

qiime tools import \
  --show-importable-types

也有多达41种：

DeblurStats
DistanceMatrix
EMPPairedEndSequences
EMPSingleEndSequences
ErrorCorrectionDetails
FeatureData[AlignedSequence]
FeatureData[Differential]
FeatureData[Importance]
FeatureData[PairedEndSequence]
FeatureData[Sequence]
FeatureData[Taxonomy]
FeatureTable[Balance]
FeatureTable[Composition]
FeatureTable[Frequency]
FeatureTable[PercentileNormalized]
FeatureTable[PresenceAbsence]
FeatureTable[RelativeFrequency]
Hierarchy
MultiplexedPairedEndBarcodeInSequence
MultiplexedSingleEndBarcodeInSequence
PCoAResults
Phylogeny[Rooted]
Phylogeny[Unrooted]
Placements
QualityFilterStats
RawSequences
SampleData[AlphaDiversity]
SampleData[BooleanSeries]
SampleData[ClassifierPredictions]
SampleData[DADA2Stats]
SampleData[FirstDifferences]
SampleData[JoinedSequencesWithQuality]
SampleData[PairedEndSequencesWithQuality]
SampleData[Probabilities]
SampleData[RegressorPredictions]
SampleData[SequencesWithQuality]
SampleData[Sequences]
SampleEstimator[Classifier]
SampleEstimator[Regressor]
TaxonomicClassifier
UchimeStats

不幸的是，目前没有文档详细说明可以将哪些数据格式导入为哪种QIIME 2数据类型，但是希望这些格式和类型的名称应该是不言自明的，足以弄清楚。如有任何疑问，请发布至QIIME 2论坛寻求帮助！

Reference

https://docs.qiime2.org/2020.2/

Evan Bolyen*, Jai Ram Rideout*, Matthew R. Dillon*, Nicholas A. Bokulich*, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

译者简介

刘永鑫，博士。2008年毕业于东北农大微生物学，2014年于中科院遗传发育所获生物信息学博士，2016年遗传学博士后出站留所工作，任宏基因组学实验室工程师。目前主要研究方向为宏基因组数据分析和植物微生物组，QIIME 2项目参与人。目前在***Science、Nature Biotechnology、Cell Host & Microbe、Current Opinion in Microbiology*** 等杂志发表论文20+篇。2017年7月创办“宏基因组”公众号，目前分享宏基因组、扩增子原创文章500余篇，代表博文有《扩增子图表解读、分析流程和统计绘图三部曲(21篇)》、《Nature综述：手把手教你分析菌群数据(1.8万字)》、《QIIME2中文教程(22篇)》等，关注人数8万+，累计阅读1200万+。

写在后面

为鼓励读者交流、快速解决科研困难，我们建立了“宏基因组”专业讨论群，目前己有国内外5000+ 一线科研人员加入。参与讨论，获得专业解答，欢迎分享此文至朋友圈，并扫码加主编好友带你入群，务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助，首先阅读《如何优雅的提问》学习解决问题思路，仍末解决群内讨论，问题不私聊，帮助同行。

学习扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA 未更新

你可能感兴趣的:(扩增子分析)

谈谈数次生信线下活动的收获和体会生信宝典
http://blog.genesino.com/2018/03/ampliconseqsumamry/从2017年11月份到2018年3月份，共进行了5次培训研讨活动，内容依次为转录组高级分析、生物信息作图系列R、Cytoscape及图形排版、应用Python处理生物信息数据和作图、微生物组扩增子分析、应用Linux处理生物信息数据和分析流程。从培训网站的课程顺序可以看到，最开始设计是从Linu
扩增子分析小王的学习杂记
16srDNA普遍存在于原核生物中，在生物进化中保持不变；具有高度保守序列，又有中度保守和高度变化的序列区域，因而它适用于进化距离不同的各类生物亲缘关系的研究；（9个可变区10个保守区）相对分子量大小适中，约1.5kb左右，便于测序和序列分析；种类少，含量大（约占细菌RNA含量的80％），素在大多数原核生物中rDNA都具有多个拷贝，5S、16S、23SrDNA的拷贝数相同。参考：https://m
扩增子分析 nitrostarch
exportPATH=/home/llt/miniconda2/bin:$PATHsourceactivateqiime1质控拼接join_paired_ends.py-f1_1.fq.gz-r2_2.fq.gz-mfastq-join-ojoinextract_barcodes.py-fjoin_paired/fastqjoin.join.fastq-cbarcode_single_end--b
《零基础免费学扩增子分析》视频课（含ppt及相应代码），无需转发，直接获取... 生信修炼手册人工智能大数据机器学习编程语言 java
扩增子测序是一种二代靶向测序技术，它使用PCR技术来生成称为扩增子的DNA序列。它简单、快速、应用广泛。扩增子测序可以有效地识别微生物高可变区并有效获取微生物物种的信息。扩增子测序包括16SrDNA,18SrDNA以及ITS的测序。16SrDNA是细菌分类学研究中最常用分类的marker基因信息，其序列包含9个可变区（Variableregion）和10个保守区（constantregion）。可
解读16S扩增子分析表格+代码实现 Les baleines tombent #16S
16s分析结果详解文章目录16s分析结果详解OTU表解读物种柱状图韦恩图稀释曲线Shannon-Winner曲线Rank-Abundance曲线Alpha多样性（样本内多样性）Chao1ShannonAceSimpsonAlpha多样性指数差异箱形图Beta多样性分析（样品间差异分析）PCoA分析PCA分析NMDS分析（非度量多维尺度分析）排序分析样本-物种丰度关联circos弦装图Ternary
加量不加价！扩增子新版分析流程结果解读（一） SHANGHAILINGEN 宏基因组学微生物 PacBio 科技其他
在上期内容中，我们简要介绍了扩增子新版分析流程，升级后的分析内容包含十大模块，120+分析内容，下面一起来看看具体的升级细节吧！01、差异分析基于样本分组，通过多种方法识别组间差异物种，升级前的差异分析结果中通常只包含lefse分析、anova方差分析和wilcoxon秩和检验结果，展示方式稍显单一。升级后的扩增子分析流程分别对门（Phylum）、纲（Class）、目（Order）、科（Famil
扩增子分析流程 —— 数据处理（vsearch）卢严砖扩增子分析其他
本篇文章是笔者学习了刘永鑫老师的扩增子教程以后，根据自己的学习过程总结了一篇使用vsearch工具处理序列数据得出OTU表的文章。笔者这篇文章会根据笔者自身的学习思路，每一步的数据处理都会从三个方面（是什么、为什么和怎么做）去分析展开。因为笔者以前没有接触过生信相关知识，所有生物知识还停留在高中水平，所以笔者所写的内容会比较偏向基础一些。如果本文章不符合你的需求，可以看刘永鑫老师的扩增子教程，不仅
扩增子分析全面升级！加量不加价，数据更多新玩法 SHANGHAILINGEN PacBio 微生物宏基因组学科技其他
加量不加价！扩增子标准分析流程全面升级！微生物是一类以分解代谢为主的生物类群，在微生物群落研究中，扩增子一直是了解微生物群落构成及分布的重要手段。基于markergene的扩增子测序可以反映系统中的微生物多样性的组成。常见Markergene包括细菌16SrRNA，真菌ITS和18S，功能基因包括AOA、AOB、nirK、nifH、McrA等。基于扩增子研究，我们能够得到微生物群落中物种的组成结构
加量不加价！扩增子新版分析流程结果解读（二） SHANGHAILINGEN 三代测序 PacBio 16s基因全长测序其他科技
在上期内容中，我们介绍了升级后的扩增子分析结果中的差异分析和环境因子关联分析，今天继续来了解其他的分析内容吧！一、随机森林分析随机森林是机器学习算法的一种，目的是根据已有的数据建立模型，从而实现对数据的分类和对其它指标的预测。如果目标变量是分类变量，随机森林可以进行分类；如果目标变量是连续变量，随机森林可以进行回归预测，此外在建立随机森林模型的过程中，还可以找出能够区分不同组样本间差异的关键物种或
扩增子分析2 树懒吃糖_
多个扩增子交叉设计可能存在突变漏检情况测试工具：vardictamplicon模式Filter标签在交叉区域的突变存在“AMPbias”，在不同扩增子中表现不同。
扩增子培训小结见龙在田007er2770
扩增子的定义：扩增子（amplicon）为DNA或RNA扩增的一段核苷酸序列。扩增子分析扩增子分析，指的是对生物高度保守的DNA序列进行分析，鉴定生物的种类与含量的方法，是宏基因组学的研究方法之一。amplicon.jpg注：以下扩增子均指微生物16SrDNA片段。扩增子的分析流程：采样采集微生物标本信息。提取DNA提取样本中的DNA。加接头（adapter）接头，是一段短的序列已知的核酸链，用于
基于qiime2的扩增子流程 kkkkkkang
写在前面：扩增子在微生物组领域就像分子生物学里面的PCR一样常见、有用，像繁琐的PCR一样（虽然有说明书告诉你引物、Taq酶、dNTPs等的加入量，但是每次都加也很繁琐），扩增子分析的流程也是很复杂。逐渐发展后，PCR有了mix（有了它，你只需要加水和模板就能PCR了）。为了方便自我和大家，我也把扩增子这个繁琐的流程整合成了像mix一样的东西-Amp.sh。只需要输入几个简单的参数，就可以坐等结果
Graphpad，经典绘图工具初学初探生信宝典
大多数科研文章都离不开图表，尤其是图，熟悉一些绘图软件，并将图在文章和PPT中展示出来，是科研训练的重要内容。漂亮的文章配图能给自己的工作加不少分，生信宝典推出R的系列教程ggplot2高效实用指南(可视化脚本、工具、套路、配色)讲解通过R语言绘制高颜值图。后来为了更加方便使用，生信宝典团队开发了在线绘图工具www.ehbio.com/ImageGP，支持14中常见图形和部分扩增子分析，深受欢迎，
扩增子分析：qiime2平台全流程分析华仔少年
Ampliconsequencinganalysispipelinethroughqiime2platformqiime2是扩增子数据分析的最佳平台之一，其提供了大量从原始data到统计分析的插件，尤其是它的可重复分析且可扩展插件的理念使得其成为扩增子分析首选的平台。更多知识分享请到https://zouhua.top/。Platformqiime2是扩增子数据分析的最佳平台之一，其提供了大量从原
扩增子分析：16s rRNA分析snakemake流程华仔少年
扩增子测序是分析环境微生物的常见手段，通常使用的是16srRNA片段。16srRNA分析主要有质控、去冗余、聚类OTU、去嵌合体、生成OTU表和物种注释等步骤。更多知识分享请到https://zouhua.top/。出发点最开始听人讲扩增子分析，我是云里雾里完全听不懂的蒙蔽状态。后来有幸认识了一位不辞辛苦或者说对“傻子”友好的技术达人，在他的帮助下了解了扩增子分析内的16srRNA的具体流程等。加
扩增子分析高锰酸钾配甲醛_ab83
微生太扩增子分析系列第八节：QIIME2+GalaxyPICRUSt进行16S功能预测扩增子测序是一种二代靶向测序技术，它使用PCR技术来生成称为扩增子的DNA序列，它简单、快速、应用广泛。扩增子测序可以有效地识别微生物高可变区并有效获取微生物物种的信息。扩增子测序主要包括16SrDNA测序、18SrDNA测序、ITS测序及目标区域扩增子测序等。16SrDNA是细菌分类学研究中最常用分类的mark
Rank abundance tianzhanlan
扩增子分析中，rankabundance已经是必备的一项分析内容，它可以从OTU的层面总体反应出物种的分布情况(丰度和均匀度)，如下图：image.png注：横坐标：OTU等级，“500”代表样本中按照丰度排列第500位的OTU；纵坐标：该等级OTU中序列数的相对百分含量，即属于该OTU的序列数除以总序列数，纵坐标轴上数字，例如“100”代表相对丰度为100%，“10”代表相对丰度为10%，依次类
扩增子分析——usearch+vsearch+qiime1 wanghaihua888
参考文章：1.https://www.jianshu.com/p/c72bb359f0502.http://blog.sciencenet.cn/blog-3334560-1071618.htmlusearch下载地址：https://drive5.com/software.htmlusearch安装：1.解压缩2.chmod+x/apps/users/user01/wanghhh/softwar
16S扩增子分析 | 02 去噪和聚类小虎牙儿 python linux java 数据分析 shell
读前须知nohup后台运行nohup后台运行时，要将qiime2-2019.7环境激活，否则会报错！一定要记得激活！激活！激活！nohupbash01.sh&nohup指不间断地运行，是nohangup的缩写。当运行一个进程的时候，不想让其在你退出账号时关闭，即可用nohup。nohup在不规定的情况下，所有输出内容会保存到nohup.out中。后缀&是让程序后台运行，但注意，后台运行不代表不受S
16S扩增子分析 | 05 Alpha和Beta多样性分析小虎牙儿可视化 python 机器学习大数据数据分析
利用宏基因组、16SrRNA测序等高通量测序技术分析微生物群体结构的时候，常见的有α和β多样性两个指标。Alpha多样性分析Alpha多样性主要反映样本内多样性。在肠道菌群分析中，是用来衡量个体内菌群的多样性，注意是单个个体，不涉及个体间的比较。Alpha多样性主要与两个因素有关：一是种类数目，即丰富度；二是多样性，群落中个体分配上的均匀性。通常有三类相关指数，测序深度指数（Observedspi
USEARCH —— 最简单易学的扩增子分析流程(中国总代理) 刘永鑫Adam 编程语言人工智能大数据 xhtml 机器学习
USEARCH——最简单易学的扩增子分析流程USEARCH中文帮助文档(USEARCHChinesemanual)USEARCH官方英文主页：http://www.drive5.com/usearch/本站经USEARCH作者RobertEdgar授权，由《宏基因组》公众号翻译的中文帮助文档和系列教程。USEARCH简介USEARCH是最好用的扩增子分析流程，在体积仅1MB的软件中实现了近200种
你想要的宏基因组-微生物组知识全在这(180901) 刘永鑫Adam 新闻
征稿、转载、合作文章分类导航目录精选文章推荐培训、会议、招聘广告科研经验软件和数据库扩增子分析宏基因组分析R统计绘图实验设计与技术基础知识必读综述高分文章套路解读科普视频-寓教于乐写在后面旧文删除友军文章汇总推荐欢迎点击上方蓝色”宏基因组”关注我们！本文“宏基因组”原创，更多文章点我跳转公众号阅读宏基因组/微生物组是当今世界科研最热门的研究领域之一，为加强本领域的技术交流与传播，推动中国微生物组计
扩增子统计绘图1箱线图：Alpha多样性刘永鑫Adam
本网对Markdown排版支持较差，对格式不满意的用户请跳转至或“宏基因组”公众号阅读；写在前面优秀的作品都有三部分曲，如骇客帝国、教父、指环王等。扩增子系列课程也分为三部曲：第一部《扩增子图表解读》：加速大家对同行文章的解读能力。第二部《扩增子分析解读》：学习数据分析的基本思路和流程。第三部《扩增子统计绘图》：即是对结果进行可视和统计检验，达到出版级的图表结果。《扩增子统计绘图》系列文章介绍《扩
扩增子统计绘图3热图：样品相关分析，差异OTU 刘永鑫Adam
写在前面优秀的作品都有三部分曲，如骇客帝国、教父、指环王等。扩增子系列课程也分为三部曲：第一部《扩增子图表解读》：加速大家对同行文章的解读能力。第二部《扩增子分析解读》：学习数据分析的基本思路和流程。第三部《扩增子统计绘图》：即是对结果进行可视和统计检验，达到出版级的图表结果。《扩增子统计绘图》系列文章介绍《扩增子统计绘图》是之前发布的《扩增子图表解读》和《扩增子分析解读》的进阶篇，是在大家可以看
微生物组核心OTU鉴定usearch otutab_core 刘永鑫Adam software
扩增子分析神器USEARCH简介v11新功能v11命令大全扩增子分析神器VSEARCH分析流程2.8.1中文帮助文档otutab_corehttp://www.drive5.com/usearch/manual/cmd_otutab_core.html鉴定核心微生物组——大多数样品中出现的OTUs，这也是Usearch11新增的功能。本质上是统计每个OTUs在大量样品中出现的频率。比如在所有样本中
易生信-扩增子教程02-真菌引物选择刘永鑫Adam 经验
距离上次《生信宝典》联合《宏基因组》组织的扩增子分析线下培训结束己经有三个多月了。为方便广大读者的学习，现在开始陆续分享上次培训的内部资料——理论课程课件。希望对想自学分析的朋友起到一定帮助作用。首先讲一下真菌的定义，真菌通常指的是真菌界的生物，是一类单细胞或多细胞异养真核微生物,无光合色素，细胞壁含几丁质和纤维素。按功能划分，可大致分为3类，病原菌、共生菌和腐生菌。真菌具有很高的物种多样性，据估
易生信-扩增子教程01-背景介绍刘永鑫Adam 扩增子
距离上次《生信宝典》联合《宏基因组》组织的扩增子分析线下培训结束己经有三个多月了。为方便广大读者的学习，现在开始陆续分享上次培训的内部资料——理论课程课件。希望对想自学分析的朋友起到一定帮助作用。猜你喜欢10000+：肠道细菌人体上的生命宝宝与猫狗梅毒狂想曲提DNA发Nature实验分析谁对结果影响大Cell微生物专刊系列教程：微生物组入门Biostar微生物组宏基因组专业技能：生信宝典学术图表高
16s扩增子分析注意事项和经验总结Tips 刘永鑫Adam 宏基因组 16S 扩增子分析经验
个人1年多16s/ITS扩增子分析中积累的点点滴滴，此文适合新人了解相关零散知识，也适合有分析经验的人交流与讨论。以下分析的经验，是以测序数据类型为IlluminaHiSeq2500产出的双端250数据类型(PE250)为基础。扩增测序技术选择：推荐使用PE250，性价比超高；原始数据使用fastqc质量评估，会发现数据右端末端质量较差，这是测序仪原理导致，我们在双端合并时还会利用另一端高质量序列
扩增子分析还聚OTU就真OUT了，试试unoise3 刘永鑫Adam 扩增子 software
宏基因组领域是当今热门领域，也正是方法快速发展和变革的时代。之前还把97%聚类OTU作为扩增子行业的金标准。转眼间各位大佬纷纷向OTU聚类方法拍砖，都不建议再使用。Feature代替OTU是趋势之前我翻译整理的QIIME2官方帮助文档——宏基因组扩增子最新分析流程QIIME2-了解分析趋势，读过的朋友会发现，里面的每个分析流程中都不再使用聚类方法生成OTU，而是调用DADA2[1]对原始数据进行去
扩增子分析解读2提取barcode,质控及样品拆分,切除扩增引物刘永鑫Adam 扩增子
本网对Markdown排版支持较差，请跳转“宏基因组”公众号阅读；写在前面之前发布的《扩增子图表解读》系列，相信很多朋友都看过了(链接直达7月文章目录)。这些内容的初衷是写给本领域刚进实验室的学生读，加速大家对同行文章的解读能力。如果连同行的结果都看不懂，何谈对数据的理解，对科学问题的解释。希望刚入行的小伙伴多读高水平文章，配合我的解读，定能让理解上升一个层次。《扩增子分析解读》系列文章介绍扩增子
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

QIIME 2教程. 09数据导入Importing data(2020.2)

文章目录

前情提要

QIIME 2用户文档. 9数据导入

导入带质量值的FASTQ测序数据

EMP标准混样单端数据

EMP混样双端数据

Casava1.8单端混样数据

Casava 1.8双端拆分后数据

Fastq样品文件清单格式

格式说明

SingleEndFastqManifestPhred33V2

SingleEndFastqManifestPhred64V2

fasta格式序列

代表性序列

格式说明

导入数据

对齐的fasta格式文件

格式说明

导入数据

特征表 Feature table data

BIOM v1.0.0

BIOM v2.1.0

系统发育树

其它数据类型

Reference

译者简介

猜你喜欢

写在后面

你可能感兴趣的:(扩增子分析)