生物信息学习——bowtie2使用手册

原文网址:http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml

用法

bowtie2 [options]* -x {-1 -2 | -U } -S []

主要参数

-x

参考基因组(reference genome)通过bowtie2-build指令在Index文件中的索引文件的前缀,此前缀不包含索引文件的 .1.bt2 / .rev.1.bt2 / etc. bowtie2 等。首先实在当前目录中搜索(即在当前目录的基础下通过你的搜索路径找到index文件夹中的文件),然后再自定义的环境变量BOWTIE_INDEXES中搜索。路径有误会找不到index中的文件

-1

文件1,一般在文件reads中(与index文件并列),以_1.fq为后缀。可以写多个文件但是必须用逗号隔开,规定文件1与文件2必须一一对应(相同的格式)。测序文件中的Reads的长度可以不同。

-2

双末端测寻对应的文件2,规定与文件1相同

-U

与前面的文件1,文件2为或的关系,此处的文件是非双末端比对文件。例如lane1.fq,lane2.fq,lane3.fq,lane4.fq。可以是多个文件,但是必须用逗号隔开。

-S

输出文件,后缀是sam的格式的文件,默认标准输出

 

输入操作

 

-q

Reads(用指定)是FASTQ格式的文件。 FASTQ文件通常具有扩展名.fq或.fastq。 FASTQ是默认格式。 参见:--solexa-quals和--int-quals。

--qseq

Reads(用指定)是QSEQ格式的文件。 QSEQ文件通常具有扩展名_qseq.txt。参见:--solexa-quals和--int-quals。

-f

Reads(用指定)是FASTA文件。 FASTA文件通常具有扩展名.fa,.fasta,.mfa,.fna或类似名称。当设置-f时,--ignore-quals也被设置了。

-r

Reads(用指定),每行代表一个输入序列,没有任何其他信息(无read名称,无qualities)。 当-r设置时,--ignore-quals也被设置。

-c

后面直接是比对的reads序列 ,即reads序列在命令行上给出。 也就是说 是逗号分隔的reads列表,而不是包含序列的reads文件的列表。 因此没有办法指定读取名称或质量,-c也意味着--ignore-quals设置了。

-s/--skip

中是数字,inputreads跳过前readspairs

-u/--qupto

比对前reads或read pairs(在用-s/--skip 跳过reads或pairs后),然后停止。 默认值:无限制。

-5/--trim5

剪掉5’(左)端长度的碱基,再用于比对(默认值:0

-3/--trim3

剪掉3’(右)端长度的碱基,再用于比对(默认值:0

--phred33

输入的碱基质量等于ASCII码值加上33.最近的 Illumina pipelines中运用

--phred64

输入的碱基质量等于ASCII码值加64.

--solexa-quals

将Solexa(可以是负数)的碱基质量转换为Phred(不能)。 此方案用于较旧的Illumina GA Pipeline版本(1.3之前)。 默认值:off

--int-quals

输入文件中的碱基质量用“”隔开,而不是ASCII码字符,如40 40 30 40,默认值:off

 

你可能感兴趣的:(生物信息学习)