2019-12-20 学习记录4

bowtie2
测序数据分析软件,Bowtie是一个超快的,存储高效的短序列片段比对程序。它能够以每小时处理2500万35bp reads的速度,将短的DNA序列片段(reads)比对到人类基因组上。

对参考序列构建index

bowtie2-build genome.fasta index
bowtie2 [options]* -x  {-1 -2  | -U } -S []
bowtie2   -x all_contamination_ref.db -p 10 --very-sensitive 
-1 01_cleandata/${infile}/${infile}_clean_R1.fq 
-2 01_cleandata/${infile}/${infile}_clean_R2.fq 
--un-conc 02_removed_host/${infile}/${infile}_paired_clean%.fq 
--al-conc 02_removed_host/${infile}/${infile}_paired_contam%.fq

必须参数:
-x 由bowtie2-build所生成的索引文件的前缀。
-1 双末端测寻对应的文件1。可以为多个文件,并用逗号分开;多个文件必须和-2中制定的文件一一对应。比如:"-1flyA_1.fq,flyB_1.fq -2 flyA_2.fq,flyB_2.fq".测序文件中的reads的长度可以不一样。
-2 双末端测寻对应的文件2.
-U 非双末端测寻对应的文件。可以为多个文件,并用逗号分开。测序文件中的reads的长度可以不一样。
-S 所生成的SAM格式的文件前缀。默认是输入到标准输出。

输出参数
-t/--time --un 将unpaired reads写入到.
--un-gz 将unpairedreads写入到, gzip压缩.
--un-bz2 将unpairedreads写入到, bz2压缩.

--al 将至少能比对1次以上的unpairedreads写入.
--al-gz ... ,gzip压缩.
--al-bz2 ... ,bz2压缩.

--un-conc 将不能和谐比对的paired-endreads写入.
--un-conc-gz ... ,gzip压缩.
--un-conc-bz2 ... ,bz2压缩.

--al-conc 将至少能和谐比对一次以上的paired-endreads写入.
--al-conc-gz ... ,gzip压缩.
--al-conc-bz2 ... ,bz2压缩.

下载

wget https://nchc.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.3.5.1/bowtie2-2.3.5.1-linux-x86_64.zip
unzip bowtie2-2.3.5.1-linux-x86_64.zip
vim ~/.bashrc
export PATH="/data/hushy/tools/bowtie2:$PATH"
source ~/.bashrc  # source命令通常用于重新执行刚修改的初始化文件
bowtie2 --help

bowtie和bowtie2用法详解
Linux---bowtie2比对软件的安装及用法
生信软件 | bowtie2(测序序列与参考序列比对)

你可能感兴趣的:(2019-12-20 学习记录4)