用bowtie2去除fastq文件中的rRNA

一、在NCBI上下载rRNA的fasta序列,用于建立索引

1.参考:https://ucdavis-bioinformatics-training.github.io/2017-June-RNA-Seq-Workshop/wednesday/contamination.html

2.下载步骤

2.1 打开NCBI,select “Taxonomy” and search for “Homo sapiens“


2.2 点击 Homo sapiens


2.3 再点一次


用bowtie2去除fastq文件中的rRNA_第1张图片

2.4 右边表格Click on the “Subtree links” for Nucleotide:


用bowtie2去除fastq文件中的rRNA_第2张图片

2.5 左边选择rRNA


用bowtie2去除fastq文件中的rRNA_第3张图片

2.6 下载FASTA 数据

注意:选择显示两百个,让所有记录都放在一页,以便下载全部的条目

用bowtie2去除fastq文件中的rRNA_第4张图片

另存为:

hg38_rRNA.fasta

二、bowtie2建立rRNA索引

1.解压 hg38_rRNA.fa.gz

2. 建立索引(index)命令:bowtie2-build hg38_rRNA.fa hg38_rRNA

三、利用bowtie2去除rRNA

1.针对单端测序文件(single-end)

命令: bowtie2 -x ~/RNASEQ/index/rRNA_index/hg38_rRNA --un-gz ${i}_IP_rmrRNA.fastq.gz -U ${i}_IP.read1_Clean.fastq.gz -p 8 -S ${i}_rRNA.sam; rm ${i}_rRNA.sam

2.针对双端测序文件(paired-end)

命令:bowtie2 -x ~/RNASEQ/index/rRNA_index/hg38_rRNA --un-conc-gz ${i}_input_rmrRNA.fastq.gz (会生成.1、.2后缀的两个双端文件,就是去除了rRNA的fastq) -1 ${i}_in.read1_Clean.fastq.gz -2 ${i}_in.read2_Clean.fastq.gz -p 8 -S ${i}_rRNA.sam; rm ${i}_rRNA.sam; 

你可能感兴趣的:(用bowtie2去除fastq文件中的rRNA)