利用samtools将sam格式的文件与bam格式的文件进行相互转换

bowtie2是当今流行的序列比对软件,其输出结果为sam后缀名的文件

sam格式是一种通用的比对格式,用来存储reads到参考序列的比对信息SAM是一种序列比对格式标准, 由sanger制定,是以TAB为分割符的文本格式。

主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多

重比对结果

而bam格式文件可以理解为时sam格式文件的二进制保存

在进行下一步的转录本组装时要用到cufflinks软件,而cufflinks只接受bam格式的文件作为输入,所以我们要把sam格式的文件转换为bam格式的文件以便进行下一步操作 samtools可以有效地帮我们解决这个问题

samtools view [-bhuHS] [-t in.reList] [-o output] [-f repFlag] [-F skipFlag] [-q minMapQ] [-l library]

[-r read]

-b 以BAM格式输出,可以用于samtools的后续分析

-u 以未压缩的BAM格式输出,可以节约时间,一般在管道执行时使用

-h 在结果中包含头header

-H 只输出头  -S 输入文件为SAM格式,如果确实@SQ头,则需要-t选项

sam转化为bam

samtools view -bS aln.sam > aln.bam

bam转化为sam

samtools view -h -o aln.sam aln.bam

另外在利用cufflinks对转录本进行拼接时,cufflinks还需要我们把转换后的bam格式文件进行排序


samtools sort aln.bam >aln.sorted_bam

建议使用tophat2+cufflinks的软件组合进行转录组的比对和分析

具体教程会在后面更新

你可能感兴趣的:(利用samtools将sam格式的文件与bam格式的文件进行相互转换)