生信小白——初学 samtools

上文提到用bowtie2获得了三个sam文件,但通常会将其转化为bam文件进行查阅。

使用conda下载samtools工具,过程参考《生信小白——初学bowtie2》。


sam to bam

进入之前获得的read目录下,其中有待转化的sam文件。输入$ samtools view -bS a_20_Tsa.sam(输入sam文件) > a_20_Tsa.bam(输出bam文件) 。

分别获得对应的bam文件

以此类推获得相应的bam文件,从文件大小可以看出转换后的bam文件比sam文件要小很多。

bam文件不同于sam文件可以用文本编辑打开,因为它是一个二进制文档,不可读。因此在bam文件所在目录下输入samtools view a_0_Tsa.bam(文件名) |less -SN查看。

查看bam文件
bam文件显示的结果

sort指令

刚才的比对结果是以reads的输入顺序进行排序的,但后续分析通常是用比对到基因组的位置进行排序,这里就需要用到sort。输入samtools sort a_0_Tsa.bam(输入文件名) -o a_0_Tsa.sorted.bam(输出文件名)

得到sort后的bam文件

再次查看结果,就和之前的结果不一样了。

sort后bam文件显示的结果

bam文件的具体介绍可以看(https://www.jianshu.com/p/364e640d3c9f),非常详细。

参考及感谢

黄树嘉    从零开始完整学习全基因组测序数据分析:第5节 理解并操作BAM文件:https://www.jianshu.com/p/364e640d3c9f

你可能感兴趣的:(生信小白——初学 samtools)