比对软件|Samtools

Samtools 是一组实用程序,用于操作 SAM(序列比对/映射)、BAM 和 CRAM 格式的比对。它在格式之间进行转换,进行排序、合并和索引,并且可以快速检索任何区域中的读取。被广泛应用在分析流程中。接下来小编就为大家介绍一下Samtools吧!

安装方法

方法一:
下载安装包一步步安装,链接地址为:https://github.com/samtools/samtools/releases/(在此就不做演示)
方法二:
使用conda(建议使用这种方法,简单方便)

conda install samtools

安装成功后,在终端输入samtools,出现如下界面后,表示安装成功.
比对软件|Samtools_第1张图片

SAM文件和BAM文件

1.SAM(Sequence Alignment/Map)格式是一种通用的比对格式,用来存储reads到参考序列的比对信息。SAM是一种序列比对格式标准,由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。SAM分为两部分,注释信息(header section)和比对结果部分(alignment section)。
2.BAM是SAM的二进制文件,bam文件优点:bam文件为二进制文件,占用的磁盘空间比sam文本文件小;利用bam二进制文件的运算速度快。
对比如下:
比对软件|Samtools_第2张图片

查看bam文件头部:

samtools view -h test.bam | head

比对软件|Samtools_第3张图片

HD:VN表示版本,SO表示排序方式。
SQ:SN表示参考序列的名称,LN表示参考序列的长度
PG:比对时使用的工具指令。(这里小编用的是hiast2)

常用命令

1.View
view命令的主要功能是:将sam文件转换成bam文件;然后对bam文件进行各种操作,比如数据的排序(不属于本命令的功能)和提取(这些操作 是对bam文件进行的,因而当输入为sam文件的时候,不能进行该操作);最后将排序或提取得到的数据输出为bam或sam(默认的)格式。view命令中,

你可能感兴趣的:(数据分析)