BAM比对文件中flags对应的意义

在bam文件中的第二列有这样一些数字,99,147,83,77,141等等,这些数字表示了这条reads的比对的状态。

samtools view FA51.ht2p.bam|less
ST-E00192:599:HHWGGCCXY:3:1101:1032:12842       99      14      49862576        60      149M    =       49862627        200     CAGGCTGGAGTGCAGTGGCTATTCACAGGCGCGATCCCACTACTGATCAGCACGGGAGTTTTGACCTGCTCCGTTTCCGACCTGGGCCGGTTCACCCCTCCTTAGGCAACCTGGTGGTCCCCCGCTCCCGGGAGGTCACCATATTGATG   AAFFAJJJFFJJ

以下以双末端测序的bam文件为例,这些数字表示的意义分为3种类型:

1.两条reads都比对上

99=1+2+32+64:该对reads都比对到基因组,这是read1,比对到参考基因组正链
147=1+2+16+128:该对reads都比对到基因组,这是read2,比对到参考基因组负链

83=1+2+16+64:该对reads都比对到基因组,这是read1,比对到参考基因组负链
163=1+2+32+128:该对reads都比对到基因组,这是read2,比对到参考基因组正链

2. 两条reads都没有比对上

77=1+4+8+64:该对reads都没有比对到参考基因组,这是read1
141=1+4+8+128:该对reads都没有比对到参考基因组,这是read2

3. 两条reads有一条没有比对上,另一条比对上

69=1+4+64:该对reads中的read1,没有比对到参考基因组,与其配对的read2比对到参考基因组正链
153=1+8+16+128:该对reads中的read2,比对到参考基因组正链,与其配对的read1没有比对到参考基因组

89=1+8+16+64:该对reads中的read1,比对到参考基因组负链,与其配对的read2没有比对到参考基因组
133=1+4+128:该对reads中的read2,没有比对到参考基因组,与其配对的read1比对到参考基因组负链

每个数字都是由2的n次方相加而来,即等号后的数字。可通过samtools flags +数字查看。

samtools flags 1
#0x1    1   PAIRED
samtools flags 2
#0x2    2   PROPER_PAIR
samtools flags 4
#0x4    4   UNMAP
amtools flags 8
#0x8    8   MUNMAP
samtools flags 16
#0x10   16  REVERSE
samtools flags 32
#0x20   32  MREVERSE
samtools flags 64
#0x40   64  READ1
samtools flags 128
#0x80   128 READ2
samtools flags 256
#0x100  256 SECONDARY
samtools flags 512
#0x200  512 QCFAIL
samtools flags 1024
#0x400  1024    DUP
samtools flags 2048
#0x800  2048    SUPPLEMENTARY

解释为:

1:The read is one of a pair
2:The alignment is one end of a proper paired-end alignment
4:The read has no reported alignments
8:The read is one of a pair and has no reported alignments
16:The alignment is to the reverse reference strand
32:The other mate in the paired-end alignment is aligned to the reverse reference strand
64:The read is mate 1 in a pair
128:The read is mate 2 in a pair

翻译如下:

1(1)双末端测序
2(10)paired reads都正确比对到参考序列上
4(100)该read没比对到参考序列上
8(1000)与该read成对的另一条read没有比对到参考序列上
16(10000)该read比对到参考序列负链

32(100000)与该read成对的另一条read比对到参考序列负链
64(1000000)该read是成对reads中的read1
128(10000000)该read是成对reads中的read2

Flags表示的意义可以用下图概括

Flags表示的意义.png

参考:
SAM Format Flag

你可能感兴趣的:(BAM比对文件中flags对应的意义)