samtools Bam文件常用操作

sam文件转bam文件

  • -f 有某个flag值的序列
  • -F 不含有某个flag值得序列
  • -b 输出BAM格式
samtools view -S test.sam -b > test.bam
#比对到负链的reads
samtools view -f 16 test.bam
# 比对到参考基因组的序列,flag值为4代表比对不上
samtools view -F 4 test.bam

bam排序和建索引

  • -@, --threads 可以添加线程数
samtools sort test.bam -o test_sort.bam 
samtools index test_sort.bam

bam文件reads计数

samtools view -c test.bam

depth

计算每一个位点的测序深度

samtools depth test_sort.bam > test_depth.txt

tview

tview能直观的显示出reads比对基因组的情况。

  • -p 染色体位置
samtools tview -p chr17 test_sort.bam genome.fa

bam文件合并

使用samtools merge命令将BAM文件合并为单个文件,假设您要将3个BAM文件(file1.bam,file2.bam和file3.bam)合并为名为merged.bam的单个文件。

samtools merge merged.bam file1.bam file2.bam file3.bam

fastq文件建索引

结果会生成后缀为.fai的索引文件

samtools faidx test.fasta

BAM文件flag记录

1:该read是成对的paired reads中的一个
2:paired reads中每个都正确比对到参考序列上
4:该read没比对到参考序列上
8:与该read成对的matepair read没有比对到参考序列上
16:该read其反向互补序列能够比对到参考序列
32:与该read成对的matepair read其反向互补序列能够比对到参考序列
64:在paired reads中,该read是与参考序列比对的第一条
128:在paired reads中,该read是与参考序列比对的第二条
256:该read是次优的比对结果
512:该read没有通过质量控制
1024:由于PCR或测序错误产生的重复reads
2048:补充匹配的read

你可能感兴趣的:(samtools Bam文件常用操作)