samtools统计fasta文件序列长度,根据序列名提取序列

参考

https://www.cnblogs.com/xudongliang/p/5200655.html

使用命令

samtools faidx input.fasta

会生成一个input.fasta.fai的文件,文件的内容总共有5列
第一列是序列名,第二列是序列长度,第四列是每行多少个碱基

根据序列名提取序列
这里好像只能提取单条序列

samtools faidx input.fasta TCONS_00000018 > TCONS_00000018.fa

还可以加上指定的位置

samtools faidx input.fasta TCONS_00000018:1-10
>TCONS_00000018:1-10
TGGGCGAACG

你可能感兴趣的:(samtools统计fasta文件序列长度,根据序列名提取序列)