python小程序--计算序列碱基个数

在处理基因组信息的时候,我们时不时需要统计序列的碱基个数,对于较少批量的数据来说,word文档或者其他文本处理工具或者samtools等可以进行处理,但是在面对大的fastq文件的时候,会显得苍白无力,下面分别介绍两种处理方式

1.针对单个序列进行处理

python小程序--计算序列碱基个数_第1张图片

2.针对序列文件


python小程序--计算序列碱基个数_第2张图片

对于文件处理是建立在对单个序列处理的基础之上的,通过对文件的逐行读取和判断来辨别序列行,从而对其进行计数,计数原理一样。

按照上述小程序进行运行可以得出序列的碱基个数。

你可能感兴趣的:(python小程序--计算序列碱基个数)