2018-12-26 Biopython 介绍

最近想自己整理出一套离线的,方便序列处理的脚本,后来网上查了查,biopython 可以实现,刚好我python 有点基础,就直接学习一下,方便我后续学习。

安装使用 pip 安装

然后主要是看说明,根据自己的需要使用,我看英文还是有点吃力啊,算了,赶时间,先看中文的说明文档吧

home https://biopython.org
英文版 http://biopython.org/DIST/docs/tutorial/Tutorial.html
中文版 https://biopython-cn.readthedocs.io/zh_CN/latest/cn/chr06.html

中文版看起来还是很友好的

2018-12-26 Biopython 介绍_第1张图片
help.png

好了,真正需要的时候,就是看你要的功能是哪块,根据需要整理再看。

我这里就是需要能够读入fasta文件,然后翻译为氨基酸

用法如下

from Bio.SeqRecord import SeqRecord
from Bio import SeqIO
def make_protein_record(nuc_record):
    """Returns a new SeqRecord with the translated sequence (default table)."""
    return SeqRecord(seq = nuc_record.seq.translate(cds=True), \
                     id = "trans_" + nuc_record.id, \
                     description = "translation of CDS, using default table")

from Bio import SeqIO
proteins = (make_protein_record(nuc_rec) for nuc_rec in \
            SeqIO.parse("myfile.fasta", "fasta"))
SeqIO.write(proteins, "translations.fasta", "fasta")

这样就生成了一个translation的文件了

你可能感兴趣的:(2018-12-26 Biopython 介绍)