kalign:适用于基因组规模的多序列比对工具

欢迎关注”生信修炼手册”!

之前提到的clustalo, muscle, mafft 适用于几千到几万条序列的多序列比对,在比较基因组学的分析中,需要对不同基因组的序列进行多序列比对。对于基因组规模的多序列比对而言,之前的工具运行速度上就不够理想了。

kalign 是一款针对大规模序列的多序列比对工具,无论是运行速度,还是比对的准确度,都令人满意。官网如下

http://msa.sbc.su.se/cgi-bin/msa.cgi

在对应的文献中,利用测试数据集,评估了不同软件的运行速度和多序列比对的准确度,结果如下

kalign:适用于基因组规模的多序列比对工具_第1张图片

从速度上看,Kalign遥遥领先,从准确到上看,kalign和muscle, mafft 的准确度非常接近。

kalign支持核酸和蛋白质的多序列比对,软件的安装过程如下

wget http://msa.sbc.su.se/downloads/kalign/current.tar.gz
tar xzvf current.tar.gz
./configure
make

编译好的可执行文件的名字为kalign, 基本用法如下

kalign input.fa > out.fa

默认输出fasta格式的多序列比对结果,也支持clustalw, msf 等格式。

EBI提供的kalign的在线服务网址如下

https://www.ebi.ac.uk/Tools/msa/kalign/

kalign:适用于基因组规模的多序列比对工具_第2张图片

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

你可能感兴趣的:(linux,大数据,python,编程语言,人工智能)