KAAS(KEGG Automatic Annotation Server):一个非常好用的在线注释工具

在基因组学研究中,我们常常需要知道一些基因在整个代谢通路中扮演的角色。日本的KEGG数据库,提供了很全面的基因通路,大大方便了研究者。与此同时,KEGG数据库自身提供了一个方便的在线注释工具,方便又精准,甚至能提供带标注的map通路图,比在本地做blast,然后解析blast结果,再写脚本画map方面了很多。

KASS :http://www.genome.jp/tools/kaas/

KASS提供了Complete or Draft Genome,Partial Genome和ESTs三种数据的注释。笔者多次使用Complete or Draft Genome数据注释。如果数据过大,可以写入一个txt文件,上传到网站注释。默认的fasta格式要求是pep序列,即根据cds序列翻译过来的蛋白序列。这是因为KEGG数据库里默认的数据格式也是pep。当然也支持 Nucleotide的数据。

GENES data set 选项提供了数据库的选择,在做比对时,可以适当选择近缘物种;

Assignment method 推荐选择bi-directional best hit,这样注释更加精准。

E-mail address选项需要提供自己的邮箱,在注释完成后,会把注释结果的地址发送给邮箱里,笔者亲测1w多个pep注释时间大约40-50min。注释的结果提供gene对应的Kid, 还有通路的描述和map图。

你可能感兴趣的:(Bioinformatics)