生物信息百Jia软件(六):prodigal

编者按

欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘!

前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。

一、功能分类: 

原核生物基因预测

二、软件官网:

compbio.ornl.gov/prodigal/

三、软件介绍:

prodigal的全称是Prokaryotic Dynamic Programming Genefinding Algorithm,原核的动态编程基因查找算法,prodigal主要应用于细菌和古生菌的基因预测,不能用于真核生物,如果要对meta样品做基因预测,prodigal还专门提供了meta的版本。 除此之外,prodigal还支持在线提交序列的方式来预测基因预测。也非常的易于使用。而且相对与glimmer基因预测工具,prodigal更加好用,只需一步即可,而且,软件可以直接输出基因的核酸序列并翻译出的相应的氨基酸序列,这对很多初学者来说是非常方便的。

四、下载安装: 

wgethttps://codeload.github.com/hyattpd/Prodigal/tar.gz/v2.60

tar -zxvf Prodigal-2.6.1.tar.gz

make install

五、软件使用: 

软件的使用比较容易,比glimmer要容易很多,只需一步即可,直接敲prodigal命令就会弹出软件帮助信息。

生物信息百Jia软件(六):prodigal_第1张图片

-a 是输出氨基酸文件-c 不允许基因一边断开,也就是要求完整的orf,有起始和终止结构

-d 输出预测基因的序列文件

-f 选择输出文件格式,有gbk,gff,和sco格式可供选择

-g 指定密码子,原核为第11套

-i 输入文件,即需要预测的基因组序列文件

-m 屏蔽基因组中的N碱基

-o 输出文件,默认为屏幕输出

-p 选择方式,是单菌还是meta样品

-q 不输错错误信息到屏幕

-t 指定训练集

-s 输出所有潜在基因以及分值到一个文件中

六、使用案例: 

prodigal-aref.pep-dref.cds-fgff-g11-oref.gff-psingle-sref.stat-iref.fna>prodigal.log

七、注意事项:

1、对于原核生物基因预测,我们还需要注意一个问题,就是当样品为支原体时,在密码子选择上要修改一下,因为在支原体中遗传密码中的密码子UGA能够编译成色胺酸,而不是一般的乳白色终止码。

你可能感兴趣的:(生物信息百Jia软件(六):prodigal)