2020-02-11 eggnog-mapper的使用及结果

序自《2020-02-08 wget(含参数技巧)下载eggNOG数据库、安装以及碰到的问题》

一、使用

1、数据库内容

在下载好eggnog数据库之后,

1)og2level.tsv.gz;;2)eggnog.db.gz;;3)OG_fasta.tar.gz;;4)eggnog_proteins.dmnd.gz;;

5)HMM database(s): bact(存在了HMM_dblevels里)

包括:index.html;;bact_50.hmm.h3f;;bact_50.hmm.h3i;;bact_50.hmm.h3m;;bact_50.hmm.h3p;;bact_50.hmm.idmap;;bact_50.info;;bact_50.pkl

2、安装好后测试

在软件安装目录下

emapper.py -h        #查看使用帮助

python emapper.py -i test/polb.fa --output polb_bact -d bact --data_dir ~/data/eggnog.db        #按照别人的操作,我的报的报错了,后来发现是不能到eggnog,db下,因为他不是一个目录,这是一个文件(也看是跟我下载的我有关系)

python emapper.py -i test/polb.fa --output polb_bact -d bact --data_dir ~/data        #这样就可以了


运行的比对过程
这是给出的引用信息

出现这些就证明可以正常使用了!

二、使用

注意:

python emapper.py -i /share/data1//lx_genome/genepredict/SZDP190917115/115.pep --resume --output 115_bact -d bact --data_dir /share/data1//software/eggnog-mapper-1.0.3/data

参数的选择以及解释:

参考:https://www.jianshu.com/p/e646c0fa6443

eggnog-mapper默认是以HMMER进行序列搜索,尽管这可以通过-m diamond更改成DIAMOND,但结果中就会缺少一些信息列。

-d/--database表示搜索数据库的类型,既可以是"euk, bact, arch" 三大类的其中一种,也可以是"eggnog-mapper/data/OG_fasta"中的小类,例如"maNOG"表示的就是哺乳动物的NOG。此外也可以是自定义HMM数据库,-d /path/to/pfam.hmm

--usemem和--cpu 线程数提高运行速度(如果服务器内存比较大,线程比较多的话)

--output表示输出文件的前缀,默认输出在当前文件夹下,

--output_dir可以更改为其他文件路径;

--resume表示任务重启后可以跳过之前已经完成的部分, 

--override则表示覆盖原先的输出结果。

其他几个基因的分析命令同上

至于如何同时使用这个在后台同时运行多条,还需要学习,以后会补上。

三、结果

注意:生成的文件默认存在当前的目录下


参数参考:

1、使用eggNOG数据库进行基因功能注释 http://www.chenlianfu.com/?p=2804

2、序列功能注释神器:eggNOG-mapper,KEGG/COG/KOG/GO/BiGG 一网打尽http://www.biostack.org/?p=698

你可能感兴趣的:(2020-02-11 eggnog-mapper的使用及结果)