2019-12-23 学习记录6

Prokka
Prokka: rapid prokaryotic genome annotation,快速的原核基因组注释

下载

# 设置工作目录 wd,用户根据自己的实际情修改
wd=~/test/metagenome17
cd $wd
# 下载prokka
git clone https://github.com/tseemann/prokka.git
# 安装依赖关系
sudo apt-get -y install bioperl libdatetime-perl libxml-simple-perl libdigest-md5-perl
# 安装perl包XML
sudo bash
export PERL_MM_USE_DEFAULT=1
export PERL_EXTUTILS_AUTOINSTALL="--defaultdeps"
perl -MCPAN -e 'install "XML::Simple"'
exit
————————————————
版权声明:本文为CSDN博主「刘永鑫Adam」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
# 添加环境变量
export PATH=$PATH:`pwd`/prokka/bin
# 自动搜索并添加数据库
prokka --setupdb
# 测序数据库
prokka --listdb

注释contig

# 建立工作目录
mkdir annotation
cd annotation
# 准备输入文件
ln -fs ../assembly/combined/final.contigs.fa ./
# 一句命令10分钟搞定之前别人半年的工作
prokka final.contigs.fa --outdir prokka_annotation --prefix metagG --metagenome --kingdom Bacteria
————————————————
版权声明:本文为CSDN博主「刘永鑫Adam」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/woodcorpse/article/details/78429217

Prokka 结果说明

Extension Description
.gff 基因注释文件,包括gff和序列,可用igv直接查看
.gbk Genebank格式,来自gff
.fna 输入contig核酸文件
.faa 翻译CDS的AA序列
.ffn 所有转录本核酸序列
.sqn 用于提交的序列
.fsa 输入序列,但有sqn的描述,用于tbl2asn生成sqn文件
.tbl 特征表,用于tbl2asn生成sqn文件
.err 错误报告
.log 日志
.txt 统计结果
.tsv 所有注释基因特征表格

宏基因组实战4.基因注释Prokka
Annotation with Prokka
Prokka: rapid prokaryotic genome annotation
Prokka

你可能感兴趣的:(2019-12-23 学习记录6)