2021-06-07 AAI计算

一、AAI

氨基酸一致性amino acid identity(AAI)是获得属或更高分类群分类结构的一种客观方法。常用工具:

  • CompareM:github说明
    安装使用参考利用ANI AAI比较细菌基因组
    作者已经不再维护,并推荐了AAI calculator和 EzAAI tool
    image.png
  • AAI calculator:在线工具,以蛋白质序列作为输入文件
  • EzAAI tool:从基因组组装到最终树状图的快速而准确的管道
    Kim, D., Park, S. & Chun, J. Introducing EzAAI: a pipeline for high throughput calculations of prokaryotic average amino acid identity. J. Microbiol 59, 476-480 (2021). (https://doi.org/10.1007/s12275-021-1154-0)

二、软件使用

2.1 软件安装

  • EzAAI v1.0
  • Java RE 8+ :java8参考ubuntu配置jre8
  • Prodigal : 用conda安装,conda install -c bioconda prodigal
  • MMSeqs2: 用conda安装, conda install -c bioconda mmseqs2

2.2 软件使用

EzAAI extract 从基因组序列中提取profile数据库

$  java -jar EzAAI_latest.jar  extract -i fasta/Cn.fasta -o db/Cn.db -l "Clavibacter nebraskensis"
$  java -jar EzAAI_latest.jar extract -i fasta/Ci.fasta -o db/Ci.db -l "Clavibacter insidiosus"
$  java -jar EzAAI_latest.jar extract -i fasta/Mh.fasta -o db/Mh.db -l "Microbacterium hominis"
$  java -jar EzAAI_latest.jar extract -i fasta/Ma.fasta -o db/Ma.db -l "Microbacterium aurum"
$  java -jar EzAAI_latest.jar extract -i fasta/Lc.fasta -o db/Lc.db -l "Leucobacter chironomi"
$  java -jar EzAAI_latest.jar extract -i fasta/Lm.fasta -o db/Lm.db -l "Leucobacter muris"
image.png

image.png

EzAAI calculate 从profile数据库计算AAI值
EzAAI将自动检测目录中的.db文件,并使用MMSeqs2计算每株菌与其他菌之间的AAI值。

$ java -jar EzAAI_latest.jar calculate -i db/ -j db/ -o out/aai.tsv
image.png
image.png

EzAAI cluster - 通过AAI值做层次聚类

$ java -jar EzAAI_latest.jar cluster -i out/aai.tsv -o out/sample.nwk

生成的nwk文件用MEGA做可视化


image.png

完成!

你可能感兴趣的:(2021-06-07 AAI计算)