病毒序列识别工具

导读

开始有关病毒的基因组学研究。

分析工具 特点 发表杂志 发表时间 被引(2021)
VirSorter 组装,PERL PeerJ 2015 585
VirSorter2 组装 Microbiome 2021 27
vConTACT2 组装 python NBT 2019 173
VirFinder 组装,R k-mer Microbiome 2017 130
GOTTCHA reads, PERL Nucleic Acids Res 2015 104
ViromeScan reads, shell集成,真核 BMC Genomics 2016 65
VIP 组装,shell集成 Scientific reports 2016 57
MARVEL 组装, python, binning Frontiers in Genetics 2018 34
Prophage Hunter BGI网页工具 Nucleic Acids Res 2019 9

1. VirSorter

用于prophages (viral genomes integrated in a microbial genome)识别鉴定。可使用有参,无参两种模式鉴定more fragmented and larger scale微生物基因组数据中的病毒信号。可鉴定短于30kb contig中的病毒信号。对长于10kb的contig,virsorter表现最佳。

文章:VirSorter: mining viral signal from microbial genomic data
中文:挖掘微生物基因组数据中的病毒信号
杂志:PeerJ
时间:2015

VirSorter Github: https://github.com/simroux/VirSorter

分析流程:

  • 组装:MetaSPAdes
  • 抽提病毒序列1:VirSorter (gene enrichment based method)
  • 抽提病毒序列2:VirFinder (k-mer frequency based method)
  • 病毒序列分类:NCBI viral RefSeq sequences, NCBI taxonomy data
  • 基因预测:MetaProdigal
  • crAss-like噬菌体检测
  • Tentative病毒contig鉴定
  • Pfam结构蛋白鉴定病毒
  • 病毒组样品聚类
  • 前噬菌体分析

参考:
Metagenome Data on Intestinal Phage-Bacteria Associations Aids the Development of Phage Therapy against Pathobionts.
Cell Host & Microbe. 2020

VirSorter2

从宏基因/转录组数据中识别病毒信号缺少1. 广谱基因marker 2. 数据库代表 3. 有效工具。但VirSorter2很OK。

标题:VirSorter2: a multi-classifier, expert-guided approach to detect diverse DNA and RNA viruses
中文:一种含多分类器且有专家指导的DNA/RNA病毒检测方法
杂志:Microbiome
时间:2021

VirSorter2 Github: https://github.com/jiarong/VirSorter2
bitbucker: https://bitbucket.org/MAVERICLab/virsorter2/src/master/

2. VirFinder

VirFinder: R package for identifying viral sequences from metagenomic data using sequence signatures。基于病毒序列 k -mers词频和机器学习识别病毒序列的方法。 此方法利用了常用的序列k -mers构建序列相量,构建机器学习分类器,不需要参考病毒序列数据库,显著提高了病毒序列识别的速度和准确性,将有助于在宏基因组学时代下对病毒的研究。

标题:VirFinder: a novel k-mer based tool for identifying viral sequences from assembled metagenomic data
中文:识别宏基因组中病毒序列,基于k-mer
杂志:Microbiome
时间: 2017
单位:南加利福尼亚大学

VirFinder Github: https://github.com/jessieren/VirFinder

分析流程:

  • 组装:MetaSPAdes
  • 抽提病毒序列1:VirSorter (gene enrichment based method)
  • 抽提病毒序列2:VirFinder (k-mer frequency based method)
  • 病毒序列分类:NCBI viral RefSeq sequences, NCBI taxonomy data
  • 基因预测:MetaProdigal
  • crAss-like噬菌体检测
  • Tentative病毒contig鉴定
  • Pfam结构蛋白鉴定病毒
  • 病毒组样品聚类
  • 前噬菌体分析

工具比较:

参考:
1 Metagenome Data on Intestinal Phage-Bacteria Associations Aids the Development of Phage Therapy against Pathobionts.
Cell Host & Microbe. 2020
2 VirFinder:基于k-mer的病毒序列预测算法

DeepVirFinder

使用深度学习方法预测病毒序列。该方法对短病毒序列具有较好的预测精度,可用于从宏基因组数据中预测序病毒列。与基于k-mer的VirFinder方法相比,DeepVirFinder通过使用卷积神经网络(CNN)显著提高了预测精度。CNN可以自动从病毒和原核生物序列中学习基因组模式,同时根据学习到的基因组模式建立预测模型。

标题:Identifying viruses from metagenomic data using deep learning
中文:识别宏基因组中的病毒序列,使用深度学习
杂志:quantitative biology
时间:2020
单位:南加利福尼亚大学

DeepVirFinder Github: https://github.com/jessieren/DeepVirFinder

更多:
QB:基于深度学习的病毒序列识别
DeepVirFinder使用指南

安装

# 创建独立环境
conda create -n deepvirfinder
conda activate deepvirfinder
# 安装依赖
conda install python=3.6 numpy theano=1.0.3 keras=2.2.4 scikit-learn Biopython h5py

ProxyError: Conda cannot proceed due to an error in your proxy configuration

# clone 主程序
git clone https://github.com/jessieren/DeepVirFinder
cd DeepVirFinder
chmod 777 dvf.py
./dvf.py --help
python dvf.py --help

3. GOTTCHA

Genomic Origin Through Taxonomic CHAllenge (GOTTCHA)。把细菌和病毒序列分别识别鉴定出来。

文章:Accurate read-based metagenome characterization using a hierarchical suite of unique signatures
GOTTCHA Github: https://github.com/LANL-Bioinformatics/GOTTCHA

4. ViromeScan

文章:ViromeScan: a new tool for metagenomic viral community profiling
Sourceforge: https://sourceforge.net/projects/viromescan/files/?source=navbar

5. VIP

文章:VIP: an integrated pipeline for metagenomics of virus identification and discovery
描述:Virus Identification Pipeline (VIP)
Github: https://github.com/keylabivdc/VIP

6. MARVEL

文章:MARVEL, a Tool for Prediction of Bacteriophage Sequences in Metagenomic Bins
描述:Metagenomic Analysis and Retrieval of Viral Elements
Github: https://github.com/laboratoriobioinformatica/MARVEL

7. Prophage Hunter

文章:Prophage Hunter: an integrative hunting tool for active prophages
BGI网页工具:https://pro-hunter.bgi.com/index.php/Home/Index/index.html

工具比较:

8. vConTACT2

bitbucket: https://bitbucket.org/MAVERICLab/vcontact2/wiki/Home

文章:Taxonomic assignment of uncultivated prokaryotic virus genomes is enabled by gene-sharing networks
中文:通过基因分享网络给META中的病毒基因组做分类注释
杂志:Nature Biotechnology
时间:2019

参考:
微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组

你可能感兴趣的:(病毒序列识别工具)