DeepBIO:一个自动化和可解释的深度学习平台,用于高通量生物序列预测,功能注释和可视化分析

DeepBIO: an automated and interpretable deep-learning platform for high-throughput biological sequence prediction, functional annotation and visualization analysis

期刊:Nucleic Acids Research

中科院分区:2区

影像因子:19.16

出版时间:2023年2月17号

摘要

在这里,我们介绍了DeepBIO,这是首个用于高通量生物序列功能分析的自动化和可解释深度学习平台。DeepBIO是一个一站式的网络服务,使研究人员能够开发新的深度学习架构来回答任何生物学问题。具体来说,对于任何生物序列数据,DeepBIO支持总共42种最先进的深度学习算法,用于全自动管道中的模型训练、比较、优化和评估。DeepBIO为预测模型提供了全面的结果可视化分析,涵盖了模型可解释性、特征分析和功能序列区域发现等几个方面。此外,DeepBIO使用深度学习架构支持9个基本级别的功能注释任务,具有全面的解释和图形可视化,以验证注释站点的可靠性。在高性能计算机的支持下,DeepBIO可以在几个小时内对高达百万级的序列数据进行超快速预测,展示其在实际应用场景中的可用性。案例研究结果表明,DeepBIO提供了准确、稳健和可解释的预测,展示了深度学习在生物序列功能分析中的强大功能。总体而言,我们希望DeepBIO能够确保深度学习生物序列分析的可重复性,减轻生物学家的编程和硬件负担,并在序列水平和碱基水平上提供有意义的功能见解。

介绍

DeepBIO:一个自动化和可解释的深度学习平台,用于高通量生物序列预测,功能注释和可视化分析_第1张图片

 优点总结

iii)两个预测模块。DeepBIO是第一个不仅支持任何生物序列数据的序列级功能预测的平台,而且还允许使用预训练的深度学习架构进行9个基本级功能注释任务,包括DNA甲基化RNA甲基化蛋白质结合特异性。此外,我们还对模型预测结果与实验数据进行了深入的对比分析,以验证预测结果的可靠性。值得注意的是,在高性能计算机的支持下,我们证明了DeepBIO支持高达百万级序列数据的快速预测,证明了其在实际应用场景中的可用性。(四)综合结果可视化分析

MATERIALS AND METHODS

流程图

DeepBIO:一个自动化和可解释的深度学习平台,用于高通量生物序列预测,功能注释和可视化分析_第2张图片

 步骤分析

Step 1. Data pre-processing

四个部分来预处理输入数据:

(i)序列合法性测试;

(ii)序列相似性设置;

(iii)数据处理不平衡;        

(iv)数据增强。

Step 2.Model construction

DeepBIO:一个自动化和可解释的深度学习平台,用于高通量生物序列预测,功能注释和可视化分析_第3张图片

Step 3. Model evaluation.

DeepBIO:一个自动化和可解释的深度学习平台,用于高通量生物序列预测,功能注释和可视化分析_第4张图片

 

Step 4. Visualization analysis.

DeepBIO:一个自动化和可解释的深度学习平台,用于高通量生物序列预测,功能注释和可视化分析_第5张图片

 

你可能感兴趣的:(自动化,深度学习,人工智能)