论文解读:多层肽 - 蛋白质相互作用预测的深度学习框架

Title:A deep-learning framework for multi-level peptide–protein interaction prediction

期刊:nature communications

分区:Q1

1. 摘要

肽 - 蛋白质相互作用参与了各种基本细胞功能,它们的鉴定对于设计有效的肽疗法至关重要。最近,已经开发了许多计算方法来预测肽 - 蛋白质相互作用。但是,大多数现有的预测方法在很大程度上取决于高分辨率结构数据。在这里,我们提出了一个深度学习框架,用于多级肽蛋白相互作用预测,称为CAMP,包括二进制肽 - 蛋白质相互作用预测和相应的肽结合残基鉴定。全面的评估表明,cAMP可以成功捕获肽和蛋白质之间的二元相互作用,并识别沿相互作用所涉及的肽的结合残基。此外,CAMP在二元肽蛋白相互作用预测方面的表现优于其他最先进的方法。 CAMP可以用作肽蛋白相互作用预测和鉴定肽中重要结合残基的有用工具,从而可以促进肽药物发现过程。

2. 数据集

我们从两个来源构建了一个基准数据集,即来自RCSB PDB21,22的蛋白质 - 肽复合物结构,以及来自Drugbank23-27的已知药物对接对(可以在补充注释10和相应的PDB ID中找到更多数据策划的详细信息我们用于培训和测试的方法可以在补充数据的补充表12和13中找到。我们使用的药品银行ID可以在补充数据中的补充表14中找到)。总体而言,我们获得了7417个阳性相互作用对,涵盖了3412个蛋白序列和5399个肽序列。其中,来自RCSB PDB的6581对具有肽序列中的残基级结合标签。然后,我们通过随机将那些非相互作用的蛋白质和肽对构建了负数据。更具体地说,对于每种正相互作用,通过从所有改组对的非相互作用蛋白和肽对随机采样来产生五个负面因素。总体而言,作为基准数据集,我们获得了44,502个肽 - 蛋白质对。

3. 方法

在这里,我们采用多目标培训的想法来同时学习两个任务,即二进制互动预测任务和肽结合残基识别任务。先前编码的功能分别馈送到两个预测模块中,并且在训练过程中同时优化了两个任务的损失。

论文解读:多层肽 - 蛋白质相互作用预测的深度学习框架_第1张图片

 4.结果

CAMP的表现优于二元交互预测中的基线方法。佩皮斯的双胆囊化是营地的主要目标。在这里,我们比较了Artbaseline方法的分类性能campwiththatathatthatathatathatatetate,包括一种基于相似性的矩阵分解方法NRLMF5,一种名为PPI预测的基于深度学习的模型,称为PIPR12,以及用于CPI预测模型的基于深度学习的模型称为DEEPDTA31。通过交叉验证设置的基准数据评估了呼吸方法。接收器操作特性曲线(AUC)和Precision-Recall曲线(AUPR)下的面积用于评估所有模型的性能。通常,AUPR可以提供一个更好的度量标准,以比AUC32更有信息的方式评估偏斜数据的预测模型。为了帮助读者估计我们任务的困难,我们还报告了补充注释1中几种机器学习基线方法的性能。

你可能感兴趣的:(生信,深度学习,人工智能,计算机视觉)