评价提高分子对接性能的组合策略

评价提高分子对接性能的组合策略

评价提高分子对接性能的组合策略_第1张图片

相关背景:

分子对接可能是应用于基于结构的药物设计和虚拟筛选活动中最快速、成本最低的计算技术,它可以从巨大的化合物文库中找到潜在的活性分子,用于先导发现。

在分子对接中,配体(通常是小分子化合物)与靶标(通常是蛋白质)之间的正确结合方式可以通过对一个配体分子的数百个结合姿势进行采样,然后根据评分函数对它们进行排序。因此,在构象采样过程中生成接近xray姿态是排名和评分程序的必要前提。通常情况下,接近原生的绑定姿势应该得到最好的评分。此外,对于某一靶标蛋白,高亲和力配体应该比低亲和力配体得分更高。换句话说,用于排序位姿的评分函数也被用于将配体分类为活性分子或非活性分子,并估计它们的相对结合亲和力。因此,对接仿真的性能和可靠性主要由两个关键因素决定,即采样算法和评分函数

虽然分子对接技术已经有大量的研究,但目前单一的对接程序在预测配体与蛋白质目标的结合位姿和结合精度方面还远远不够。许多比较研究表明,目前可用的对接程序中最令人困惑的问题可能是打分能力的准确性问题

为了提高分子对接的性能,最近提出了一种新的共识对接策略。这种方法的优点是利用多个对接方法的结果,可以抵消个别对接方法产生的一些误导性结果,从而提高预测的准确性。但是,共识对接的过程比较繁琐。在不同的对接方案中,研究人员需要逐一调整不同的参数。此外,有些对接方法在参数设置或对接过程中较为复杂,难以在实际中广泛应用。

到目前为止,X-score和DrugScore都是独立的打分函数,用于在没有采样的情况下预测蛋白质-配体的结合亲和力。因此,采用组合策略增强对接性能是可行的,即通过具有较强采样能力的对接程序生成绑定位姿,然后通过独立的评分函数进行排名。最近,一个跨平台的分子对接程序LeDock被开发出来,LeDock具有较好的姿态预测能力,其易用性和计算速度也很令人满意。最近,Hou等人的综合评估表明,LeDock在抽样能力方面优于大多数商业和学术对接程序,而其评分能力则不尽如人意。此外,对LeDock性能的综合评价也鲜有报道。

主要工作:

本文目标是利用LeDock和许多学术免费评分功能来提高对接性能。首先,使用PDBbind核心集(2013版)的基准数据集评估LeDock的采样能力。然后,使用DSX (DrugScore X)、PoseScore和Xscore三个学术评分函数对LeDock生成的绑定姿势进行重评分并排序。采用评分能力、排名能力和对接能力对这些评分函数进行评价。研究结果为提高对接在药物筛选中的预测精度提供了一种采样与重打分相结合的策略。
评价提高分子对接性能的组合策略_第2张图片

实验设计:

数据集:

PDBbind core set (2013 version)

靶标和配体准备:

为了测试LeDock采样算法的鲁棒性,使用每个配体的三种不同的初始构象(以下称为原始构象、优化构象和能量最小化构象)进行对接。原始构象与每个配合物的晶体构象完全相同。通过CHARMm force field对结合口袋中的原始构象进行局部优化生成优化后的构象。能量最小化的构象是通过使用Sybyl(8.1版)中的共轭梯度最小化,使用MMFF94 force field对原始构象进行独立优化生成的。蛋白和配体分别是PDB和Sybyl Mol2格式。

构象采样:

所有的结合姿势都由LeDock程序生成。在LeDock中,通过模拟退火和遗传算法的结合,对蛋白质活性位点上配体的位置、方向和构象进行了详尽的搜索。在对接之前,蛋白质由LePro模块内置的LeDock准备。水分子、杂原子和反离子被去除,氢被自动加入。结合口袋设置为一个矩形盒子,其中包括配体中任何重原子4 Å范围内的任何蛋白质原子。通过分子可视化软件VMD检查和调整盒子的大小。在多次对接过程中,通过构象聚类来减少对接姿态的冗余。聚类的阈值设置为1 Å,保留对接姿势的数量设置为20个。其他参数均为默认值。

打分函数:

所有的结合姿势都是通过LeDock内置的评分函数进行评分和排名。然后进一步测试了DSX、PoseScore和X-score三个学术用的评分函数。我们选择的这些评分函数都是开源的,在准确性、适用性和速度上都有优势。所有计分函数参数均为默认值。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4JiimYuk-1678200695658)(C:\Users\20491\AppData\Roaming\Typora\typora-user-images\image-20230307215958640.png)]

评价指标:

采样能力:使用预测结合位姿与xray位姿之间的均方根偏差(RMSD)来评估LeDock的采样能力。如果RMSD低于2.0 Å,则认为是一个成功的采样。在这里,最接近自然结合姿势的预测构象被称为最佳姿势。通过整个数据集上最佳姿势的成功率来评估LeDock的采样能力。

评分函数:对每个评分功能的打分能力、排名能力、对接能力三个方面进行评价。

评分能力是指对于195个蛋白质配体复合物,评分函数的打分结果与实际实验数据成线性相关的能力。经典Pearson相关系数(Rp)和Spearman排序系数(Rs)定量评价评分函数的评分能力。一般情况下,预测评分与真实亲和力的线性相关应尽可能高。

排序能力是指评分函数对同一蛋白质的一组不同配体根据其结合程度正确排序的能力。

对接能力是指评分函数在生成的姿态中识别真实结合姿态的能力。在这项工作中,如果排名最高的姿态(top-1)与原生姿态之间的RMSD值小于2 Å,则认为预测成功。考虑到对接作业产生的其他排名靠前的绑定姿势也可能有用,在对接能力测试中也给出了每种情况下排名前三的结合姿势的成功率。

实验结果:

采用了三种不同构象(原始构象、优化构象和能量最小化构象)作为对接的起始构象后,最佳姿势的成功率都超过了80%。结果与Hou等人基于2002年蛋白配体复合物的更大数据库所报道的结果高度相似,表明LeDock的构象采样功率强且稳健。此外,**当使用原始构象、优化构象和能量最小化构象作为输入时,成功率没有显著差异。**基于原始构象生成的配体位姿作为对接输入,对评分函数进行如下评估。

此外,我们还研究了结合袋中氨基酸残基类型、蛋白质与配体之间的实验结合常数以及配体的物理化学性质对LeDock采样能力的影响。可以看出,在成功和不成功的采样情况下,氨基酸残留分布没有显著差异。

蛋白质-配体复合物的蛋白口袋和结合亲和力没有明显影响LeDock采样算法进行构象搜索。

配体的相对较高的可旋转键灵活性是导致采样失败的关键因素。

与其他对接软件来说,LeDock对于柔性分子的对接成功率较高。

配体的疏水性质对采样的影响较小。

一些具有高分子量的配体更容易被成功对接。

最佳构象的成功率与排名靠前的构象(top-1)有很大差距,这说明LeDock虽然可以对接近原生构象进行采样,但评分功能还远远不够理想,在识别和识别最佳构象方面还有待改进。

LeDock生成的最佳姿势和得分最高的姿势之间的成功率差距表明,最佳姿势无法准确排名,这是目前流行的对接程序的一个共同弱点因此,我们用其他三个学术评分函数对所有预测的姿势进行了评分。

DSX评分能力最强,对蛋白质与配体的结合活性有较强的预测能力。

X-score在排名预测方面比其他三个测试评分函数更准确。

DSX、Xscore、LeDock这三个得分功能的对接能力基本处于同一水平,只是DSX在绑定前1位和绑定前3位的对接能力都略好于其他两个。

你可能感兴趣的:(文献学习记录,分子对接)