前言
分子对接(Molecular docking)与分子动力学模拟(Molecular dynamics simulation)是计算生物学中重要的一部分,在生物学研究中不断发挥着重要的作用。分子对接与分子动力学技术可以深入地阐述分子间的相互作用,并可以形象地解释相互作用的机理,特别是在药物开发中有着重要的应用,目前已经成为阐述生物学机理的重要研究方法。分子对接与分子动力学技术还为预测生物大分子复合物结合类型与相互作用模式提供了重要的工具,并为进一步试验提供了有益的参考依据和理论支撑。鉴于两种方法的重要作用,我们在此对分子对接与分子动力学研究方法,进行初步介绍。
1、分子对接
1.1
分子对接基本原理
分子对接技术(Molecular Docking Method, MDM)是指通过计算机模拟将小分子(配体)放置于大分子靶标(受体)的结合区域,再通过计算物理化学参数预测两者的结合力(结合亲和性)和结合方式(构象),进而找到配体与受体在其活性区域相结合时能量最低构象的方法。配体与受体结合时,彼此存在静电相互作用,氢键相互作用,范德华相互作用和疏水相互作用[1,2]。
图1 配体与受体结合相互作用示意图
1.2
分子对接的分类
各种分子对接方法对体系均有一定的简化,根据简化的程度和方式,可以将分子对接方法分为三类。
刚性对接:刚性对接方法在计算过程中,参与对接的分子构像不发生变化,仅改变分子的空间位置与姿态,刚性对接方法的简化程度最高,计算量相对较小,适合于处理大分子之间的对接。
半柔性对接:半柔性对接方法允许对接过程中小分子构像发生一定程度的变化,但通常会固定大分子的构像,另外小分子构像的调整也可能受到一定程度的限制,如固定某些非关键部位的键长、键角等,半柔性对接方法兼顾计算量与模型的预测能力,是应用比较广泛的对接方法之一。
柔性对接:柔性对接方法在对接过程中允许研究体系的构像发生自由变化,由于变量随着体系的原子数呈几何级数增长,因此柔性对接方法的计算量非常大,消耗计算机时很多,适合精确考察分子间识别情况。
1.3
分子对接的基本流程
1)小分子处理:大部分小分子结构可以从Pubchem/Chemspider等数据库里面下载到sdf或者pdb格式的2D/3D结构文件,此外我们新合成的化合物没有收录进数据库,可以使用Chemdraw进行绘制,通过经典化学构图方法对小分子化合物进行结构构建后,采用量化软件(Gaussian,ORCA等)计算分子电荷分布、分子轨道和反应活化能等对小分子进行结构优化。
2)大分子处理:大部分蛋白/酶的结构我们可以从PDB蛋白数据库进行获取,获取到的蛋白结构上往往会有多余的成分,要对蛋白进行预处理,主要是加氢、加电荷、二硫键和质子化状态方面的信息整合,其中最大的难点在于如何处理小分子周围氨基酸HIS的质子化状态,目前国际上没有一个统一的方法;对于少部分蛋白数据库中没有收录的晶体结构,可以使用Alphafold2、Rosettafold等软件进行建模获取目标蛋白结构。
图3 蛋白结构构建合理性评价
3)寻找潜在的活性位点(口袋),我们可以默认对蛋白全域进行搜索,也可以参照文献或者实验数据进行区域选择,对指定区域进行精确搜索。
4)建立对接盒子,准备对接受体文件包
5)选择对接精度,完成对接。
对于单个的小分子我们当然选取精度最高的选项完成对接,当配体换成小分子数据库的时候,我们选择对接精度就显得尤为重要了,通常情况下,我们会对小分子数据库进行高通量筛选,通过几何形状互补除去一些完全不可能的小分子,这个过程通常需要花费较短的时间(约2秒/单个化合物),接下来开始进行一套初筛流程,最后更换对接打分函数进行精确筛选。
1.4
分子对接的应用
人类基因组计划的完成带来了越来越多新的药物治疗靶点的发现。与此同时,高通量蛋白质纯化、晶体学和核磁共振波谱技术也得到了发展,并对蛋白质和蛋白质配体复合物的许多结构细节做出了贡献。这些进展使得计算策略渗透到今天药物发现的各个方面,例如用于hit识别的虚拟筛选(VS)技术和用于先导物优化的方法。分子对接方法可用于模拟小分子和蛋白质在原子水平上的相互作用,这使我们能够表征小分子在靶蛋白结合位点的行为,并阐明基本的生化过程[6-8]。
2、分子动力学模拟
2.1
分子动力学基本原理
如果把分子对接比喻为一幅图片,那么分子动力学模拟就像是一帧帧画面组成的动态电影,丰富多彩,饶有情趣,让人情不自禁!
用牛顿经典力学计算许多分子在相空间中的轨迹,求解系统中的分子或原子间作用势能和系统外加约束共同作用的分子或原子的牛顿方程;模拟系统随时间推进的微观过程,通过统计方法得到系统的平衡参数或输运性质[3-5]。
分子动力学的算法是有限差分方法(一种求偏微分或常微分方程和方程组定解问题的数值解的方法)。最常用的数值求解算法有Verlet算法,leap-frog算法,Beeman算法及Gear所提出的校正预测法[1]。
2.2
分子动力学模拟中的常用概念
1) 周期性边界条件:只模拟实际物质中很小一部分,使模拟体系成为无限具有相同性质的分子体系的,该部分在三维空间中周期性的存在,代表整个体系。
2) 势函数:势函数是描述分子间相互作用的函数。在分子动力学模拟中,势函数的选取对模拟的结果起着决定性的作用。
3) 系综:在一定的宏观条件下,大量性质和结构完全相同的、处于各种运动状态的、各自独立的系统的集合。系综是用统计方法描述热力学系统的统计规律性时引入的一个基本概念。
①正则系综是组成系综的系统是由N个粒子组成的,同温度为T的很大的热源相接触并达到热平衡。也可以这样设想:取大数M个体积为V、粒子数为N的相同的系统构成系综,其中任意一个系统均可作为被研究的系统,其余M−1个系统起着恒温槽的作用,系统间有能量交换,并共同处于热平衡。
②微正则系综是指系统原子数N、体积V、能量E保持不变,又称为NVE系综。
③等温等压系综是正则系综的推广,是统计力学系综的一种。这个系综是具有恒定温度和压强的体系。每个系综内的体系可以和其他体系进行能量和体积交换。但系综内各体系的能量总和以及体积总和是固定的,而且各体系有相同的粒子数。
4) 积分步长:分子动力学计算的基本思想是赋予分子体系初始运动状态之后利用分子的自然运动在相空间中抽取样本进行统计计算,积分步长就是抽样的间隔。选取合适的积分步长的原则是积分步长小于系统中最快运动周期的十分之一。
2.3
分子动力学模拟的基本流程
1)评估体系:首先对我们要进行模拟的体系做一个简单的评估, 有三个问题是我们必须要明确的:
2)选择工具:选择合适的模拟工具,这需要你非常广泛谨慎地查阅文献, 看看别人用这些工具都做了些什么, 有没有和你的研究体系类似的, 相关的研究。
①软件的选择:通常与软件主流使用的力场有关, 软件本身也具有一定的偏向性。
蛋白体系: GROMACS, AMBER, NAMD均可;
DNA, RNA体系: 首选AMBER;
界面体系: DL_POLY比较强大;
材料体系:LAMMPS是不错的选择。
②力场的选择:力场用来描述体系中最小单元间的相互作用, 是对实验性质或量子化学计算结果拟合后生成的经验式,常见的有三类力场: 全原子力场, 联合力场, 粗粒化力场。
3)初始结构:通过实验数据或者某些工具得到体系内的每一个分子的初始结构坐标文件,之后, 我们需要按我们的想法把这些分子按照一定的规则或是随机的放在一起, 从而得到整个体系的初始结构, 这也是我们模拟的输入文件。
4)输入参数:得到了结构输入文件, 我们还需要力场参数输入文件, 也就是针对我们体系的力场文件。这通常由所选用的力场决定, 包括电荷, 键合参数和非键参数等势能函数的输入参数。
5)确定盒子:体系的大小通常由你所选用的盒子大小决定. 我们必须对可行性与合理性做出评估, 从而确定体系的大小, 这依赖于具体的体系。
6)能量最小化:比较常用的能量最小化方法有两种, 最速下降法和共轭梯度法。最速下降法是快速移除体系内应力的好方法, 但是接近能量极小点时收敛比较慢, 而共轭梯度法在能量极小点附近收敛效率高一些。所以一般做能量最小化时都是先利用最速下降法进行优化, 完成之后再对得到的构象利用共轭梯度法优化一次。
7)平衡模拟:设置适当的模拟参数, 并且保证这些参数的设置与力场的构造过程相一致。
如何判断体系达到平衡呢?
1、看能量(势能, 动能和总能)是否收敛;
2、看体系的压强, 密度等等是否收敛;
3、看体系的RMSD是否达到你能接受的范围。
8)成品模拟:经过一段时间的平衡模拟, 在确定体系已经完全弛豫之后, 就可以开始采集数据了。
9)数据分析:数据拿到手后, 很容易通过一些可视化软件得到轨迹动画, 但这并不能拿来发文章,真正的工作才刚刚开始!!!
2.4
分子动力学模拟的应用
随着对生物大分子的深入研究,靶点蛋白与小分子配体的相互作用,已经从传统认识上的“钥匙和锁”机制,转变成一种“手和手套”的诱导匹配(induce-fit)机制。这是因为科学家们逐渐认识到,蛋白质和配体的柔性使它们在相互结合时会寻求最吻合、能量最低的构象。通常情况下,我们在实现对接前需要对靶点蛋白的结构进行优化,提供较具代表性的蛋白构象;对接完成后,我们通过打分函数得到的配体蛋白复合物准确度不是很高,这时候就需要借助动力学模拟来计算结合能,验证蛋白与筛选出的小分子配体的有效结合情况;此外我们还可以借助动力学模拟研究药物与靶标蛋白的作用机理,从而为药物设计和寻找新药提供直接线索。
图7 分子动力学模拟研究内容
//应用示例1:
图8 GPCRs引起抑制素激活[9]
//应用示例2:
图9 RAS展示显著的构象灵活性和适应性[10]
总结
随着人类基因组研究和蛋白质组研究的不断深入,分子对接及分子动力学技术在未来将面临更加巨大的挑战,特别是人工智能技术和计算资源的巨大需求,将不断推动这两项技术的不断前进和变革,在揭示生命奥秘中也将会更加趋于成熟和完善。分子对接及分子动力学技术对生物学发展的贡献,也将促进新的交叉学科继续产生,共同推动生命科学进入一个全新的境界[11]。
参考文献
[1] Bo Li, Shuxia Liu, Senbiao Fang, Yubao Chen, Wenxiang Hu. Progress in Molecular Docking and Molecular Dynamics Simulation. Journal of Comparative Chemistry, 2019, 3(1), 1-10.
[2] Lu, J. Molecular Docking and Molecular Dynamics Simulations of Inhibitors Binding to Jack Bean Urease. Acta Chimica Sinica, 2011, 69, 2427-2433.
[3] Gao, W. Mo-lecular Dynamics Simulation of Fracture in Micro and Nano Scale. Foreign Electronic Measurement Technology, 2015, 10, 178-190.
[4] Sun, X., Pei, S., Wang, J., et al. Coarse-Grained Molecular Dynamics Simulation Study on Spherical and Tube-Like Vesicles Formed by Amphiphilic Copolymers. Journal of Polymer Science Part B: Polymer Physics, 2017, 55, 1220-1226.
[5] Xu, Y. Molecular Dynamics Simulation of Water Mole-cules Adsorbed at Muscovite Surface. CIESE Journal, 2014, 12, 226-239.
[6] Meng XY, Zhang HX, Mezei M, Cui M. Molecular docking: a powerful approach for structure based drug discovery. Curr Comput Aided Drug Des. 2011, 7(2):146-157.
[7] Gohlke H, Klebe G. Approaches to the description and prediction of the binding affinity of small-molecule ligands to macromolecular receptors. Angew Chem Int Ed Engl. 2002, 41(15): 2644–2676.
[8] McConkey BJ, Sobolev V, Edelman M. The performance of current methods in ligand-protein docking. Current Science. 2002, 83:845–855.
[9] Hollingsworth SA, Dror RO. Molecular Dynamics Simulation for All. Neuron. 2018, 99(6): 1129-1143.
[10] Outi M. H. Salo-Ahen, ORCID,Ida Alanko, et al. Molecular Dynamics Simulations in Drug Discovery and Pharmaceutical Development. Processes, 2021, 9(1), 71.
[11] Liu, M. and Hu, W.X. Using Deep Belief Network and Computation Methods to Improve Opioid Receptor Biological Activity Prediction, Novel Agonists and Antagonists Structural Modeling. 2nd International Conference on Manufacturing Science and Information Engineering (ICMSIE), 2017, 538-543.