Nature | 神经网络模拟寻找蛋白质变构与弱结合位点
原创 旧岛望月亮 图灵基因 2022-04-27 07:03
收录于合集#前沿分子生物学技术
撰文:旧岛望月亮
IF=49.962
推荐度:⭐⭐⭐⭐
亮点:
作者设计了一种名为ddPCA的方法绘制出了蛋白质结合域的变构图谱。
具有重要功能的蛋白质的活性通常是可调控的,它们受其活性位点外的共价修饰、突变以及与其他分子相互作用的影响。蛋白质中从一个位点到另一个位点的信息传递被称为变构,Monod将其称为生命的第二个秘密。变构调控在信号转导、转录调控和代谢调控中起着重要作用。2022年4月6日西班牙巴塞罗那学院Ben Lehner等人利用深度突变扫描*研究了蛋白质的变构特点。通过量化多遗传背景下的多种分子表型,结合神经网络模拟热力学模型,作者探究了突变的生物物理效应。该研究结果发表在名为”Mapping the energetic and allosteric landscapes of protein binding domains”的文章中。
*深度突变扫描:一种研究蛋白质变构的技术。使基因改造的酵母细胞表达受体结合域(rbd)的刺突蛋白的片段。由于酵母细胞在蛋白质表达的过程中会发生突变,因此就能产生许多与原始野生型病毒结构不同的rbd。
蛋白质之间的结合取决于亲和力和活性状态的浓度。现有的方法由于不能区分突变对结合亲和力以及蛋白质丰度的影响,所以无法准确识别变构位点。因此,作者利用蛋白质片段的互补作用(PCA)来定量分析突变对蛋白质丰度以及其结合亲和力的影响。如图1a所示,BindingPCA通过将A、B蛋白与二氢叶酸还原酶(DHFR)的不同片段相连接,从而量化两种蛋白之间的结合。蛋白质之间的相互作用促使DHFR片段形成完整的功能酶,该酶能将二氢叶酸还原为四氢叶酸,其活性可以通过一定条件下的细胞生长情况来测量。而AbundancePCA使A蛋白结合DHFR中的一个片段,另一片段高度表达。通过一定条件下的细胞生长情况推测突变对A蛋白丰度的影响。为了理清测得的突变效应所引起的自由能变化,上述ddPCA法从两个维度分析突变的影响。一方面,用突变对结合亲和力和丰度的影响量化其对两种或多种分子表型的影响。另一方面,从多种遗传背景量化突变效应(图1c)。
将ddPAC应用于人类基因组中最常见的两个蛋白相互作用域(图1d)。其中,人类生长因子受体结合蛋白2(GRB2)碳端的SH3结构域主要与GRB2相关结合蛋白2 (GAB2)中富含辅氨酸的线性多肽相结合,而衔接蛋白PSD95(又名DLG4)的PDZ结构域主要与CRIPT蛋白的羧基端相结合。作者得到了单氨基酸和双氨基酸取代突变的SH3结构域和PDZ3结构域的突变数据集。分别使用bindingPCA和AbundancePCA量化了突变对蛋白结合亲和力以及丰度的影响(图1b)。突变效应矩阵表明,对结合亲和力以及丰度有较大影响的突变主要分布在两个区域(图1f和g)。将引起亲和力以及丰度变化的突变相比较,发现大多数改变结合亲和力的突变也会改变蛋白质丰度(图1h)。这与作者的预期相符,即导致亲和力改变的主要原因是蛋白质稳定性的变化。
图1 ddPCA定量分析突变对蛋白质丰度和结合的影响
接着,作者利用神经网络将热力学模型与ddPCA获得的实验数据相拟合,从而根据单氨基酸取代对两种分子表型的影响来推断潜在的自由能变化(图2a和b)。蛋白质结合可以简单地模拟为展开、折叠和结合能量状态的三态平衡(图2a)。上述三态模型能定量拟合利用bindingPCA和AbundancePCA得到的实验数据(图2c)。为了评估上述模型推断的自由能变化是否与实际相符,将其得到的数值与体外测得的数据相比较。发现推测得到的折叠自由能与体外测得的单氨基酸取代后的PDZ3结构域所对应的自由能之间一致程度很高(图2d)。
图2 从分子表型到自由能变化
相对于表型效应图,自由能图谱(图3a和b)能准确预测地两个及以上的组合突变效应。此外研究发现与结合亲和力相比,突变对折叠自由能的影响更大且范围更广(图3d)。所以蛋白结合亲和力的变化主要是由蛋白质丰度的改变所引起的。比较不同位置残基突变的自由能发现,核心残基的突变对折叠自由能的影响最大,而结合位点的突变对亲和力的影响最大(图3c)。综合量化突变的影响发现,在GRB2的SH3结构域以及PSD95的PDZ结构域中,86%和67%的突变增加了结合亲和力,80%和77%的突变降低了结合亲和力(图3e)。
图3 SH3和PDZ结构域结合和折叠自由能的图谱
将蛋白质中每个残基折叠自由能的平均变化相加,发现表面或结合区域的残基往往比核心残基对突变的敏感性更低(图4a和b)。每个残基的平均折叠自由能与其同蛋白表面的距离呈负相关(图4c)。尽管突变总的来说破坏了折叠的稳定性,但一部分残基的突变反而增加了稳定性。例如,作者在GRB2的SH3结构域中发现了9个残基,在PSD95的PDZ3结构域中发现了3个残基。进化保留下来的不利于稳定性的氨基酸可以用于蛋白质的选择性结合。例如,SH3结构域的9个残基中有4个位于结合区域,PDZ3结构域的残基中有1个位于结合区域。利用上述原理,AbundancePCA可以在结合蛋白以及蛋白质功能未知的情况下识别具有重要功能的表面位点。而找到稳定性较弱的表面功能位点对治疗具有重要意义。
将结构域上每个残基结合自由能的平均变化相加,发现结合区域的突变效应最大(图4d)。接着,作者测试了结合区域外的残基是否也富集了调节结合亲和力的突变。对SH3结构域中的两个位点(G15和G45)和PDZ3结构域中的八个位点(R312、R318、G329、G330、I336、D357、E373和A375)进行分析,发现其结合自由能的平均变化大于结合区域突变的变化(图4e和f)。作者将这些远离结合位点的残基称为主要变构位点,而这些位点上的许多突变对结合亲和力的影响较大。
图4 突变对蛋白稳定性以及结合亲和力的影响
虽然上述十个残基是变构效应最强的位置,但影响结合亲和力的突变实际上发生在两个蛋白结构域上(图3a, b)。将变构突变定义为能产生与结合区域突变的自由能变化相同的突变。作者发现SH3结构域的24个不同残基中共有55个变构突变(33个在核心残基,22个在表面残基),PDZ3结构域的49个残基中共有152个变构突变(83个在核心残基,69个在表面残基)。在SH3和PDZ3的表面残基中,40%和55%至少有一个变构突变(图5a和b)。这些结果表明变构突变主要存在于蛋白的核心和表面。此外,在GRB2的SH3结构域和PSD的PDZ3结构域中,结合区外的突变发生变构的可能性取决于其与配体的距离(图5c)。
图5 蛋白质表面是调节结合亲和力的常见位点
该文章提出了一种推断突变的体内生物物理效应的方法,并利用ddPCA得到了两种蛋白结构域突变的图谱。尽管ddPCA可以应用于多种胞内蛋白质,然而还需要其它检测方法来研究分泌蛋白和不能在酵母中表达的蛋白质。作者认为可以通过ddPCA和相关方法获得治疗靶点蛋白的变构图谱,从而推动变构药物的研发。此外,利用该方法得到的定量数据集能推动机器学习应用于分子生物学,有效地根据序列预测大分子的稳定性、亲和力、特异性和变构。
教授介绍
Ben Lehner为巴塞罗那基因组调控中心的研究员,于2004年获得剑桥大学博士学位。他领导的课题组试图利用模型生物(酵母,蠕虫)和计算分析来探究能否从一个人的基因组序列中预测其生物学特性,并试图回答个体差异是如何在基因、环境、生活史、双亲和随机变异源之间的相互作用中产生的这一问题。其成果发表在Science、Nature、Cell等期刊上。
参考文献
Faure, A.J., Domingo, J., Schmiedel, J.M.et al. Mapping the energetic and allosteric landscapes of protein bindingdomains. Nature 604, 175–183 (2022).https://doi.org/10.1038/s41586-022-04586-4