2022-12-12

Nat Methods | 定量单细胞的细胞外蛋白、蛋白复合物和mRNA

原创 huacishu 图灵基因 2022-12-12 10:11 发表于江苏

收录于合集#前沿生物大数据分析


撰文:huacishu

IF=47.99

推荐度:⭐⭐⭐⭐⭐

亮点:

1、作者提出了近距离测序(Prox-seq),用于同时测量数千个单个细胞中的蛋白质、蛋白质复合物和mRNA。Prox-seq将邻近连接分析与单细胞测序相结合,以测量目标蛋白质的所有成对组合中的蛋白质及其复合物;

2、作者验证了Prox-seq,并分析了T细胞和B细胞的混合物,以表明它能够准确识别这些细胞类型并检测已知的蛋白质复合物;

3、作者指出Prox-seq为单细胞表型提供了一种尚未开发的测量模式,并可以发现不同细胞类型中未表征的蛋白质相互作用。


美国芝加哥大学Savaş Tay教授课题组在国际知名期刊Nat Methods在线发表题为“Quantification of extracellular proteins, protein complexes and mRNAs in single cells by proximity sequencing”的论文。作者提出了近距离测序(Prox-seq),用于同时测量数千个单个细胞中的蛋白质、蛋白质复合物和mRNA。Prox-seq将邻近连接分析与单细胞测序相结合,以测量目标蛋白质的所有成对组合中的蛋白质及其复合物。作者验证了Prox-seq,并分析了T细胞和B细胞的混合物,以表明它能够准确识别这些细胞类型并检测已知的蛋白质复合物。

接下来,通过研究人类外周血单核细胞,作者发现幼稚的CD8+T细胞显示了CD8-CD9蛋白复合物。最后,作者研究了人巨噬细胞Toll样受体(TLR)信号传导过程中的蛋白质相互作用。作者观察信号特异性蛋白复合物的形成,发现在脂多糖(TLR4)和Pam2CSK4(TLR2)刺激下CD36共受体活性和附加信号整合,并表明蛋白复合物定量识别巨噬细胞接收的信号输入。Prox-seq为单细胞表型提供了一种尚未开发的测量模式,并可以发现不同细胞类型中未表征的蛋白质相互作用。

在单细胞水平上测量单个蛋白质及其复合物的能力是理解细胞功能的最有用的方法之一,但在对单细胞蛋白质及其复合物进行多重测量时仍存在重大障碍,因为一种蛋白质的成对复合物的数量可以与所测量的蛋白质数量成二次方比例。这需要一种能够编码大量输出的方法,因为每次测量都必须能够识别感兴趣的蛋白质及其附近的其他蛋白质。

作者开发了一种称为Prox-seq的单细胞分析,并展示了用于蛋白质组学分析的端到端实验和计算管道(图1a)。Prox-seq通过将单细胞RNA测序(scRNA-seq)与邻近连接分析(PLA)相结合,同时测量细胞外蛋白、其蛋白复合物和mRNA。从PLA产物的计数中,可以推断蛋白质丰度,这与CITE seq(通过测序对转录组和表位进行细胞索引)和REAP seq(RNA表达和蛋白质测序分析)以及蛋白质复合物信息(图1b)等试验类似。此外,Prox-seq可以量化基因表达,从而实现单细胞的多模式分析。

对于每个蛋白质靶点,作者生成了一对Prox-seq探针(探针A和B),每个探针都是与单链DNA寡聚体结合的抗体(图1a)。选择低聚物与抗体的比例以确保探针保持其结合目标的能力。低聚物的设计使得探针A的每个成员都可以通过通用连接器区域与探针B的任何成员连接(图1c)。用于形成PLA产品的低聚物包括几个关键特征(图1d)。

完整的PLA产品包括用于PCR校正的唯一分子标识符(UMI)区域、用于识别A和B抗体的蛋白质靶标的两个条形码区域、用于捕获的3′poly-a和用于PCR的引物结合位点。通用连接区允许近距离连接,只有连接的产物才能被PCR扩增。

目前,单细胞蛋白质复合物的测量仅限于每个细胞少于10个复合物。Prox-seq将这一数字扩展到数百个蛋白质复合物。此外,Prox-seq可以测量蛋白质和全转录组mRNA,从而概括REAP seq和CITE seq的功能。

Prox-seq同时测量蛋白质、蛋白质复合物和mRNA

首先证明PLA产物可以用scRNA-seq测量,并且PLA数据显示细胞类型特异性差异。选择了与T细胞和B细胞标记相对应的11个蛋白质靶点。Prox-seq探针与两个同种型对照品一起用于这些靶点。将该面板应用于T细胞(Jurkat)和B细胞(Raji)的混合物,然后使用Drop-seq管道对其进行分析。

Prox-seq测量表明,细胞可以使用mRNA、蛋白质或总PLA产物精确聚类(图1e–h)。通过从Prox-seq探针A或B中检测到蛋白质目标的DNA条形码的总次数来估计蛋白质丰度。通过mRNA或蛋白质对细胞进行聚类可以识别相同的细胞类型(图1e,f,h)

类似地,可以使用所有169种PLA产物对细胞进行聚类,其中除了蛋白质丰度外,还包括蛋白质邻近位置信息(图1g)。无论使用何种数据类型,一旦细胞聚集,Prox-seq显示出基因表达和蛋白质丰度之间的良好一致性(图1i)。作者还发现,PD1–CD3和CD3–CD3复合物PLA产物是Jurkat集群中两种最显著富集的PLA产物(图1j)。

流式细胞术证实CD3和PD1是Jurkat特异性蛋白。对于Raji集群,ICAM1–HLA-DR和HLA-DR–HLA-DR是两种最显著富集的PLA产物(图1j)。流式细胞术证实ICAM1和HLA-DR确实在Raji细胞上唯一表达。

Prox-seq与现有单细胞蛋白质组学技术相比的一个主要优势是,它揭示了每个靶蛋白的成对蛋白质相互作用(图1)。作者根据Prox-seq探针丰度计算了每个PLA产品的预期随机计数。这个预期的随机值反映了来自随机连接的PLA产物的最大量。

当将这些值与实验数据进行比较时,发现几种PLA产物的丰度高于预期的随机值,表明存在稳定的蛋白质复合物(图2)。例如,CD28–CD28和CD3–CD3同源二聚体在Jurkat细胞中是高丰度复合物(图2b),而PDL1–PDL1同源二聚物在Raji细胞中以非常高的丰度存在(图2c),正如预期的那样。测量的和预期的随机计数之间的差异(Δ)表明PLA产物计数归因于每个细胞上的稳定蛋白质复合物(图2)。

为了进一步改进随机邻近背景的估计,作者开发了一种计算方法(图2a–e)。原始Prox-seq数据提供了测量的PLA产品计数的矩阵,从中计算了每个蛋白质复合物的最大背景范围。然后,执行了一个迭代算法来进一步细化背景估计。

如果蛋白质复合物估计值在统计上不显著,则算法预测PLA产物不对应于稳定的复合物,并且先前迭代的蛋白质复合物估算值保持不变。如果复合物估计具有统计意义,则算法预测PLA产物对应于稳定的蛋白质复合物,复合物计数用当前迭代的估计值更新(图2a)。更新的蛋白质复合物计数用于调整PLA产物计数,算法开始下一次迭代。预期的随机计数随着每次迭代而变化(图2d,e)。

测量的计数和最终背景之间的差异揭示了其他几个低丰度的复合物,但仍显著高于随机连接背景(图2f,g)。将算法应用于Jurkat细胞和Raji细胞,发现四种蛋白质的PLA产物计数的50%以上归因于蛋白质复合物:Jurkat中的CD3和CD28同源二聚体,以及Raji细胞中的PDL1和HLA-DR同源二聚物(图2f,g)。

总之,作者所提出的算法允许我们确定与蛋白质复合物相对应的额外的低丰度PLA产物,并提供了一个统计框架来识别和量化数据中的这些复合物。

外周血单个核细胞蛋白质复合物的多重量化

接下来,作者探索了Prox-seq测量大量蛋白质复合物的潜力,并测试了其可扩展性。基于平板的数据显示了明确识别预期细胞类型的蛋白质测量:CD8+T细胞、CD4+T细胞和非T细胞(图3a)。作者的复合物检测算法确定了这些细胞中不同水平的20种蛋白质复合物(图3b)。

如前所述,作者鉴定了几种已知的同二聚体,包括CD3同二聚物、CD28同二聚和CD9同二聚(图3b)。此外,确定了CD3-CD8和CD3-CD4蛋白复合物的存在(图3b)。CD4+T细胞的单细胞热图(图3c)和CD8+T细胞(图3d)在检测到的PLA产物和检测到的蛋白质复合物方面显示出明显的差异。

CD8与幼稚样CD8+T细胞上的CD9相关

除了这些已知的蛋白质复合物,作者还发现了CD9和CD8之间潜在的新相互作用。对于CD8+T细胞,作者观察到细胞可以分裂为两个明确的亚群。在一个亚群中,CD9-PLA产物主要被鉴定为与自身配对(CD9-CD9)。其他亚群显示CD9-PLA产物主要与自身以外的蛋白质配对(图3e)。

有趣的是,对CD9-CD9-PLA产物低亚群的分析确定了CD9-CD8蛋白复合物的存在(图3f)。这种蛋白质复合物的出现并不能明确归因于蛋白质表达水平的变化,因为CD3、CD8和CD9在两种细胞群中都有类似的表达(图3g)。虽然CD4+T细胞也在较小程度上显示了这两个亚群,但在这些细胞中没有发现CD4-CD9蛋白复合物。

为了探索蛋白质复合物和mRNA之间的相互作用,作者同时测量了8700多个单细胞的mRNA、蛋白质复合物和蛋白质水平。作者能够根据其mRNA水平对细胞类型进行聚类。PLA产物信息与mRNA信息所识别的细胞类型密切相关(图4a,b)。


接下来,研究了每个靶点的mRNA和蛋白质水平之间的相关性。mRNA和蛋白质在簇水平上相关,但在单细胞水平上仅适度相关(图4c)。PLA产物反映了各种簇的蛋白质和复合物的水平(图4d)。

使用10x基因组学管道的测量再现了类似的结果,即基于CD9–CD9 PLA产物水平将CD8+T细胞分为两个亚群(图4e)。在具有低CD9–CD9 PLA产物的亚群中,发现CD9与CD8在蛋白质复合物中(图4f)。利用mRNA信息,发现这两种细胞类型显示出非常不同的转录谱(图4g)。没有CD9–CD8蛋白复合物的细胞显示GZMB和NKG7基因的上调(图4h)。这些基因中的每一个都是活化淋巴细胞的标志物。

相反,具有CD9–CD8蛋白复合物的细胞显示出SELL和CCR7基因的上调,这两个基因都是幼稚样T细胞的标记(图4h)。此外,还观察到CCR7蛋白的差异表达(图4i)。总之,这些数据表明CD9–CD8蛋白复合物的存在是幼稚样CD8+T细胞的标志。

Prox-seq通过受体动力学显示巨噬细胞信号叠加

作者开发了一组Prox-seq探针对,靶向已知参与核因子-κB(NF-κB)信号通路的15种表面蛋白。首先,将原代人巨噬细胞暴露于以脂多糖(LPS)、Pam2CSK4(PAM)或两者形式激活NF-κB的配体。LPS激活TLR4,PAM激活TLR2,两种受体都向NF-κB通路发出信号。未处理的细胞作为对照。对于每种配体,细胞被刺激5 min,2 h或12 h(图5a)。然后,收集细胞,固定并用基于平板的Prox-seq处理。

总体而言,刺激2h后PLA产物明显增加,12h时急剧下降(图5b)。相比之下,12h时总蛋白水平始终较低(图5c)。一种蛋白质产生一对的趋势并不是严格意义上的蛋白质表达水平的结果,这取决于时间(图5d)。与先前的NF-κB动态单活细胞成像研究一致,LPS刺激显示出更快的反应,大多数PLA产物在5min达到峰值,而PAM显示出较慢的反应,在2h达到峰值(图5e)。

Prox-seq非常适合研究当细胞遇到两种不同信号时,信号是如何整合的。当LPS和PAM同时用于巨噬细胞的组合刺激时,PLA产物的平均变化在刺激持续时间内以相加的方式显示了这两种刺激的特征,具有宽的峰值,持续到12 h(图5e)。蛋白质显示出与PLA产物相似的趋势(图5f)。这一结果与先前使用活细胞显微镜鉴定LPS和PAM之间非整合信号的研究一致。

Prox-seq识别巨噬细胞接收的信号输入

NF-κB转录因子的活细胞显微镜测量可以预测细胞是否受到LPS或PAM的刺激。作者推断,受体组织的变化也可以在混合刺激场景中识别刺激配体。使用LPS或PAM刺激后每个时间点的PLA计数数据训练逻辑回归分类器。对于2-h时间点,分类器能够识别PAM样或LPS样巨噬细胞反应(图6a)。该分类的最大系数是TLR2–TLR2 PLA产物的存在,其在LPS处理的细胞中明显升高(图6b)。

与逻辑回归分类器的结果一致,TLR2–TLR2蛋白复合物出现在LPS处理巨噬细胞2h后,12h后消失 (图6c)。相反,在PAM刺激下,这种蛋白质复合物在早期时间点不存在(2 h) 看起来只有 PAM处理后2h出现(图6c)。虽然TLR2同型二聚体已知存在,但以前并不认为它参与LPS或PAM信号传导。

Prox-seq揭示Toll样受体刺激下的信号可变性

最后,作者探索了PLA数据中显示的单细胞信号响应的可变性。当比较所有PLA数据的平均值和方差时,与对照组相比,在所有刺激条件下,方差显著减少(图6d)。低方差PLA产物均含有CD36 Prox-seq条形码(图6e)。含有CD36的所有PLA产物的直方图显示了对照细胞中的两种模式,由UMI的数量分隔(图6f)。LPS处理导致细胞转移到较高的UMI模式(图6f)。由于这种变化已经在5min内发生,PLA产物的增加不太可能是蛋白质表达增加的结果。

相反,CD36参与了探针小组靶向的其他蛋白质的相互作用和重排。这进一步得到了新的CD36蛋白复合物(图6c)。此外,氧化低密度脂蛋白刺激可诱导CD36与TLR4和TLR6形成蛋白复合物。总之,这些结果表明Prox-seq可识别信号传导过程中受体成分的重排和细胞间变异。

讨论

总之,作者提出了一种实用且广泛适用的技术,用于同时测量单个细胞中的细胞外蛋白、蛋白复合物和mRNA,并展示了其在不同生物背景下的应用。预计Prox-seq将是理解信号传导、分化、发育和细胞决策的重要工具,而这些在很大程度上是由蛋白质相互作用的变化驱动的。与常用的单细胞测序方法的兼容性使其被许多实验室广泛采用。最重要的是,Prox-seq可以识别成对蛋白质复合物的成员,为单细胞测序提供了新的模式。

在这项研究中,作者证明了在完整的单个细胞中检测表面蛋白,而原则上Prox-seq可以应用于细胞内蛋白以及细胞裂解物。

教授介绍

Savaş Tay教授出生在土耳其,毕业于伊斯坦布尔马尔马拉大学,获得物理学和教育学学位。2008年,他在亚利桑那大学光学科学学院获得博士学位。博士毕业后,他在斯坦福大学生物工程系担任博士后。2011年,他被任命为瑞士苏黎世联邦理工学院生物系统科学与工程系的生物工程助理教授。他是一名系统生物学家和生物工程师,从事生物学、物理学和工程学的研究。

他的首要目标是从工程师的角度理解生物系统是如何工作的,并利用这些知识来操纵细胞和基因途径,帮助治愈疾病。在技术方面,他的实验室通过集成微流体和光学技术开发出高通量和高含量的单细胞分析设备。他的实验室开发的微流体技术创造了逼真的环境,模拟活体组织,并以极高的精度和吞吐量测量单个细胞的动态过程。最近,他发现分子噪声改善了细胞信号传输,并展示了振荡输入如何通过与分子噪声协同作用来控制转录动力学。


参考文献

Vistain L, Van Phan H, Keisham B, et al. Quantification of extracellular proteins, protein complexes and mRNAs in single cells by proximity sequencing. Nat Methods. 2022;10.1038/s41592-022-01684-z. doi:10.1038/s41592-022-01684-z

你可能感兴趣的:(2022-12-12)