2022-02-09

Nat Biotech | TP53和KRAS在癌症中变异体的大规模平行单细胞表型分析

原创 苏安 图灵基因 2022-02-09 09:24

收录于话题#前沿分子生物学技术

撰文:苏安

IF54.908

推荐度:⭐⭐⭐⭐⭐

亮点:

精准医疗的关键是需要预测每个患者的特定基因变异是如何发挥作用的,虽然目前基因组测序研究已经确定了癌症中的数百万个体细胞变异,但是通过个体细胞变异来预测大多数癌症的表型影响仍然具有挑战性。在这里,研究人员开发了一种方法,通过合并扰动序列来从功能上评估单个细胞的变异影响。他们测试了200TP53KRAS变异对超过30万个单个肺癌细胞的RNA谱的影响,并根据对RNA谱的影响将变异分为不同的表型亚群,以区分功能获得、功能丧失和显性阴性变异,最终通过正交分析进行了验证。他们的研究提供了一种面对未知基因,可扩展的方法来判断编码变异对表型的影响,具有应用于多种疾病的潜力。

 

对于预测细胞变异对功能影响的相关研究,先前的方法都是运用实验或者计算的方法,但这两种方法均有不足之处。在实验上,功能基因组学方法虽然能够评估了单个基因中的许多等位基因,但通常依赖于基因特异性的定制分析来捕获信号功能。在计算上,主要集中于3D蛋白结构或进化上保守区的变异,但是无法解决诱变过程中的复发检测。


近期,在Nature biotechnology杂志上发表了一篇名为“Massively parallel phenotyping of coding variants in cancer with Perturb-seq”的文章,作者是著名的人类细胞图谱研究先锋——Aviv Regev。Aviv Regev的研究团队通过单细胞rna测序(scRNA-seq),使用基于单细胞表达的变异影响表型(sc-eVIP)进行了表型编码变异的合并基因筛选。他们研究了200个TP53和KRAS基因的变异,开发了区分特定变异的功能影响的计算方法,并证明了基于群体的测试可能无法捕捉到变异对单细胞异质性的影响。

为了评估大规模编码变异的影响,研究人员修改了Perturb-seq(扰动序列),以同时用DNA条形码标记外源性引入的癌症变异以及单细胞水平上的诱导表达状态。根据之前的工作,他们推断,可以通过比较具有变异基因和WT基因构建的细胞之间的表达谱来评估变异功能。

TP53是一个在癌症中高度突变的肿瘤抑制基因。为了进行测试,研究人员首先评估了TP53中的100个编码变异。他们使用了A549肺癌细胞,这是一种TP53-wt细胞系,是一种适用于TP53功能的生物传感器。他们将这些变异转导到细胞中,使每个细胞选择单个变异,选择成功感染的细胞使用嘌呤霉素2天,让细胞再恢复2天,并进行scRNA-seq。研究人员恢复了162,314个高质量细胞,其中84%有可检测到的变异条形码,62%注释了单个变异。在大于70%的细胞变异中,该变异被条形码的唯一分子标识符(UMIs)支持。大多数TP53变异的表达水平与WT结构相当,除非两个变异的表达差异超过1.5倍。他们校正了每个细胞中的条形码表达,并且只使用包含单一变异的细胞进行分析。最后,scRNA-seq图谱的低维嵌入显示了同义变异和已知功能缺失变异的不同分布情况。图1.一种编码变异表型的干扰序列分析。

接下来,研究人员通过上述对变异的表达谱进行分类,sc-eVIP评分和聚类评分都区分了预期的功能丧失/显性阴性变异和对照变异。具体来说,所有同义和ExAC对照变体的sc-eVIP得分与WT相似,并与R337C形成一个单独的集群(WT-like)。其余73/74个变异,包括TP53热点位置具有显著的sc-eVIP得分,形成了一个明显的聚类。因为这个集群包含了没有检测到的变异的细胞,这些结果表明,这个集群中的变异被正确地归类为功能丧失。与预期的一样,对照变异诱导了TP53过表达的典型特征,包括CDKN1A和RPS27L表达的诱导。sc-eVIP评分与TP53-wt-3处理下优化的tp53特异性细胞分析结果一致(Spearmanρ=0.73,P=2.1×10−17),通过sc-eVIP评分和表达亚群,将不属于wt类的变异进一步分为两组(影响I和II)。影响I变异诱导典型TP53的程度低于wt样变异,而影响II变异不影响(或抑制)TP53。

在大多数有影响的I和II变异中,CDKN1A和RPS27L的抑制,与之前对71/74个这些变异一致,不仅功能丧失,而且显性阴性。在这里,68/71和62/71的显性阴性变异分别抑制了CDKN1A和RPS27L,40/71和10/71分别抑制了13-300基因的TP53信号。

在单细胞水平上,WT样和影响变异在细胞状态中并不排斥,只是它们在这些状态下的分布不同,特别是在细胞周期中。因此,使用表达谱来预测单个细胞是否具有影响或wt样变异的准确性有限,而使用每个细胞周期阶段的细胞比例的总体变异分类的方式可以得到高度准确的结果。这些结果表明TP53变异表型主要反映了细胞状态分布的变化,并且验证了我们利用扰动序列方法对TP53变异进行高精度功能分类是有效的。图2.编码变异Perturb-seq概括了肿瘤抑制基因TP53中已知的功能缺失变异的生物学特性

鉴于最近在靶向致癌基因KRAS的特定变异的治疗方面的成功,研究团队评估了这个方法在101个KRAS变异上的普遍性。研究人员选择了75个最常见的KRAS等位基因和26个阴性对照,包括ExAC中的16个同义变异和10个变异。结果表明,sc-eVIP评分与过表达KRAS等位基因的人胚胎肾细胞(HA1E)的正交细胞检测(GILA48)之间存在良好的相关性,这进一步支持了这项方法对于单细胞分类的准确性。随后,他们通过单细胞图谱之间的相关性确定了5个变异聚类,并对跨变异的平均基因图谱进行了聚类,以确定基因程序。第一个表达谱聚类捕获了功能获得的变体,包括已知热点位置12、13和61的变体,其sc-eVIP得分最高。第二个聚类包含了所有的同义变异和9/10个ExAC变异,表明它捕获了wt样变异。其余3个聚类的sc-eVIP得分较低,但不如WT聚类低,并包含了sc-eVIP得分差异不断增加的变异。

根据sc-eVIP得分从wt样到功能获得的逐渐进展,研究人员用颜色表示了这三个变异簇,即影响I(绿色)、II(非典型,紫色)和III(黄色)。受影响的I和III都包括核苷酸结合位点、效应结合和变构叶附近的变异,并诱导了一个粘附和信号程序(程序11,,这在受影响的IV(功能获得)和wt样变异中都较低。然而,影响III变异具有较高水平的功能获得相关程序0、1和4,以及较低水平的wt样相关程序10、12和13,这表明这些等位基因在很大程度上类似于功能获得细胞状态。

最后,影响II(非典型)变异抑制了程序0(如WT样和影响I变异)和程序12和13(如功能获得)。总的来说,这些结果表明,KRAS等位基因的二元分类方案可能无法捕捉到它们在肿瘤中的广泛表型影响。图3.sc-eVIP注释了KRAS致癌基因中已知的功能获得变异

接下来,研究人员使用跨细胞的PCA检测了KRAS变异,寻找来自功能获得变异热点位置12、13和61的细胞中显著更高的主成分。结果表明,主成分3(PC3)得分在激活和wt样变异的单个细胞之间区分最好。尽管所有wt样变体的PC3得分与wt过表达细胞相当,但其他变体排列在PC3得分增加的连续体上。为了检查观察到的连续体是因为变异导致新的细胞状态出现,还是在同一表型空间中重新分布或两者都出现,研究人员比较了二维嵌入变异中单细胞谱的分布。影响变异和wt样变异占据了很大程度上重叠的细胞状态空间,但细胞在这个空间中的分布不断变化,从wt样变异到影响I、II和III,然后是获得变异的连续体。当研究人员训练一个多类逻辑回归模型来分类每个细胞相应的变体,他们发现了许多错误分类。有趣的是,使用每个变异的平均主成分分数的模型,在除了两个变异类别外的所有类别中都表现近乎完美,这表明变异影响细胞组成。这些结果表明,KRAS变异可能通过在单细胞水平上改变分布来发挥其作用。图4.KRAS变异在变异组内部和变异组之间形成一个渐进的功能梯度

原则上,在肿瘤中具有功能变异的位置会面临更高的正选择压力,所以在不同患者中更容易发生突变,因此研究人员以TP53为例测试了基于表达的表型是否可以帮助预测突变频率。他们测量了数千个TP53变异,以此训练一个广义线性模型来预测变异的癌症发生队列。正如预期的那样,被通用截止点所遗漏的变异具有较低的预测突变性。另一方面,高度突变的wt样变异因为其低功能的影响而很少在肿瘤中被观察到,最后,将突变签名与sc-eVIP评分或细胞检测相结合的模型具有相似的预测性能。两者的表现都比随机的要好。最好的性能来自于在更大的数据集上训练的模型,这表明随着数据集大小的增加,对突变性和效应的预测可以变得更具有准确性。图5.sc-eVIP评分与患者队列中变异频率之间的关系



最后,研究人员评估了这个方法的可扩展性。每个变异需要20-100个细胞才能可靠地检测到较大的变异效应,而较小的变异效应每个变异需要100-400个细胞。这意味着,虽然我们的研究分析了大约30万个细胞,但在4000-20000个细胞中也可以观察到类似的结果。这个计算表明,大约830万细胞,可以研究大约270000可能的变异,大约7100万细胞,可以创建一个癌症变异的功能图谱。随着大规模单细胞分析和DNA合成技术的规模迅速增长,在未来用更低的成本,就可以实现这样的综合实验。图6.一个可扩展的变异表型平台


总的来说,编码变异Perturb-seq结合sc-eVIP分析框架代表了一种处理变异影响表型的通用平台。它可以立即用于评估数百种与疾病相关的变异的文库,经过改进,它可以适用于癌症等领域的数万种变异,并构建将遗传变异与细胞功能联系起来的一般预测模型。


教授介绍:

Aviv Regev

Aviv Regev,计算生物学家,美国国家科学院院士,麻省理工学院生物学教授,博德研究所核心成员,霍华德休斯医学研究所研究员,美国癌症研究协会研究员。Aviv Regev率先使用单细胞基因组学和其他技术来剖析调节基因,定义细胞和组织以及影响健康和疾病的分子网络。她对生物网络,基因调控和进化感兴趣。她的工作重点是剖析复杂的分子网络,以确定它们在面对遗传和环境变化时以及在分化,进化和疾病期间的功能和进化方式。

参考文献:

Oana Ursu et al. Massively parallel phenotyping of coding variants incancer with Perturb-seq [J].Nature biotechnology. 2022 Jan 20

你可能感兴趣的:(2022-02-09)