了解肿瘤异质性——肿瘤内细胞间的分子变异——有望解决癌症生物学中的突出问题,并改善特定癌症亚型的诊断和治疗。近日,来自澳大利亚的科研团队在《Nature Methods》发表综述文章,总结了空间技术在肿瘤研究中的应用,并讨论了目前的方法和未来的机会,以计算整合这些模式实现对肿瘤生物学的综合评估。
空间技术在肿瘤研究中的应用
研究团队总结了三个主要领域:(1)用于跟踪癌症亚克隆和肿瘤结构变化的光学条形码方法;(2)用于检测特定生物标记物的空间蛋白质组学方法;(3)用于探索肿瘤及其微环境中细胞的空间转录组学方法。
使用光学克隆条形码追踪活细胞的时空命运
传统上,通过使用DNA和RNA测序来探索癌症在亚克隆分辨率下的进化进程(包括一群细胞的混合测序和最近使用的单细胞测序)。虽然在测序前对肿瘤进行显微切割和分割,提供了关于亚克隆在其微环境中的三维(3D)分布信息,但越来越需要基于单细胞分辨率的成像方法来观察克隆的相互作用。
这些荧光光学条码技术(又称多色克隆谱系追踪)使用多个荧光报告因子的随机和多重表达来识别和追踪众多亚克隆。两种主要方法涉及(1)随机和组合表达转基因的体内表达(转基因模型例如在Confetti小鼠中)或(2)在移植到受体小鼠之前,对癌细胞进行体内慢病毒感染以表达不同的荧光蛋白(异位模型例如使用LeGO载体)。通过这些转基因的构成性或诱导性表达,荧光细胞及其后代的时空命运在特定器官或整个动物中被纵向研究。虽然光学谱系追踪方法可直接显示体内克隆性癌症的异质性,但可识别颜色的数量以及可追踪的亚克隆数量是有限的。
光学条形码技术的最大优势在于进行活细胞和活体成像,并获取单个细胞及其所属亚克隆的动态信息。为了充分利用这一优势,必须在体内3D组织环境中的特定细胞与其分子组成之间建立直接联系。虽然光学标签有助于在分子分析之前通过流式细胞术对条形码细胞进行分类,但这需要细胞分离,从而导致单个细胞的准确组织位置丢失。为了将亚克隆的三维可视化与有意义的分子信息联系起来,将原位可视化与空间转录组学或蛋白质组学技术相结合的方法将在发现癌症亚克隆行为的新调节因子方面具有非常重要的价值。
在空间环境中增加可检测蛋白质数量的新策略
组织学分析对于肿瘤的定性至关重要。病理学家通常使用苏木精和伊红(H&E)染色来进行诊断和预后。虽然仅根据H&E进行肿瘤分类的深度学习模型的开发成本很低,而且可以进一步利用这一信息,但这些方法提供的肿瘤和TME的概况信息有限。随着对肿瘤异质性和TME中细胞多样性认识的增加,增加空间上可分辨的蛋白质数量的需求也在增加。免疫荧光通常可以在一个完整的组织切片内对四或五个蛋白质目标进行多重检测。然而,最近的方法能够评估几十种蛋白质标记物,并能提供一个更全面的肿瘤及其微环境图谱。这些方法涉及抗体染色和检测的连续循环,使用元素同位素结合抗体池或使用荧光显微镜或DNA测序检测的DNA条形码抗体进行染色。
研究团队在文中展示了一些新兴技术的选择(所有方法都需要对特定的抗体组合进行优化,同时要考虑到组织的类型和质量)。
> 迭代方法通过使用连续几轮的抗体或标签检测来增加蛋白质目标的数量,例如mIHC、OPAL;其他方法通过更温和地去除或剥离抗体标签而不是抗体本身来减少循环对组织完整性的影响,例如cycIF、REAdye_lease技术;其他迭代方法使用一组与DNA条形码结合的初级抗体进行单步染色,例如CODEX。
基于荧光的方法提供高分辨率的空间信息,但光谱重叠限制了可以同时成像的荧光团的数量。使用非荧光的方法(例如质谱和测序)避免了这个问题,并且可以在一个染色和扫描步骤中测量多达100种蛋白质。
> 基于质谱技术的免疫检测。飞行时间(TOF)质谱技术可以检测与稳定金属同位素结合的抗体。与基于荧光的方法相比,检测器的质量分辨率允许同时检测几十个金属标签而不受干扰。飞行时间质谱流式细胞术(CyTOF)基于这种形式的免疫检测,能够对多个参数进行单细胞分析。IMC使用与CyTOF相同的TOF读数,结合高能量、短波长的激光束进行组织消融,聚焦到直径为1μm的光斑大小。类似的方法使用聚焦离子束和二次离子质谱来实现更高的分辨率和灵敏度。与IMC相比,MIBI可以在FFPE组织中成像40多种蛋白质。IMC或MIBI扫描组织区域的时间比循环方法长。然而,不需要进行抗体染色和成像周期(如mIHC或OPAL)或重复DNA杂交轮次(如CODEX)。
> 基于测序的免疫检测。蛋白质和RNA的多重数字空间分析(DSP)利用寡核苷酸结合的抗体,使用 NanoString nCounter 时,DSP可以同时检测至少20~100种蛋白质,并可能对 RNA、DNA 和蛋白质进行多达800-plex的检测,使用高通量测序时甚至可以进行更高的多重检测。尽管分辨率有限(最近空间分子成像仪平台有所改进),DSP已成功用于研究转移性前列腺癌的肿瘤异质性。
单细胞分辨率下的多重蛋白质检测为定义肿瘤异质性和TME的复杂性提供了新的机会。基于蛋白质的技术是非常宝贵的,因为它们提供了一个直接的功能信息测量。这些技术的进一步完善和商业化将提高通量(如已经出现的自动染色机和玻片扫描仪),并实现更好的亚细胞分辨率和三维成像。然而,肿瘤细胞固有的可塑性导致了一系列的细胞亚型和状态,只有与健康组织相比,通过广泛的标记物分析才能确定。空间转录组方法为蛋白质组分析提供了补充数据,获得了关于肿瘤复杂性的综合视角。
空间转录组技术及其应用
研究团队从基于FISH和基于测序两方面介绍了空间转录组技术。
空间转录组技术详细解读:从全标本到单细胞空间组,基因表达实现“3D”分析;空间转录组是一种怎样的转录组?;科研“出圈”必备——空间组学技术
多模态空间数据的整合分析
空间技术已产生高度多重化和多模态的数据。在过去五年中,空间软件程序生态系统得到了快速发展,以分析具有12个常见分析类别的空间组学和成像数据。
整合成像和测序数据的一般框架包括首先将去噪和归一化的信号映射到单个细胞或ROI,然后将映射的数据与组织形态、空间位置和其他基因或蛋白质表达数据相结合。为了从去噪和归一化的成像数据中获得细胞或ROI测量值,有大量的分割工具可供选择(例如DeepCell、unet4nuclei、ilastik、smfishhmrf、NucleAlzer、Stardist和Cellpose)。对于下游的整合分析,最近的软件工具包有Squidpy、stLearn、SpatialExperiment、Giotto、Seurat和STUtility。starfish等平台软件的持续开发,可以使用共享框架处理多种基于ISH的数据,对于数据分析和大规模集成来说将是引人注目的。
在肿瘤异质性研究的背景下,空间和scRNA-seq数据的整合是一种高分辨率的方法,可以绘制组织中不同细胞类型的图谱。由scRNA-seq定义的参考细胞可以通过不同的技术来推断空间数据中的细胞类型组成,如Seurat中的标签转移、scPred中的分类参考映射或SPOTlight、cell2location和RCTD中的矩阵分解。空间和scRNA-seq数据的整合也可以通过归因分析提高空间数据的准确性(例如Seurat、LIGER和gimVI)。这些方法使用在降维潜在空间中识别的相似(相邻)细胞信息来调整基因表达值。当考虑到空间转录组学数据中测量的物理距离时,可以更准确地估计这种潜在空间。
使用空间位置信息的新方法,如SPOTlight、cell2location和RCTD展示了改进的细胞类型的空间映射,从单细胞参考到空间数据集。TrendSceek和SPARK等方法检测了跨组织区域的基因表达变化。其他方法,如SpatialCPie和BayesSpace识别和可视化空间上接近的细胞群。此外,Tangram、SpaGCN和stLearn等方法使用从组织成像数据中提取的形态学特征。结合测序和成像数据,这些方法可以将分子图谱与细胞表型联系起来。
一个新兴的分析类型:空间轨迹分析,类似于单细胞轨迹分析(例如Slingshot、monocle3 和scVelo),用于识别组织内的生物过程梯度(例如使用SPATA和STLERN)。基于单细胞的轨迹方法可以应用于空间数据。例如,RNA速度被应用于MERFISH数据。最近的空间轨迹分析方法可以重建一个组织内发生的时空模式,例如癌症的转化和转移。这些新的分析方法将整个组织的空间维度与从转录组图谱推断的细胞状态的时间变化相结合。
多模态空间数据的互补性非常强大,因为它允许对细胞类型图和/或细胞过程进行正交验证。两种常用的整合方法是图像配准(映射测量不同模式的相邻组织切片)和通用坐标框架(映射成像配准不完全一致的切片)。整合后,可以比较和/或组合来自重叠组织区域的蛋白质和RNA信号。通过图像配准,来自多个样本的空间数据可以组合用于多元分析(例如在STutility、CODA、HEMnet和STRISH中),或者与其他组织水平信息(如组织病理学注释)进行比较。
此外,空间邻域信息可以与整个转录组的基因表达模式相结合,以揭示细胞-细胞之间的相互作用。IMC和IHC数据的一种常用方法是使用统计测试来检测组织中细胞类型之间的共定位(邻域),如histoCAT、smfishhmrf、CytoMAP和Squidpy中所应用的。然而,基于邻域的方法尚未应用于配体-受体分析,这改善了单细胞相互作用分析的结果(例如NicheNet)。在stLearn和Giotto中实现的方法使用配体-受体对来分析空间细胞-细胞相互作用。用scRNA-seq数据验证细胞-细胞相互作用(如通过配体-受体对的表达),可以使用来自成像数据的分子和/或细胞共定位分析(例如在ISH数据中使用STRISH和 histoCAT)。
空间组学数据与肿瘤组织的H&E组织病理学图像的整合为癌症诊断和预后的临床应用开辟了新途径。应用计算机视觉算法,然后与空间转录组学进行统计整合的创新方法能够仅使用H&E图像(例如st-net、XFuse、Tangram和HE2RNA)预测癌症基因标记。也可以将蛋白质组数据(例如IHC数据)和转录组数据传输到H&E图像,然后训练模型以高分辨率分类癌症和其他细胞类型(例如使用HEMnet和XFuse)。
增加了新的维度:希望和挑战
大多数高水平的复用空间技术仅限于二维;然而,共聚焦和双光子显微镜提供高分辨率的三维信息,并允许通过活体或活体成像监测动态细胞变化。因此,基于荧光的技术,如Confetti和LeGO可以提供与癌症克隆性有关的另一层信息。然而,这些方法不能提供亚细胞分辨率或达到类似于允许分子目标成像技术的分子特异性程度。
三维成像和分子数据的同步采集已应用于厚组织切片或连续组织切片。然而,在空间和时间分辨率、分子或细胞通量以及数据采集时间之间通常存在权衡。
空间技术的最新创新表明,我们正朝着在固定组织中以高空间分辨率捕获3D多路复用转录组图谱的方向前进。例如STARmap可以在组织切片中检测到多达1020个转录本。然而,可检测的靶点数量可能随着组织厚度的增加而减少。
虽然目前还没有出现,但通过活体成像将数千个标记物的三维多模态分析与时间分辨率相结合是非常理想的。此外,具有单细胞空间分辨率的细胞历史记录器(如MEMOIR、intMEMOIR和Zombie)可通过基于成像的条形码检测实现谱系追踪。这些方法展示了多组学与谱系信息整合的潜力,将这些技术与检测代谢组学和表观遗传学数据的技术相结合,癌症生物学将有一个更完整的多维图像。
最后,在临床上使用这些技术是未来几十年转化研究最令人兴奋的挑战之一。在FFPE切片上对蛋白质进行多重分析的实质性进展使患者更接近下一代病理学,辅助诊断检测将指导个性化药物的治疗/干预。然而,将新生的转录组技术从细胞系过渡到组织会带来许多挑战,包括(1)固定和组织降解,(2)染色和探针杂交,以及(3)三维数据和数据采集所需时间。由于临床样本通常储存在固定液中,样本之间的活检和固定时间可能不同,因此RNA的完整性也会不同。因此,在将空间组学方法应用于临床之前,需要提高其样本质量和稳定性。
此外,为了获得高质量的轴向分辨率,通常需要在组织样品中进行样品制备,如冷冻切片或清除。这些方法并不总是与集成的组学解决方案兼容,通常需要进一步优化。还应考虑组织类型之间的形态差异。例如,肺组织布满肺泡气囊,冷冻切片时必须小心处理。类似地,在皮肤细胞和黑色素瘤样本中,色素沉着会因其光吸收特性而对图像采集产生负面影响。对于空间蛋白质组学和转录组学分析,分析的便利性和成本的降低将是这些方法在转化研究和精准医疗中广泛使用需要克服的关键障碍。
尽管准备工作存在挑战,但组织最终提供了丰富的信息,对全面了解癌症生物学至关重要。与大脑的不同解剖结构相似,肿瘤是由大量具有不同细胞类型和基因构成的细胞群聚集而成。肿瘤内的异质性和恶性细胞与环境的错综复杂的相互作用使得单细胞分辨率和组织背景成为全面了解疾病进展的重要前提。
综上所述,研究团队认为高度复用的FISH和基于测序的空间转录组技术在多组学方面具有最大的潜力,需要将细胞和分子通量与空间分辨率及易用性相结合。蛋白质信息通常为基因表达数据提供附加值,后者并不总是与蛋白质的功能水平相关。然而,目前的蛋白质组学技术需要进一步发展,以克服多路复用的限制和通量,提高其在癌症异质性研究中的分析能力。因此,考虑到专门技术之间固有的权衡,生物学问题应最终指导方法的选择。
目前,空间领域的大多数里程碑式的研究展示了理论潜力,越来越多的研究产生了对癌症的关键生物学见解。更广泛地利用空间技术和分析技术的进步无疑将带来新的诊断和癌症治疗方法。
首发公号:国家基因库大数据平台
参考文献
Lewis, S.M., Asselin-Labat, ML., Nguyen, Q. et al. Spatial omics and multiplexed imaging to explore cancer biology. Nat Methods (2021).
图片均来源于Nat Methods官网和参考文献,如有侵权请联系删除。