hello,新的一周,周一是开始,不知道大家感觉2022年初怎么样呢???是不是觉得很不错???不过我工作了几年领悟了一个道理,那就是干什么事情都要低调,别张扬,做好自己的事情,就是对自己最大的负责。好了,我们要继续单细胞空间的联合分析了,文章在Recurrence of cancer cell states across diverse tumors and their interactions with the microenvironment,目前空间转录组的文章大部分还是老外在发,国内寥寥无几,可能对空间转录组的认识及运用不足,希望我们的分享,能让大家更加深刻认识到空间转录组的作用。
先来总结一下重点内容
- 免疫疗法在多种癌症中的临床成功暗示了癌细胞与肿瘤微环境 (TME) 之间相互作用的共性,肿瘤前沿的部分上皮间质转化 (pEMT) 癌细胞群与癌症相关的成纤维细胞相互作用并介导侵袭。
- NMF识别肿瘤细胞状态(NMF是是单细胞空间分析的一个重点,大家可以参考文章10X单细胞空间数据分析之表征细胞状态和生态型(EcoTyper)、10X单细胞空间数据分析之表征细胞状态和生态型(EcoTyper示例代码))
- 癌细胞状态可能反映了常见的物理限制以及与其微环境中细胞成分的相互作用,免疫疗法在一系列癌症类型中的成功表明癌细胞和免疫细胞之间存在保守的相互作用,这导致我们质疑与免疫系统的相互作用是否塑造了一系列发生的癌细胞状态。尤其是干扰素反应模块可能涉及癌细胞和 TME 之间的相互作用。
- 空间转录组数据解卷积,分析空间细胞分布(单细胞空间联合还是非常重要的)
- 根据癌细胞状态来查询细胞邻域的组成。使用邻域和邻近度量将这种分析扩展到所有细胞类型和模块对,确定了细胞状态与 TME 细胞类型的其他一致的共定位(空间共定位分析也非常重要)。
ABSTRACT
虽然遗传肿瘤异质性早已得到认可,但最近的工作揭示了癌细胞在表观遗传和转录水平上的显著差异。在单个癌症类型中对单细胞水平的肿瘤进行分析表明,转录异质性被组织成癌细胞状态,这意味着不同的细胞状态可能代表在肿瘤维持和进展中具有互补作用的稳定和功能单元。然而,尚不清楚这些状态在多大程度上跨越了肿瘤类型,构成了癌症的一般特征。此外,癌细胞状态在肿瘤进展中的作用及其与肿瘤微环境细胞的特异性相互作用仍有待阐明。在这里,对 15 种癌症类型进行泛癌单细胞 RNA-Seq 分析,并确定了 16 个基因模块的catalog,其表达定义了复发性癌细胞状态,包括“压力”、“干扰素反应”、“上皮-间质转化” ','metal response’, ','basal'和'纤毛'。使用小鼠模型,发现干扰素反应模块的诱导因肿瘤位置而异,并且在消除淋巴细胞后减弱。此外,空间转录组分析进一步将癌细胞中的干扰素反应与肿瘤微环境中的 T 细胞和巨噬细胞联系起来。分析工作为研究癌细胞状态如何与肿瘤微环境相互作用以形成能够免疫逃避、耐药性和转移的有组织的系统提供了一个框架。
Introduction
癌症中的转录异质性越来越被认为是肿瘤进展、转移和治疗失败的驱动因素。单细胞 RNA 测序 (scRNA-Seq) 能够对单个肿瘤细胞进行无偏见的转录组分析,并揭示同一肿瘤的恶性细胞之间存在 striking 异质性。此外,有证据表明转录异质性被组织成共表达基因的模块。来自胶质母细胞瘤、少突胶质细胞瘤、星形细胞瘤、头颈癌和黑色素瘤等的数据表明,在肿瘤内,癌细胞的分化程度是异质的,从干细胞或祖细胞样到完全分化。这些在多种癌症类型中进行的研究也表明存在与应激反应、干扰素反应和缺氧相关的癌细胞状态。虽然在多项研究中发现了某些状态,但仍有待建立跨癌症类型的细胞状态的一般 catalog。这样一个连贯的框架——如果存在的话——将能够寻找不同癌症类型的共同主题,并了解肿瘤是如何独立于其起源而组织的。
除了恶性细胞外,肿瘤还由复杂的微环境组成,包括免疫细胞和基质细胞,它们在肿瘤发生中也起着关键作用。 特别是,免疫疗法在多种癌症中的临床成功暗示了癌细胞与肿瘤微环境 (TME) 之间相互作用的共性。 TME 的特定 elements 与癌细胞状态之间存在因果关系。 在一项头颈癌研究中,肿瘤前沿的部分上皮间质转化 (pEMT) 癌细胞群与癌症相关的成纤维细胞相互作用并介导侵袭。 在胶质母细胞瘤和三阴性乳腺癌中,TME 因子似乎诱导恶性细胞呈干细胞样状态。 这些工作表明需要对癌细胞状态进行系统分析,特别关注与 TME 的非恶性细胞类型的关系。
在这里,通过系统分析 15 种癌症类型来描述复发性癌细胞状态及其与 TME 的关系,以使用以基因为中心的方法识别复发性癌细胞状态catalog。通过分析来自先前发表的数据以及新收集的肿瘤的 scRNA-Seq 数据,确定了 16 个连贯基因模块并量化了它们在每个样本的恶性细胞中的表达。该catalog包括所有研究肿瘤中存在的模块,以及特定于特定癌症类型的其他模块。为了进一步研究癌细胞状态,使用实验模型来扰乱肿瘤微环境并测试对癌细胞状态的不同影响。虽然一些状态与癌症生物学的已知方面有关,但提供证据表明这些过程是异质的由同一肿瘤的细胞部署,并且这种异质性在广泛的癌症类型中重现。对干扰素反应模块的详细分析进一步引导我们研究其在 TME 扰动背景下的体内依赖性,并确定其在癌症类型中与巨噬细胞和 T 细胞的接近性。总体而言,癌细胞状态catalog是肿瘤组成的coherent representation,并为分析和测试肿瘤发生的特征提供了框架。
Result
Recurring gene modules across diverse cancer types
在手术后立即收集了 19 个新鲜的原发性未治疗患者肿瘤,涵盖 9 种癌症类型。分离每个肿瘤以获得单细胞悬浮液,并在没有事先分选的情况下处理 scRNA-Seq,以确保对肿瘤细胞组成进行公正的评估。肿瘤收集包括 9 种癌症类型:卵巢癌 (OVCA)、子宫内膜癌 (UCEC)、乳腺癌 (BRCA)、前列腺癌 (PRAD)、肾癌 (KIRC)、肝癌 (LIHC)、结肠癌 (COAD) 和胰腺癌 (PDAC) ,以及一种非上皮癌类型,胃肠道间质瘤 (GIST)。首先通过使用标记基因、singleR 注释和推断的拷贝数变异的组合分析转录组,并控制双细胞的可能性来识别数据集中的恶性细胞。在样本中,注释了 9,036 个恶性细胞和 18,546 个非恶性细胞。为了扩展数据集,还对先前报道中的肿瘤进行了这种分析,包括额外的 PDAC 和 LIHC,以及其他肿瘤类型:胆管癌 (CHCA)、肺腺癌 (LUAD)、头颈部鳞状细胞癌 (HNSC)、皮肤鳞状细胞癌 (SKSC)、多形性胶质母细胞瘤 (GBM) 和少突胶质细胞瘤 (OGD),最终得到来自 15 种癌症类型的 62 个未经治疗的原发性肿瘤的总共 19,942 个恶性细胞。
定义细胞状态的方法包括首先对底层基因模块进行分类,最近的工作已将基因模块确定为细胞状态的定义特征。这是一种灵活的方法,因为它允许细胞表达模块的组合,因此允许细胞状态的复杂性。使用非负矩阵分解 (NMF) 分析恶性细胞(NMF是是单细胞空间分析的一个重点,大家可以参考文章10X单细胞空间数据分析之表征细胞状态和生态型(EcoTyper)、10X单细胞空间数据分析之表征细胞状态和生态型(EcoTyper示例代码)),以将基因模块识别为共表达基因的集合。方法检测样本中共同表达的基因,即在细胞子集中连贯表达的基因。为了在肿瘤中寻找重复出现的基因模块,随后比较了已识别模块的基因组成。因此,通过在基因模块而不是表达矩阵的水平上进行整合,样品和研究中技术变化的影响是有限的。尽管这些模块在各种癌症类型中的独立鉴定——因此不假定复发——发现在不同肿瘤中获得的模块显著重叠。重要的是,this finding of recurrence rather than uniqueness would not be the result of batch effects。
基因模块的重现能够构建一个包含 16 个共有模块(以下称为“模块”)的catalog,每个模块的中位数为 37 个基因。为了确定一个模块是否显著存在于每个肿瘤的癌细胞群中,使用了基因集过度分散度量。一些模块富集特定的器官系统(如大脑或妇科器官),而其他模块则跨越多个器官系统和组织学。还在代表输卵管、乳房和肝脏的正常上皮细胞的独立数据集中测试了模块的过度分散,以query模块是否反映了正常组织中发现的异质性的重构。对于大多数模块,发现正常上皮样本中的过度分散较低,这表明它们在正常组织中没有差异表达。然而,在正常组织中确实在一定程度上检测到模块catalog这一事实表明,这些模块并不是癌症特有的,而是从现有的模块中选择出来的,并且表达得更加不均匀。还研究了模块的基因组成和癌症类型特异性,将与细胞过程相关的模块与与细胞身份相关的模块区分开来。
正如预期的那样,恢复了一个由细胞周期基因(例如 TOP2A、PCNA)组成的高度复发模块,在采样时捕获任何循环肿瘤中的癌细胞亚群。 另一个在肿瘤类型中反复出现的过程是应激反应(例如,JUN、FOS、HSPA1B),先前已经描述并显示其在黑色素瘤的耐药性中起作用。 分析还在下面提供了空间转录组学数据,这些数据为在没有解离的情况下癌细胞中这种状态的体内存在提供了额外的支持。
一种已在转移性卵巢癌中发现的干扰素反应模块被检测为广泛存在,表明恶性细胞中的干扰素反应在一系列实体瘤类型中是异质的。除了干扰素刺激的基因(如 STAT1 和 IFIT1)外,该模块还包含抗原呈递的成分,这是干扰素的一种充分表征的作用,包括 HLA-A 等 MHC I 基因和包括 HLA-DRA 在内的 MHC II 基因。虽然 MHC II 表达通常与专业抗原呈递细胞相关,但该途径也已显示在正常上皮细胞和癌细胞中表达。干扰素反应通常用作招募和激活免疫细胞的防御反应,并已在癌症中进行了广泛研究。在这种情况下,干扰素配体可能由癌细胞和树突状细胞 (DC)(对于 I 型干扰素,IFNα 和 IFNβ)或由自然杀伤 (NK) 和 T 细胞(对于 IFNγ)分泌。或者,干扰素反应可能是癌细胞固有的,即独立于其他细胞类型的信号激活;事实上,最近一项比较体外癌细胞系基因模块的研究也发现了干扰素反应模块,支持了不依赖于 TME 的反应的可能性。
在一系列癌症类型中还发现了与代谢过程相关的两个模块:缺氧模块(例如 VEGF、ADM)和氧化磷酸化模块(例如 ATP5H、LAMTOR2)。 实体瘤中对缺氧的代谢适应,随着糖酵解增加和血管生成的诱导,与癌症进展、耐药性、侵袭和转移有关。尽管如此,最近的研究表明氧化磷酸化在几种癌症类型中的作用,这表明癌细胞可能 依靠糖酵解和氧化磷酸化来产生能量。 金属硫蛋白基因的另一个基因模块——我们在此称为金属反应模块——可能在几种癌症类型的增殖和耐药性中起作用。
另一组模块对应于细胞身份,似乎与起源的组织和细胞有关。所分析的大多数肿瘤是上皮起源的,因此我们确定了与已知上皮细胞类型标志物重叠的模块:如预期在 LUAD 中特别存在的肺泡模块(例如,AGER、CAV1),以及基底(例如, KRT5 和 KRT15)、鳞状细胞模块 (例如 KLK10、LY6D) 和腺细胞模块 (例如 CLU、MUC5B)。由纤毛相关基因(例如 FOXJ1、PIFO)组成的模块存在于妇科肿瘤以及 LUAD 和 GBM 中。在卵巢和子宫内膜肿瘤中,该模块仅存在于子宫内膜样样本(OVCA NYU2-3、UCEC NYU2-3)中,而不存在于高级浆液样本(OVCA NYU1、UCEC NYU1)中,表明纤毛形成是一种特征子宫内膜样组织学。该模块在正常输卵管和肺上皮组织中的存在表明其在癌症中的差异表达反映了起源组织的异质性。在肿瘤内观察到的分化模块的异质表达可以从临床病理学角度提供对肿瘤结构的更详细的理解,其中评估每个肿瘤的分级和组织学亚型。
跨越多种癌症类型的两个模块与上皮间质转化 (EMT) 相关:一个完整的间充质模块 (cEMT)(例如,COL1A1、FN1)和一个缺乏规范的部分间充质模块 (pEMT)(例如,LAMC2、VIM)。 间充质标志物,如胶原基因。 pEMT 模块最近在 HNSC10 和 SKSC31 中得到了表征,但也在 GBM7 中发现,这表明来自不同谱系的细胞在癌症中会聚到这种特性上。 我们在少数样本中检测到 cEMT 模块的存在,但在一系列癌症类型中:主要是 PDAC、CHCA、LUAD 和 GBM。 最近的一项研究表明,pEMT 和 cEMT 可以发生在一系列癌症类型中,并且可能代表两种途径,它们融合了间充质分化赋予的表型特性,包括迁移和耐药性。 使用 TCGA 数据,我们确实发现 pEMT 基因模块的表达与无进展生存期降低有关。
最后,确定了三个神经系统癌症特异性模块:星形胶质细胞 (AC) 样(例如 APOE、ALDOC)、少突胶质祖细胞 (OPC) 样(例如 OLIG1、OLIG2)和神经祖细胞(NPC)- 像(例如,DLX1、DLX5)模块。
这些模块在一系列癌症类型中的广泛应用突出了分化程序的重新部署以及癌症和正常组织中不同的表达水平。 此外,虽然已鉴定的许多基因与癌症生物学的各个方面有关,但单细胞方法使我们能够证明它们在肿瘤的恶性细胞中异质表达,并且通常在恶性上皮细胞与正常上皮细胞中以更高的水平表达。
为了测试是否也可以使用独立方法检测 16 个模块的catalog,使用了 SCENIC,这是一种识别表达相关且受相同转录因子调节的基因的方法。 发现catalog的每个模块与几个 SCENIC 调节子有显着重叠。例如,干扰素响应模块与几个用转录因子 STAT1 和 IRF1 注释的 SCENIC 调节子重叠。
Defining cancer cell states by gene module expression
在建立了癌症基因模块的catalog之后,接下来试图了解它们通常是如何在单个细胞水平上assembled。 特别是,query细胞是否受限于它们可以表达的模块或模块组合。 为此,对每个恶性细胞的每个模块的表达进行评分。 例如,在 SKSC Ji1 样本中,基底、鳞状和循环模块的表达是相互排斥的,但这些模块中的每一个都与压力或 pEMT 模块共表达。 更一般地说,发现大多数细胞表达模块的组合,尽管并非所有组合都是可能的。 这些结果支持这样一种观点,即在定义癌细胞状态时,检查表达的完整基因模块集至关重要。
由于模块在癌症类型中重复出现,推断细胞模块评分可以作为比较不同患者癌细胞的自axes。最值得注意的是,该空间中的癌细胞不按患者或癌症类型分组,而是按其最高表达的模块分组。这与以下发现形成鲜明对比:在基因表达空间中,癌细胞按患者聚集,并在去除单个基因引起的变异时突出显示癌症类型的共性。如 SKSC Ji1 所述,某些模块之间存在一定程度的共表达:例如 pEMT 与压力和干扰素反应共表达。Together with the fact that cells do not form distinct clusters,这支持了癌细胞状态通常不代表离散实体的观点。然而,确实观察到了与表达循环或纤毛模块的细胞相对应的离散clusters。These clusters are also identified when examining tumors individually in gene expression-based dimensionality reductions, and are therefore not artifacts of the module score dimensionality reduction。
由于某些模块也存在于非癌症样本中,这里query表达每个模块的细胞比例是否在恶性和非恶性上皮细胞之间变化。 为此,将恶性细胞中的模块表达频率与匹配样本的非恶性细胞中的模块表达频率进行了比较,虽然对于 LUAD、SKSC 和 THCA,与成对的相邻正常样本的上皮细胞进行了比较,但在 PDAC 中,来自相同样本的非恶性导管细胞用作成对的正常比较。
与正常情况相比,pEMT 模块在所有三种癌症类型中的表达频率更高,这与 EMT 在上皮癌中的常见发生率一致。 相对于正常,干扰素反应模块在 LUAD 和 SKSC 中表现出增加的表达频率,但在 PDAC 中没有变化。 这可以部分解释为,用作参考的导管细胞是肿瘤本身的一部分,并且暴露于 TME。
正常肺和皮肤有鳞状细胞成分,始终观察到肿瘤样本中鳞状细胞表达没有差异。相反,相对于正常导管细胞,在 PDAC 中诱导了鳞状模块,表明恶性细胞群中存在鳞状分化。basal模块也观察到了类似的趋势。基于bulk转录组学已经提出了几种 PDAC 分类,包括经典(腺体基因的高表达,包括 TFF1 和 CEACAM6)和基础亚型(鳞状和基础基因的高表达,包括 LY6D 和 KRT15)之间的区别。虽然鳞状细胞胰腺癌很少见,但 PDAC 中鳞状细胞表达频率的增加表明部分化生向鳞状细胞程序是常见的。 LUAD 和 PDAC 中腺模块的表达相对于它们的正常对应物没有变化,但在 SKSC 中相对于正常皮肤增加。这种模式表明,恶性细胞群保留了与其来源细胞类型相关的模块的表达(例如,SKSC 中鳞状模块的保留)并进一步部署了来自其他细胞类型的基因模块(SKSC 中腺模块的表达增加)。
Expression of the interferon response is modulated by the tumor microenvironment(干扰素反应的表达受肿瘤微环境的调节)
癌细胞状态可能反映了常见的物理限制以及与其微环境中细胞成分的相互作用。值得注意的是,免疫疗法在一系列癌症类型中的成功表明癌细胞和免疫细胞之间存在保守的相互作用,这导致我们质疑与免疫系统的相互作用是否塑造了一系列发生的癌细胞状态。尤其是干扰素反应模块可能涉及癌细胞和 TME 之间的相互作用。在肿瘤中,I 型干扰素由癌细胞和 DC 分泌,以响应激活 cGAS/STING 通路的 DNA 片段,并导致 T 细胞启动和抗肿瘤活性。 IFNγ 主要由活化后的适应性免疫细胞产生,并导致 MHC I 基因的上调,最初促进肿瘤排斥,但最终通过免疫编辑导致 IFN 无反应性肿瘤。根据这些观察结果,query适应性免疫细胞是否是必要的在体内引发癌细胞中的干扰素反应模块。为此,使用了已建立的同种异体移植小鼠癌症模型,其中 TME 很容易受到干扰。对四个原位胰腺肿瘤进行了 scRNA-Seq,以验证基因模块可以在原位模型中重现。像之前所做的那样使用 NMF 识别基因模块,发现在这个系统中概括了五个:循环、压力反应、干扰素反应、缺氧和腺体分化。
同时,从四个缺乏 T 细胞和 B 细胞的 Rag1-/- 小鼠体内形成的原位肿瘤中收集了 scRNA-Seq 数据。分析来自这些肿瘤的恶性细胞中的基因模块表达,发现循环、应激反应、缺氧和腺体分化在 Rag1-/- 和 WT 小鼠之间以相似的频率表达。相反,干扰素反应模块在来自 Rag1-/- 小鼠的肿瘤中以较低频率表达(p < 10-10,Kolmogorov-Smirnov test)。此外,相对于其他癌细胞,干扰素反应模块的所有基因在表达干扰素反应的细胞中均上调,这表明维持了协调反应——尽管在较少的细胞中。干扰素反应模块的 MHC I 基因(B2m、H2-D1、H2-K1)在 Rag1-/- 小鼠中的总体表达较低(尽管它们在干扰素反应表达细胞中保持相对上调),表明淋巴细胞耗竭对 MHC I 基因的表达具有额外的影响,而 MHC I 基因与干扰素反应无关。
接下来测试了不同的肿瘤微环境是否也会调节干扰素反应模块的表达。 在一项实验中,将胰腺中的原位肿瘤(癌症的起源部位)与腹膜中的异位肿瘤(常见的转移部位)进行了比较。 发现腹膜中的肿瘤具有较低频率的干扰素反应表达细胞(在 Kolmogorov-Smirnov test)。 在第二个实验中,比较了两个异位部位(腹膜和肝脏)的频率,以便模拟体内不同的转移部位。 在这里,发现干扰素反应模块在肝脏中的表达频率高于腹膜(p < 10-10,Kolmogorov-Smirnov test)。
总的来说,这组实验提供了对癌症中干扰素反应模块发生情况的初步评估。 该模块在多种癌症类型、器官和免疫环境中的存在表明,干扰素反应在恶性细胞中的异质性是肿瘤的一个共同特征。 发现适应性免疫系统对于该模块的大多数但不是全部表达是必需的。 淋巴细胞耗尽状态下的剩余表达表明癌细胞中干扰素反应的其他原因,或者是癌症外在的,例如 NK 细胞分泌的干扰素,或者是癌症内在的,这与体外干扰素反应模块的报道一致。 值得注意的是,这一发现并未区分引发干扰素反应的信号机制和导致选择肿瘤内状态的长期免疫编辑。
Spatial organization of malignant and non-malignant cell types in the tumor
为了进一步分析癌细胞状态和 TME 细胞之间的组织和相互作用,转向基于测序的空间转录组学 (ST)。 与解离后获得的 scRNA-Seq 不同——导致任何空间信息的丢失——基于阵列的 ST 数据不是以单细胞分辨率捕获组织内每个位置的 mRNA,而是每个点捕获约 10 个细胞。 因此,试图通过整合十个肿瘤(OVCA NYU1、OVCA NYU3、UCEC NYU3、BRCA NYU0、BRCA NYU1、BRCA NYU2、PDAC NYU1、GIST NYU1、GIST NYU2、LIHC NYU1)的配对数据来利用这两种模式的特性。 十个肿瘤 ST 数据集中的每一个都由 6mm x 6mm 区域上的约 2,000 个spot(范围从 1,351 到 2,624)组成。 ST 阵列上的光点相隔 100μm,能够深入了解肿瘤微环境,例如,旁分泌信号在这样的距离内发挥作用。
由于每个spot是一种或多种细胞类型的细胞组合,因此其转录组可以表示为细胞类型转录组的加权和。 为了推断每种细胞类型在每个点的贡献,使用来自配对单细胞数据的细胞类型的平均表达谱进行了非负线性最小二乘 (NNLS) 回归。 然后,将每种细胞类型获得的系数与随机模型中获得的系数进行比较,如果一个细胞的系数比随机集中的平均值高出两个以上标准偏差,则认为该细胞存在于一个点中。 工作团队的病理学家(C.H. 和 D.F.D.)进一步验证了这些注释。 作为进一步分析的框架,根据它们的细胞类型注释将斑点分为三类:“恶性”,仅包含恶性细胞,“正常”,仅包含免疫细胞和基质细胞,以及“两者”,包含组合。
作为一种独立的斑点分类方法,还直接比较了 10 个配对数据集的spot和单细胞转录组。通过调用相互最近邻 (MNN) 集成和联合降维,发现来自两种模态的数据得到了很好的集成。单个细胞在外围形成clusters,表明不同的细胞类型。 ST 点要么与单个单细胞clusters混合,表示纯population,要么桥接多个cluster,表示细胞类型的组合。将 NNLS 方法确定的spot类别叠加到该图上,始终观察到“恶性”spot与恶性细胞cluster混合,“正常”spot位于非恶性细胞类型区域,“Both”spot跨越恶性和非恶性单细胞clusters。作为第二个例子,LIHC ST 数据集显示了两个空间上不同的肿瘤结节,左侧有恶性和非恶性细胞之间的大量混合,右侧几乎只有恶性细胞。联合降维分析反映了两个相应的恶性clusters,当单独考虑单细胞降维时,它们并不明显。该分析强调了整合成对的空间和单细胞数据集以在其空间环境中锚定单细胞的潜力。
为了进一步测试 NNLS 方法注释spot的准确性,对两个源自患者的黑色素瘤异种移植物 (PDX) 进行了配对的 scRNA-Seq 和 ST。 在这种情况下,只有恶性细胞是人类来源的,因此表达人类基因,使我们能够可靠地识别恶性细胞或spot。 在完整的小鼠和人类转录组上使用 NNLS 方法,首先为spot身份建立了“基本事实”。 然后,通过将小鼠基因转换为人类直系同源基因来模拟患者样本,从而消除物种信息。 以这种方式使用 NNLS 注释点导致每个样本的特异性分别为 99% 和 89%,从而支持其准确性。
每个样本中“normal”和“both”spot的存在使我们能够query在恶性细胞存在的情况下组织的细胞类型组成如何变化。在也含有恶性细胞的spot中,内皮细胞的比例始终较低,表明肿瘤的血管化不完全。相反,在“both”spot中发现的中性粒细胞数量较多。肿瘤相关巨噬细胞被广泛定义为 M1 - 抗肿瘤/促炎 - 和 M2 - 促肿瘤/抗炎。在单细胞数据中,检测到两种巨噬细胞群,一种表达促炎基因(例如,TNF、SPP1、ISG15),另一种以抗原呈递和补体为特征(例如,HLA-DRA、C1QA、CD163) .为了比较 M1 和 M2 巨噬细胞相对于癌细胞的位置,对每个包含巨噬细胞的点进行评分,以了解其表达两个群体的特征,并计算 M1-M2 分数,这能够比较整个点的巨噬细胞极性类别。在六个妇科样本(卵巢癌、子宫内膜癌和乳腺癌)中,我们发现“both”点的 M1-M2 评分明显高于“normal”点,这表明在癌细胞附近具有强大的抗肿瘤巨噬细胞活性。这与在结直肠癌中进行的一项研究的结果形成对比,该研究在肿瘤中检测到相对于邻近正常组织更高的 M2。这些结果表明在几个 100μms 内存在围绕恶性细胞的炎症宿主反应,突出了以高分辨率研究肿瘤结构的价值。除了 M1/M2 二分法,巨噬细胞具有多种表型,包括促血管生成巨噬细胞和间充质像巨噬细胞一样,正在成为肿瘤-免疫相互作用的关键参与者。对 T 细胞亚型(细胞毒性、辅助性和调节性)的类似分析并未显示跨样本的一致结果。
Cancer cell state analysis of tumor cellular neighborhoods(空间临近分析)
在确定了每个肿瘤内的恶性和非恶性细胞类型之后,接下来试图根据癌细胞状态来查询细胞邻域的组成。为此,绘制了每个 ST 样本中的癌细胞状态,对每个“恶性”点的每个模块的表达进行评分。为了确定这种评分方法的有效性,首先再次转向 PDX 数据,并对模块表达的“恶性”点进行评分。由于在该系统中可以明确地区分人类恶性细胞与小鼠 TME 细胞,首先使用单细胞数据来确认这些模块由恶性细胞本身差异表达,并排除了源自 TME 污染的伪影的可能性。例如,pEMT 模块包括通常由成纤维细胞表达的基因,但检测到它存在于恶性细胞中。正如预期的那样,干扰素反应模块不存在,因为与 Rag-/- 小鼠一样,这些小鼠缺乏淋巴细胞。
为了表征每个“恶性”点周围的细胞类型组成,计算了每种细胞类型的两个分数指数,旨在捕捉它们的微环境。 将“邻域分数”定义为包含该细胞类型的周围斑点的分数。 因此,该分数直接测量相邻点的细胞类型组成。 邻近度分数衡量感兴趣spot与每种细胞类型的接近程度,并计算为与该类型细胞的最短距离的倒数。
将每个肿瘤的“恶性”点上的模块分数和细胞类型邻域图关联起来,揭示了 TME 的癌细胞状态和细胞类型如何共同定位以形成“邻域”。更密切地研究这种相关性证实了模块评分和巨噬细胞邻域评分之间这种正相关的重要性。当使用邻近分数计算巨噬细胞的存在时,也观察到一致的关系。为了探索所有样本的这种关系,计算了巨噬细胞邻域的相关分数(±log10(p 值))。与干扰素反应的相关性在所有样本中均为正相关,并且对于 10 个样本中的 8 个具有显着性。任何其他模块都不是这种情况。这表明巨噬细胞可能会引发干扰素反应模块的表达,或者表达干扰素反应的癌细胞可能会募集巨噬细胞。事实上,最近的一项研究表明,刺激肿瘤中的干扰素反应途径会导致巨噬细胞的募集和激活。
使用邻域和邻近度量将这种分析扩展到所有细胞类型和模块对,确定了细胞状态与 TME 细胞类型的其他一致的共定位。 除巨噬细胞外,根据这两种测量方法,表达干扰素反应的癌细胞与 T 细胞共定位,这与淋巴细胞导致干扰素反应增加的体内发现一致。 需要进一步的工作来确定这些交互的模式和方向性。 接受 EMT 的癌细胞与成纤维细胞和内皮细胞呈正相关,与其他恶性细胞呈负相关,这与它们在肿瘤界面富集并与癌症相关成纤维细胞相互作用的发现一致。
为了进一步研究巨噬细胞和 T 细胞与表达干扰素反应的恶性细胞的共定位,转向 CO-Detection by indEXing (CODEX) - 一种多重蛋白质染色测定 - 能够以单细胞分辨率进行空间分析。对于用于空间转录组学的四个样本(OVCA NYU1、UCEC NYU3、LIHC NYU1、GIST NYU1),我们对 23 个标记进行了染色,包括 HLA-DRA 作为干扰素反应的标记。使用有监督的门控策略,确定了 TME 的恶性细胞和细胞,包括巨噬细胞、T 细胞、内皮细胞和成纤维细胞。 PanCytokeratin (PanCK)/EPCAM 阳性细胞的一个子集也对 HLA-DRA 呈阳性,这在蛋白质水平上提供了 MHCII 在肿瘤的恶性细胞中差异表达的证据。因此,将恶性细胞定义为干扰素反应阳性或阴性,并比较了它们与巨噬细胞和 T 细胞的接近程度。同样,使用邻近度和邻域这两个指标来研究细胞共定位。例如,对于巨噬细胞,恶性细胞与巨噬细胞的“接近度”定义为 1/(1+距离),取最近巨噬细胞的距离;并且“邻域”被定义为在 100μm 半径内注释为巨噬细胞的细胞分数。对于给定样本中的每个图块,使用干扰素阳性细胞和干扰素阴性细胞的平均测量值来计算对数比。对于巨噬细胞和 T 细胞,四个样本的邻近度和邻域度量的平铺对数中位数比率均为阳性,表明干扰素反应阳性的恶性细胞相对于干扰素反应优先与这两种细胞类型共定位-阴性恶性细胞。这表明至少一部分癌细胞状态与 TME 相互作用,要么由免疫细胞或基质细胞引发,要么改变其周围环境的细胞类型组成。
Discussion
单细胞方法极大地促进了我们对肿瘤内异质性的理解,一些研究已经证明了癌细胞的状态。 虽然在个别癌症类型中发现了这种状态,但我们在这里提供了第一个对恶性细胞之间转录异质性的泛癌分析。 我们对癌症类型的系统分析使我们提出了支持复发性癌细胞状态的基因模块的统一catalog。 基于对个别癌症类型的研究结果,确定了涵盖此处研究的 15 种癌症类型的 16 个模块 - 包括循环、压力反应、干扰素反应、缺氧和 pEMT - 以及对特定器官系统中的细胞特性更具体的模块 - 包括 基底、鳞状、腺状和纤毛分化。 我们预计未来的工作将扩大癌细胞状态及其癌症类型或器官类型特异性以及泛癌特征的列表。
癌细胞状态不能明确定义为细胞类型。 结果表明,这可能来自模块组合的表达:由于这些通常不是相互排斥的,这导致连续变化而不是离散cluster。 相反,当基因模块与其他基因模块相互排斥时,可能会观察到不同的状态,如循环和纤毛基因模块的情况。 因此,我们的分析支持这样一种观点,即肿瘤转录变异的基本单位是基因模块,其组合产物定义了癌细胞状态。 需要进一步的工作来解开与基因模块在确定细胞状态时的共表达和互斥性方面相关的关系。
在癌细胞中观察到的许多异质性似乎是由于重新部署了通常在其他细胞和发育环境中表达的模块。 事实上,我们的癌症基因模块目录包括细胞生理学(循环)、特定过程和反应(应激、缺氧、氧化磷酸化、干扰素和金属反应)和发育程序(EMT、肺泡、基底、鳞状、腺体、 纤毛、AC 样、OPC 样、NPC 样)。 相对于它们的正常对应物,癌细胞利用现有的基因模块,以不同的水平和更异质的方式表达它们。 例如,干扰素反应模块虽然通常与对病原体的细胞免疫反应相关,但在恶性细胞中被异质激活。
目前尚不清楚癌细胞之间的异质性在多大程度上是由它们接收的信号的异质性引起的,或者是由于细胞之间的内在差异——遗传的、表观遗传的或随机的。我们对多种癌症类型的癌症状态的观察提供了证据,表明癌细胞状态不是由基因定义的,而是代表细胞可塑性。此外,体外和体内研究表明,癌细胞表现出高度的可塑性,可以从一种状态转变为另一种状态。特别是,由单一状态播种的群体恢复与原始肿瘤相同的状态比例。因此,虽然各个state的身份具有高度可塑性,但它们的整体分布可能是一个稳定的属性。有趣的是,在胶质母细胞瘤中,具有不同遗传驱动因素的肿瘤具有相同的状态集,但每种状态的比例不同。根据这种观点,肿瘤发生的早期阶段会产生致癌背景,随后的表观遗传变化将导致恶性人群之间的异质性。
在这里确定的几个基因模块可能会启用 Hanahan 和 Weinberg 提出的标志,从而提高癌症标志不需要由所有单个细胞组装的可能性。相反,细胞状态可能会在肿瘤生态系统内进行相互作用,从而导致整个肿瘤具有更高的适应度。例如,血管生成的诱导或免疫监视的下调可能由一部分癌细胞介导,以造福于其他细胞。为了理解这些复杂的关系,至关重要的是要考虑肿瘤的物理限制,包括相邻细胞之间的信号传导、氧气和营养物质的扩散,以及分离到具有不同成分的壁龛中。观察到的干扰素反应表达细胞与 T 细胞和巨噬细胞的共定位突出表明,可以通过分析肿瘤结构来理解癌细胞状态的功能作用。最近的研究还表明,在胶质母细胞瘤中,巨噬细胞在恶性细胞中引发间充质状态。此外,在头颈部鳞状细胞癌中,发现表达 pEMT 的细胞位于肿瘤的前缘,这一发现似乎适用于几种癌症类型。
癌症中干扰素反应的存在已被广泛研究,并已尝试利用该反应进行治疗。 在这里,发现参与干扰素反应的基因在此处研究的所有 15 种癌症类型的肿瘤的恶性细胞中被共同调节和异质表达,这表明这种状态的存在是肿瘤发生的必要特征。 事实上,缺乏 IFNγ 受体的肿瘤无法在小鼠模型中发育。 然而,矛盾的是,在同时含有干扰素反应性和无反应性细胞的肿瘤中,无反应性细胞的频率增加。 因此,表达干扰素反应模块的细胞亚群似乎支持肿瘤内其他细胞的生长。 这可以通过这些基因的双重功能来解释 - MHCI 和 MHCII 引发细胞的免疫检测增强,但 PDL1 导致免疫耐受性的普遍增加。
Understanding cancer cell states has critical implications for therapeutic advances, as intratumoral heterogeneity is a recognized cause of treatment failure and relapse. In particular, the study of the relationships between cancer cell states and the TME – with an emphasis on immune cell populations – may shed light on the contribution of heterogeneity to tumor fitness, and highlight vulnerabilities that can be exploited for targeted therapy
Method(有一些分析方法需要额外关注)
细胞注释
识别恶性细胞
NMF(重点)
Module annotation and receptor-ligand analysis
空间转录组解卷积(NNLS)
空间位点注释
生活很好,有你更好