从早期到晚期原发性和远处转移的 LUAD 的综合单细胞转录组分析(IF14+)

Single-cell RNA sequencing demonstrates the molecular and cellular reprogramming of metastatic lung adenocarcinoma

单细胞RNA测序显示转移性肺腺癌的分子和细胞重编程

发表期刊:Nat Commun

发表日期: 2020 May 8

doi:10.1038/s41467-020-16164-1

期刊相关信息

一、背景

非小细胞肺癌(NSCLC)在组织学上被分为腺癌、鳞状细胞癌和大细胞癌。肺腺癌(LUAD)是最常见的类型,约占所有肺癌的40%。LUAD经常在转移阶段被发现,在脑部、骨骼和呼吸系统普遍存在。远处转移是肺癌死亡的主要原因,然而转移性肺癌及其相关微环境的具体方面仍然知之甚少。为了解肺癌的进展和转移所做的努力主要集中在对有基因畸变的癌细胞进行分析。然而,肿瘤的进展和转移也受到肿瘤周围环境的复杂和动态特征的影响。

单细胞RNA测序(scRNA-seq)最近被用于肿瘤微环境的分析。该技术允许在转录组水平上对数千个细胞进行大规模并行表征。

二、材料与方法

1.数据来源

1)人体标本:纳入44名被诊断为病理性LUAD的患者,共收集了58个样本,并立即转移进行单细胞分离;另外还收集了3名LUAD患者的共6个组织样本(肿瘤-正常对),并立即解离进行流式细胞仪分析

2)从TCGA中获得了患者的LUAD和鳞状细胞癌(LUSC)样本的RNA-seq和临床数据,以评估来自特定细胞状态的基因组的预后效果

2.实验流程

1)样品制备、单细胞RNA测序和读取处理、全外显子组测序和数据处理、免疫组化、流式细胞仪、scRNA-seq数据的过滤和归一化

2)无监督的降维和聚类:选择平均表达量在0.0125和3之间且量化归一化方差大于0.5的可变表达基因,然后用于计算主成分(PC);每个簇上的细胞注释是由已知标记基因的表达来定义的

3)从scRNA-seq数据推断CNV

4)肿瘤突变负担的预测:肿瘤突变负担(TMB)是从11个福尔马林固定和石蜡包埋的肺部肿瘤组织的大量WES数据中估计的

5)癌细胞的特异性标记基因选择:在tLung、tL/B、mLN和mBrain的癌细胞中过滤掉非恶性细胞,分别有6352、6400、2961和15423个恶性细胞被用来鉴定差异表达的基因;来自tLung的恶性细胞被用作对照组,以评估晚期阶段和转移特定的基因调控。

6)利用轨迹分析推断肿瘤细胞状态、免疫细胞发展轨迹的推断

7)识别特征基因:应用Seurat FindAllMarkers功能来识别每个细胞子集的特定基因;使用DAVID进行功能注释

8)生存期分析:对TCGA患者LUAD和鳞状细胞癌(LUSC)样品的RNA-seq和临床数据进行生存分析,以评估来自特定细胞状态的基因集的预后效应。

9)基因-基因功能关联网络:在肿瘤ECs的特异性标记基因之间构建了一个网络,以表示其功能关联

10)细胞-细胞相互作用网络:用CellPhoneDB将受体-配体对映射到每个组织内的细胞亚群上,以确定细胞-细胞的相互作用,产生的邻接矩阵是针对收集的所有细胞-细胞相互作用而产生的;对原始邻接矩阵进行了四个过滤步骤,(1)去除与胶原蛋白的相互作用对;(2)排除相同细胞系内的细胞-细胞相互作用;(3)只分析免疫和基质细胞中0.1%以上的细胞亚群;(4)在每个来源的组织的细胞亚群之间确定显著的相互作用(满足单侧P值<0.05)

三、实验结果

01 - 早期、晚期和转移性LUAD的细胞动态

        为了阐明LUAD进展中的细胞动态,在支气管内超声/支气管镜活检或手术切除过程中,从44名未经治疗的LUAD患者获得了原发肺组织、胸腔积液和淋巴结或脑转移的肿瘤(图1a),还收集了远端的正常组织或淋巴结进行比较分析。将208506个细胞分类为9个不同的细胞系,并以典型的标记基因表达进行注释(图1b-d),从而确定上皮细胞(肺泡和癌细胞)、基质细胞(成纤维细胞和内皮细胞)和免疫细胞(T、NK、B、骨髓和MAST细胞)为常见的细胞类型,而少突胶质细胞仅在脑转移中(mBrain)。

图1    对LUAD患者的208506个单细胞进行全面剖析和聚类

        由于组织分离过程中引入的偏差,单细胞RNA测序数据与基质和上皮细胞类型相比,高估了免疫细胞的比例(补充图2a)。此外,肿瘤细胞的回收率受LUAD的组织学类型影响(补充图2b)。因此,作者评估了去除上皮细胞和基质细胞群后的免疫细胞亚群的组成。结果再现了早期LUAD中通过CyTOF检测的免疫细胞谱。在原发肿瘤部位观察到的最丰富的免疫细胞是T淋巴细胞和骨髓细胞(补充图2c,d)。此外,与正常肺组织(nLung)相比,早期和晚期肺癌(tLung和tL/B)的T和B淋巴细胞富集,自然杀伤(NK)和骨髓细胞下降,表明适应性免疫反应的激活。值得注意的是,与正常淋巴结(nLN)不同,转移性淋巴结(mLN)含有大量的骨髓细胞,表明骨髓细胞的浸润与转移有关。mBrain 样本含有可检测水平的免疫细胞(T、B 和 NK 细胞)以及常驻少突胶质细胞和骨髓细胞(小胶质细胞)。这些细胞组成显示了组织特异性居民群体的差异,以及肿瘤生长和入侵造成的严重改变。

补充图2    来自各部位组织的九个主要细胞的相对比例

02 - 与LUAD进展相关的肿瘤内在特征

        作者通过对手术切除的正常上皮细胞和肿瘤细胞的比较分析,探索了腺癌细胞的内在特征。正常上皮细胞主要包括四个不同的亚群,包括肺泡I型(AT1)和II型(AT2),以及细支气管外分泌细胞和纤毛细胞,表达明确的上皮细胞标志物(补充图3a-c)。AT1和AT2是最丰富的类型,可以在远端气道启动LUAD12。在肿瘤组织中,上皮细胞类型可能含有残留的非恶性细胞以及恶性肿瘤细胞。为了将确定的肿瘤细胞从潜在的非恶性细胞群中分离出来,作者通过从基因表达数据中推断出拷贝数变异(CNVs)来使用遗传畸变。推断出的CNV模式证实了恶性的tLung、tL/B、mLN和mBrain细胞中存在患者特有的扰动(补充图3d)。在随后的肿瘤细胞分析中,排除了肿瘤组织中没有CNV存在的上皮细胞,因为它们的身份不明确。

补充图3    正常上皮细胞亚群和恶性细胞的分析

        利用确定的肿瘤和正常上皮细胞,作者构建了一个转录轨迹(图2a),以调整患者间的基因组异质性,并找到支配肿瘤进展的关键基因表达程序。首先,纤毛上皮细胞和肺泡细胞位于不同的轨迹分支中,标志着它们不同的分化状态。其次,细支气管外分泌细胞位于纤毛上皮和肺泡分支之间,表明中间的分化状态。最后,肿瘤细胞形成一个分支结构,沿着正常上皮细胞有两个转录状态(tS1和tS3);但是,观察到一个(tS2)明显地位于tS1和tS3分支的两端(图2a,b)。在个体病人的轨迹中,尽管由于细胞成分的代表性有限,每个病人的轨迹结构不同,但反复观察到tS2与正常上皮细胞的分离(补充图3e)。为了识别轨迹中定义细胞状态的转录特征,选择了每个肿瘤或正常细胞状态特有的差异表达基因。19、28、79、56、33和248个基因组被确定为肿瘤细胞状态1、2、3(tS1、tS2、tS3)或正常细胞状态1、2、3(nS1、nS2、nS3)中显著上调的标志。大多数S1和S3相关基因在肿瘤细胞和正常细胞之间有共享但差异调节,并并且与维持表面活性物质稳态、肺泡发育和纤毛运动的正常上皮功能有关(图2c)。相比之下,S2相关基因表现出明确的肿瘤导向特征,例如侵袭性细胞运动和异常增殖或凋亡。因此,tS1和tS3状态代表了正常分化程序的失调,而tS2肿瘤细胞状态完全偏离了正常的转录程序。

图2    LUAD中新的癌细胞特征ts2及与不良生存率的关系

        LUAD患者包含不同比例的tS1和tS2肿瘤亚群,还有少量的tS3(图2d,tLung)。从晚期活检或转移的肿瘤细胞(tL/B、mLN和mBrain)中分离出的tS2特异性基因表达增加,表明与肿瘤的进展和转移有关(图2e)。通过LUAD样本的免疫组化染色,tS2特异性基因表达的增加在蛋白质水平上得到了支持(图2f)。利用TCGA中的独立LUAD队列进一步测试了tS2特征的临床影响。与低表达的患者相比,tS2特征基因高表达的患者显示出更差的总生存率(图2g)。相比之下,肺鳞状细胞癌(LUSC)没有生存差异,表明tS2特征与LUAD进展的明确相关。

        为了进一步鉴定与LUAD进展和/或转移有关的基因,作者直接比较了早期与晚期原发,或原发与转移样本中的肿瘤细胞(补充图4)。这些配对比较显示,这些基因组在肿瘤进展和/或转移过程中受到不同程度的调控。使用这些基因组的生存分析显示,晚期的特定基因组对LUAD患者的不良生存具有最高的预测能力。

补充图4    tL/B、mLN和mBrain之间肿瘤细胞的配对比较

03 - 基质细胞协调了组织重塑和血管生成

        作者获得了6168个推定的成纤维细胞和内皮细胞,如图1b所示,并进行了主成分分析(补充图5a)。观察到第一个主成分将细胞分成2107个内皮细胞和3794个成纤维细胞,与代表性标记基因的表达一致。

补充图5    内皮细胞和成纤维细胞亚群

        内皮细胞(ECs)的亚聚类显示了八个簇(图3a)。观察到大多数的EC簇属于正常组织,并被分配到已知的血管细胞类型(图3b)。相比之下,一个独特的簇被确定为存在于tLung和mBrain样品中的肿瘤衍生的ECs(EC-C1)(图3c,补充图5b,c)。肿瘤ECs显示了VEGF和Notch信号的强烈激活(图3b),肿瘤ECs的基因表达网络分析进一步强调了血管生成是上调基因的功能类别(图3d)。因此,脑转移瘤和原发性肿瘤诱导相似的血管变化以适应广泛的新生血管形成。在上调基因中,肿瘤脉管系统中的胰岛素受体 (INSR) 过表达被认为是有吸引力的治疗靶点。值得注意的是,肿瘤ECs中明显下调的基因与免疫激活有关(图3d),支持先前的发现,即肿瘤ECs抑制免疫反应。

        成纤维细胞的亚聚类显示了12个不同的簇,分配给七个已知的细胞类型(图3e):包括COL13A1 +和COL14A1 +基质成纤维细胞,肌成纤维细胞,平滑肌细胞,间皮细胞,mBrain中的成纤维细胞样细胞和周细胞。COL13A1+和COL14A1+基质成纤维细胞构成了正常肺(FB-C0和6)和早期肿瘤(FB-C1和2)组织中的主要成纤维细胞类型(图3f,g;补充图5d,e)。相比之下,FB-C3的肌成纤维细胞完全来自肿瘤组织,包括tLung、tL/B和mLN样本。mLN中的肌成纤维细胞可能是成纤维网状细胞,mBrain中的纤维母细胞样细胞(图3f,g;补充图5d,e;FB-C7;CYP1B1+和APOD+)可能代表在 CNS 损伤后扩张的中枢神经系统 (CNS) 血管周围间隙内的细胞。LUAD 中肌成纤维细胞的浸润通过肿瘤基质(图 3h)和肿瘤衍生的 EPCAM-CD45-细胞中标记蛋白 α 平滑肌肌动蛋白(α-SMA)(ACTA2 基因产物)的表达得到证实。在正常组织的血管平滑肌细胞中观察到α-SMA的部分蛋白表达。最后,内皮细胞和成纤维细胞中的细胞动力学支持基质细胞的一致表型转移,以促进LUAD和远端转移中的组织重塑和血管生成。

图3    肿瘤内皮细胞和肌成纤维细胞促进血管生成和组织重塑

04 - 由骨髓类细胞引出的抑制性免疫微环境

        骨髓细胞在维持组织稳态和调节肺部炎症方面起着关键作用。如图1b所示,对42245个骨髓细胞进行亚聚类,发现它们是单核细胞、巨噬细胞和树突状细胞(图4a, b),实验过程中没有发现中性粒细胞。作者主要在正常肺组织中检测到肺泡(AM)类型,包括抗炎性AM(M-C1和6;APOE+,CD163+和C1QB+),促炎性AM(M-C5;IL1B+和CXCL8+),以及表达抗炎标记的活跃循环AM(M-C13)。相比之下,肺肿瘤和远处转移组织在mo-Macs(分别在M-C0和2中的抗炎和促炎mo-Macs)中强烈富集。正常组织和肿瘤组织都含有S100A9+单核细胞簇(M-C3)或树突状细胞(DCs)簇。其余的簇显示了来源特定的异质性和多样的的巨噬细胞特征,包括来自胸腔积液(PE)的胸腔巨噬细胞(M-C8和9)或来自mBrain样本的小胶质细胞和巨噬细胞(M-C11)。总的来说,本研究数据表明,原发性肺肿瘤和远处转移的肿瘤相关巨噬细胞(TAMs)主要由mo-Macs繁殖而来,这些巨噬细胞在本体论上不同于组织驻留的巨噬细胞(图4c,补充图6a,b)。

图4    髓细胞系内的多样性以及根据组织起源的功能性

        为了了解从单核细胞到TAMs的转录转变,作者进行了无监督轨迹分析,以推断来自肺部或淋巴结样本的巨噬细胞的状态变化(补充图6c,d)。巨噬细胞可以在健康和疾病状况中表现出多种功能表型,如促炎或抗炎亚群。最终已经检测到沿着伪时间轴,促炎症单核细胞向巨噬细胞的连续转变,细胞失去了促炎症的性质,获得了抗炎症的特征(补充图6e,f)。这种转变最终达到了一个分支点,在这个分支点上,两个巨噬细胞亚群或者保留了部分促炎症的特征,或者偏向于抗炎症的基因表达表型。正常的肺和肿瘤组织分别富含促炎和抗炎巨噬细胞。作者还在MLN中发现了抗炎巨噬细胞,还有一个表达巨噬细胞炎症因子(MIF、CXCL3和CCL20)的群体(LN-Mac-S6)(补充图6f)。表达MIF的巨噬细胞也表达IL1B和TNF,其水平与促炎症单核细胞相当,表明MLN中独特的巨噬细胞特征。

补充图6    髓系细胞亚群和单核细胞及mo-Mac状态转换的分析

        树突状细胞集群如图4b所示,表现出不同的标记基因表达,表明存在异质性的DC亚群。为了进行更全面的分析,作者将DC重新分类为六个亚群,包括CD1c+ DCs(朗格汉斯细胞,LCs)、CD141+ DCs、CD207+CD1a+ LCs、pDCs(浆细胞DCs)、CD163+CD14+DCs和活化DCs43,44(图4d, e)。这完善了整个骨髓细胞群中的次要DC群体(图4f)。有趣的是,在正常肺组织中很少发现 pDC,但在选定的肿瘤组织和转移性淋巴结中发现了 pDC(图4g,h)。pDCs表现出免疫抑制表型,表现为白细胞免疫球蛋白样受体(LILR)家族基因的上调,颗粒酶B(GZMB)的产生,以及CD86、CD83、CD80和LAMP3激活标志物表达的丧失(图4i)。一些LUAD组织中pDCs的存在通过流式细胞仪得到证实(图4j,k)。因此,mo-Macs和pDCs都可以产生免疫抑制微环境,可能导致LUAD和远处转移的肿瘤抗原呈现不理想。

05 - 适应性免疫的激活和扰动

        与nLung样本相比,B细胞的相对比例在原发肿瘤中有所增加(补充图2c,d)。在淋巴结中,无论是否转移,B细胞都是大量存在的。对27657个B细胞进行亚聚类显示有14个群汇聚成五种分化状态,分别表示为滤泡B细胞,表达免疫球蛋白γ(IgG)的浆B细胞,表达IgA并连接链的粘膜相关淋巴组织来源的浆B细胞,颗粒酶B分泌B细胞和germinal center (GC)B细胞(图5a,补充图7a, b)。具体来说,GC B 细胞被分离成暗区或亮区细胞,分别具有不同的增殖或激活转录程序(补充图7a)。其中,观察到滤泡B细胞在所有样品中含量最高(图5b,补充图7c)。作者已经观察到其他亚群的组织特异性富集(补充图7c,d)。首先,正常肺组织富含颗粒酶B分泌毒细胞,其分化受到T细胞衍生的IL-12的调节,这些细胞分泌的颗粒酶B可以作为T细胞的替代品,在介导细胞毒性方面发挥重要作用。其次,原发性肿瘤和LN转移灶中发现的GC B细胞分别比正常肺和淋巴结中更多。这些数据强烈地表明在一些LUAD患者中存在高度激活的体液免疫反应。每种B细胞亚型显示出稍有不同的B细胞受体或Ig轻链可变基因表达谱(补充图7e),表明肿瘤抗原特异性B细胞的产生和克隆性扩展。

图5    肺癌发展过程中B细胞和T/NK细胞介导的免疫反应
补充图7    B细胞亚群

        T淋巴细胞是介导抗肿瘤免疫的核心角色,是免疫检查点疗法的目标。对于T淋巴细胞的亚集群分析,作者最初从T和NK细胞集群中收集了91227个细胞(图1b),这些细胞具有共同的转录组特征,并利用标记基因表达,通过二级细胞过滤定义了64403个T/NK细胞。T/NK细胞亚群反映了异质性的细胞系和功能状态,被确定为CD8+T(幼稚、效应、衰竭)、幼稚的CD4+T、衰竭的T滤泡辅助细胞、T辅助细胞、调节性T和NK细胞(图5c,补充图8a)。作者发现与正常组织相比,原发肿瘤组织中的NK细胞被耗尽,调节性T细胞(Tregs)出现(图5d,补充图8b,c)。Treg细胞在tL/B、mLN和mBrain中持续存在,在肿瘤进展和转移过程中提供了一个抗肿瘤免疫的抑制机制。CD8+ T 细胞表现出动态功能谱,如转录轨迹中的幼稚、细胞毒性或衰竭状态(图5e、f)。衰竭的CD8+T细胞主要来自肿瘤组织(tLung、tL/B、mLN和mBrain),而细胞毒性效应的CD8+T细胞则来自nLung(图5g)。幼稚的CD8+ T细胞主要衍生自NLN和PE。常规流式细胞仪分析进一步支持了原发性肿瘤和正常肺组织之间T/NK细胞亚群动力学(NK,TREG和细胞毒性或耗尽的CD8+ T细胞)之间的差异(图5h)。总的来说,T细胞的细胞组成和基因表达表型的变化证实了LUAD中肿瘤免疫的方向是免疫抑制。

补充图8    T细胞亚群

06 - 细胞间和分子间相互作用的推断

        通过卡方检验对40个免疫和基质细胞亚群的不同组织分布进行检验,进一步证实了LUAD进展期间的细胞动力学(图6a)。肿瘤特异性群体,如mo-Mac、pDC、Tregs、肌成纤维细胞和肿瘤ECs分布在原发性肿瘤和远处转移灶中,而起源特异性免疫和基质细胞亚群(肺泡mac、胸膜mac、小胶质细胞/mac、和FB样细胞)与其相应的组织部位特异性相关。在 LUAD 进展和转移期间,衰竭的 CD8+ T 细胞和 mo-Mac 的比例显著增加(图 6b)。此外,肿瘤微环境中这两个亚群的增加与高肿瘤突变负担(TMB)有关(图6c)。由于高TMB是免疫检查点治疗成功的主要预测因素,因此作者的结果支持mo-Mac和衰竭的CD8+ T细胞在晚期 LUAD 中免疫检查点治疗成功应用中的作用。

图6    LUAD进展和转移期间的表型变化

        为了描绘细胞间关系背后的分子关联,我们首先使用潜在的受体 - 配体对相互作用构建了一个细胞通信网络。在tLung中证实了tS2(一种与LUAD进展和转移相关的新型癌细胞状态)与髓系或基质细胞类型之间的显性串扰(图6d,补充图 9)。网络中,tS2细胞和mo-Mac之间的相互作用被预测为最显著,而mo-Macs和衰竭的CD8 + T细胞之间的相互作用被观察到在免疫细胞网络中最为突出。mo-Macs和衰竭的CD8 + T细胞的比例也显示出与ts2癌细胞增加的正相关关系(图6e)。对于其他细胞类型,作者发现ts2 /恶性细胞与肿瘤EC之间通过血管生成信号分子(如VEGF-VEGFRs和ephrin-Eph受体)之间的潜在相互作用(图7a,b)。肿瘤ECS将通过VEGF及其受体FLT1/VEGFR1,KDR/VEGFR2从MO-MAC/恶性细胞中接收血管生成刺激信号,作为所有肿瘤阶段样品或脑转移样品的癌症中血管生成的关键介质。

图7    重要的配体 - 受体对基因解释了特定的细胞间相互作用

        此外,作者还预测了原发性肿瘤(tLung和tL / B)或远处转移(mLN和mBrain)中mo-Macs,衰竭的CD8 + T和癌细胞之间的分子相互作用,其在LUAD中具有显性串扰(图7c)。mo-Macs和ts2 /恶性细胞之间的大多数配体受体对都参与生长因子的信号传导。恶性细胞将通过转移性淋巴结中的TNFR(TNF-TNFRSF1A),TGFBR(TGFB1-TGFBR2)和EGFR(EREG-EGFR)从mo-Macs接收激活信号。TNFR信号在晚期tL/B中也很突出。作为回报,来自转移性淋巴结的恶性细胞将为mo-Macs(CSF1-CSF1R)提供生长信号。对衰竭的CD8 + T细胞的潜在信号转导主要是抑制性的,由tS2 /恶性细胞传递,用于所有肿瘤分期(NECTIN2-TIGIT)或转移性淋巴结(LGALS9-HAVCR2)的样本。有趣的是,预计MO-MAC可以将激活(TNF-TNFRSF1B/ICOS)和抑制(LGALS9-HAVCR2)传递到衰竭的CD8+ T细胞中。因此,作者的结果证明了LUAD中MO-MAC的复杂性质,这极大地影响了T细胞平衡免疫激活和疲惫的功能。

        综上所述,细胞间相互作用表明免疫细胞动力学与癌细胞的分子特征之间存在密切关系,这可能决定LUAD的预后和治疗反应。

四、结论

        在本研究中,作者进行了LUAD从原发性癌症和远处转移的早期到晚期的全面单细胞转录组分析,揭示了与肿瘤进展相关的细胞动力学和分子特征。并进一步阐明了肿瘤进展过程中细胞和分子网络的变化,为LUAD提供了最全面的细胞相互作用图谱,揭示了癌症与微环境相互作用中的潜在诊断和治疗靶点。

你可能感兴趣的:(从早期到晚期原发性和远处转移的 LUAD 的综合单细胞转录组分析(IF14+))