文章题目:Single-cell analyses define a continuum of cell state and composition changes in the malignant transformation of polyps to colorectal cancer
发表杂志:Nature genetics (IF 41.307)
发表时间:2022-6-20
DOI:10.1038/s41588-022-01088-x
摘要
为了绘制健康结肠向癌前腺瘤转变为结直肠癌(CRC)过程中发生的细胞组成和细胞状态变化,作者收集了48个息肉、27个正常组织和6个CRCs的单细胞染色质可及性谱和单细胞转录组,每个样本从1,000到10,000个细胞,这些样本来自于携带或不携带生殖系APC突变的患者。大部分息肉和CRC细胞表现为干细胞样表型,作者定义了这些干细胞样细胞从稳态发展为CRC时发生的一系列表观遗传和转录变化。晚期息肉含有越来越多的干细胞样细胞、调节性T细胞和癌前相关的成纤维细胞亚型。在癌症状态下,作者观察到T细胞衰竭、runx1调控的癌症相关成纤维细胞以及上皮细胞中与HNF4A基序相关的可接近性增加。散发CRC的DNA甲基化变化与可及性变化在这一连续过程中呈强反相关,进一步确定了息肉分子分期的调控标志物。
前言
识别驱动浸润性癌症形成的基因和途径一直是许多大规模基因组学工作的核心焦点。然而,大多数研究都集中在晚期肿瘤的大量分析上,并且在很大程度上忽略了癌前病变。因此对从正常到癌前病变再到癌变状态过渡期间发生的表型变化进展的详细理解,以及这种转变的分子驱动因素,仍然未得到充分探索。
CRC是研究沿恶性转化的表型状态连续性的理想系统,因为它遵循从正常到非典型再到癌的刻板进展,包括癌前息肉的形成,随后可引起CRC。与这些转变相关的许多变化几乎适用于所有CRC恶性肿瘤,以腺瘤到癌序列(the colorectal adenoma–carcinoma sequence,图1)为典型。
腺瘤性结肠息肉(APC)病基因是结直肠癌抑癌基因,可在胚系和体系水平出现异常调节。据统计,有80-90%的结直肠肿瘤是由APC的丧失引起的。导致β-连环蛋白稳定和WNT信号传导增加,进而导致肠增生。其他癌症驱动基因(如KRAS,TP53和SMAD4)的后续突变导致转化为癌。
由于APC突变几乎普遍是息肉和CRC的始发事件,因此具有APC种系突变的家族性腺瘤性息肉病(FAP)患者是研究息肉病自然进展的合适人群。这些患者通常在成年早期发展成数百个息肉,因此个体患者可以提供许多不同分子年龄和进展阶段的息肉,所有这些都在同一个种系背景中出现。
本文研究内容
为了绘制从健康结肠到浸润性癌的表型连续体上发生的调节和转录组学变化,作为人类肿瘤图谱网络的一部分,作者分析了健康结肠,息肉和CRC的单核转录组(snRNA-seq)和表观基因组(scATAC-seq)。许多息肉是从接受手术结肠切除术的FAP患者那里获得的,这样既可以分析具有不同大小和起源位置的息肉,也可以收集邻近的未受影响的结肠组织。
从这些单细胞数据集中,作者首先对免疫(immune)、基质(stromal)和上皮(epithelial)细胞类型进行分类。发现成纤维细胞(fibroblast)亚群在从正常结肠到CRC的过渡过程中发生了很大的变化。作者鉴定出仅存在于CRC组织中的耗竭T细胞(exhausted T)的亚群。作者在转录和表观遗传学数据中观察到,在息肉和CRC中,有很大一部分细胞表现出干细胞样状态(stem-like state)。作者的研究发现,息肉形成了从正常结肠到大肠癌的表观遗传学和转录连续体,其特征是染色质的顺序打开和关闭以及与癌症状态相关的基因的上调和下调。作者确定了与从正常结肠到癌的不同转化阶段相关的调控元件和转录因子(TFs),包括含有TCF和LEF基序的区域可及性的早期增加以及含有KLF基序的区域的可及性丧失。在该途径的最后阶段,即恶性转化中,观察到含有HNF4A基序的区域的可及性增加。最后,作者的实验表明息肉的可及性变化与散发性大肠癌中的DNA甲基化变化具有很强的负相关性,并确定了这些区域中的一个子集,这些区域在恶性连续体(malignant continuum)早期改变了其可及性状态,这表明了检测癌前息肉的潜在策略。
结论
结论1 绘制恶性转化过程中的分子变化图
作者从8个FAP和7个非FAP供体中收集了81个样本,并生成了单细胞数据(图2a)。每个组织样本均进行了匹配的scATAC-seq和snRNA-seq,从80个样品中获得了447,829个细胞的高质量单细胞染色质可及性数据,大多数样品的平均转录起始位点(transcription start site,TSS)富集率约为8;从70个样品中获得了201,884个细胞的单细胞转录组数据。
当所有snRNA-seq细胞数据和scATAC-seq细胞数据投射到低维亚空间中时,基质细胞和免疫细胞通常按细胞类型聚集,而上皮细胞在很大程度上分裂成不同的簇(图2b,图2c),包括来自息肉,未受影响的组织或CRC的细胞。因此,通过从所有样品中亚群细胞来注释免疫细胞和基质细胞,并分别分析上皮细胞。
结论2 息肉和大肠癌中富含T细胞和骨髓细胞
免疫细胞包括B细胞、T细胞、单核细胞、巨噬细胞、树突状细胞和肥大细胞(图2d)。作者检查了已知标记基因的表达以注释snRNA-seq数据,并检查了染色质活性评分(给定基因体内和周围可及性的度量),与标记基因相关以注释scATAC细胞。作者在scATAC数据中鉴定出一簇耗竭T细胞,这些T细胞在耗竭T细胞基序中表现出高基因评分和耗竭T细胞基序的可及性,并被已发表的数据集标记为耗竭T细胞。
所鉴定的免疫细胞类型几乎存在于所有样本中,尽管某些细胞类型在特定疾病状态下富集或耗尽(图2e)。例如,相对于未受影响的组织,调节性T细胞(Treg)在息肉中富集,而相对于息肉,幼稚B、记忆B和生发中心细胞(germinal center)在未受影响的组织中富集。
息肉和大肠癌中Treg富集以及大肠癌中耗竭T细胞富集,这表明在癌前和癌性状态下存在免疫逃避机制。T细胞衰竭是响应于慢性抗原刺激而发生的,其特征在于细胞因子产生减少和抑制性受体表达增加,被认为是癌症免疫逃逸的主要机制。
[相关信息]慢性感染和癌症病人,由于长期暴露于持续性抗原和炎症,T 细胞受到持续刺激,精疲力竭的 T 细胞逐渐失去效应功能,记忆T细胞特征也开始缺失,称为 T 细胞耗竭(T Cell Exhaustion)。耗竭 T 细胞在功能上有别于效应 T 细胞和记忆 T 细胞,其特点是效应功能丧失,抑制性受体(IRS)表达增高且持续,表观遗传和转录谱改变,代谢方式改变(图3)。
基质细胞方面,鉴定到神经胶质细胞,脂肪细胞和多种类型的内皮细胞和成纤维细胞。成纤维细胞亚型包括隐窝成纤维细胞(crypt fibroblasts,WNT2B或RSPO3高表达),绒毛成纤维细胞(villus fibroblasts,WNT5B高表达)和肌原纤维细胞(myofibroblasts,ACTA2和TAGLN高表达)。在绒毛成纤维细胞中观察到BMP信号基因的高表达。作者还观察到一簇肿瘤相关成纤维细胞簇(CAFs),其几乎完全由来自CRC的细胞组成,以及富含息肉和CRC细胞的scATAC成纤维细胞簇,可接近一些与CAF相同的基因,称之为癌前相关成纤维细胞(preCAFs)。这些结果表明,息肉和肿瘤中存在表型不同的成纤维细胞,因此可能在癌前病变的肿瘤发生中发挥作用。
接下来,作者整合了scATAC序列和snRNA序列数据集,以分析潜在驱动基因表达的调控元件和转录因子。作者将数据集与典型相关分析(CCA)进行比对,并将RNA文件分配给每个scATAC细胞中。
结论3 scATAC揭示癌前相关成纤维细胞(preCAF)群体
CAFs通过多种机制促进癌症的发展和进展,包括基质重塑、与癌细胞的信号相互作用和干扰免疫监测(图4)。作者观察到一个具有高表达已知CAF标记基因FAP和TWIST1的CAF簇。CAF最重要的snRNA-seq标记物包括FAP、VCAN和COL1A2(图4a),它们参与细胞外基质重塑并在多种癌症中上调。CAFs对这些基因的特异性表达表明,成纤维细胞参与癌组织中独特的细胞外基质重塑,而这种重塑在正常结肠或癌前息肉中并不存在。
虽然已知CAF可以促进CRC进展,但接下来探索了成纤维细胞在癌前病变中的作用。由于preCAF簇富含来自息肉的细胞,检查了CAFs标记基因周围的可及性,并发现许多这些基因在preCAF细胞亚型中比在其他成纤维细胞亚型更容易获得。例如,CAFs分泌WNT2以促进CRC中的细胞增殖和血管生成。CAFs和preCAFs在WNT2 TSS上表现出最大的可及性(图4b),表明染色质变化促进了WNT2在CAFs和preCAFs中的表达。CAF和preCAFs之间存在相似之处,并表明preCAFs可以执行与CAFs类似的功能。
[相关信息]肿瘤组织中大量的肿瘤相关成纤维细胞(cancer associated fibroblasts, CAFs)为肿瘤的发展构建了良好的环境(占基质细胞50%以上)。CAFs在癌症中扮演重要作用:CAFs不仅可通过分泌多种细胞因子或代谢产物抑制免疫细胞的功能,促进肿瘤发展、侵袭、转移;CAFs 还具有塑造肿瘤外基质、形成药物或治疗性免疫细胞渗透屏障的阻止药物与免疫细胞向肿瘤组织的深层渗透,从而降低肿瘤治疗效果。因此,通过调控 CAFs 或克服其屏障作用抑制肿瘤是肿瘤治疗的新手段。
结论4 RUNX1 与 CAF 中的广泛可访问性相关
作者发现,CAF标记峰对JUN/FOS和CEBP基序富集,preCAF标记峰对JUN/FOS和FOX基序富集(图4 c,d)。与其DNA基序的染色质可及性活性水平之间相关性最相关的TF是RUNX1,RUNX2和CEBPB(图4 e)。然后作者在基质细胞的UMAP图和小提琴图中绘制了这些转录因子(TF)的表达水平(RNA expression)和基序活性(chromVAR deviation z-scores),并注意到具有类似基序的RUNX1和RUNX2的染色质活性水平在CAFs和preCAFs中最高(图4 f)。然而,RUNX1主要在CAFs和preCAFs中表达,而RUNX2在CAFs中的表达要低得多,这表明RUNX1在RUNX基序中比RUNX2在CAFs中更强。
结论5 息肉富含干细胞样上皮细胞
作者构建了正常上皮结肠细胞的RNA-seq和ATAC-seq参考数据(图5 a),并使用已知标记基因的基因表达和基因活性评分来注释该正常组织中的细胞类型。发现来自息肉和CRC的上皮细胞倾向于沿着正常的分化轨迹投射到更接近干细胞和其他未成熟细胞的位置,而来自未受累组织的细胞在整个上皮区室中相对均匀地投射(图5b)。根据投影中最近的正常细胞对所有上皮细胞进行分类,发现来自息肉和CRC的样本富含干细胞样上皮细胞,而对于成熟的肠细胞,肿瘤的上皮细胞的耗竭,这表明上皮细胞在从正常到息肉的转化过程中越来越多地表现出干细胞样表型(图5 b-d)。推测息肉和CRC中的干细胞样细胞群可能代表这些组织中的“癌症”干细胞。
为了量化样本中单个细胞的干细胞度,作者为每个snRNA序列和scATAC序列细胞分配了量化干细胞度的分数,并通过每个样本中的干细胞分数分布来排序样本(图5 e)。正如预期的那样,未受影响的样本通常具有较低的干细胞度评分。许多息肉聚集在未受影响的组织附近,表明它们是相对良性的。然而,来自大多数息肉和CRC的细胞通常具有较高的干细胞度评分,其中一些显示出更大的干扩散,而另一些则具有更紧密的干评分分布,表明一些息肉可能更具异质性。
结论6 干细胞样细胞形成潜在的恶性肿瘤连续体
接下来,作者将息肉和CRC干细胞样细胞的基因表达和染色质可及性与正常干细胞进行比较,以确定癌前病变和癌变病变中的异常基因表达和调节程序。在计算每个样本的干细胞样细胞和最近的正常细胞类型的细胞之间的差异峰后,计算这些差异峰的主成分log2FC,并按样品沿该空间中样条拟合的位置对样本进行排序(图6 a),其中排序中的位置可以解释为从正常组织到癌症的连续体中的位置。分析结果表明,干细胞与这些干细胞样息肉细胞之间的基因表达和染色质可及性的差异遵循从早期到晚期息肉到侵袭性CRC的刻板进展。
结论7 基因表达沿恶性连续体变化
通过选择在至少两个样品中差异表达的基因,然后将这些基因聚类为十个k均值簇来检查沿这种恶性连续体的基因表达变化(图6 e)。这些簇对应于在恶性转化的不同阶段差异表达的基因组。例如,与未受影响的干细胞相比,簇1-4包含早期息肉中干细胞样细胞中上调的基因。第4组的成员包括OLFM4,这是肠道干细胞的标志物,表明当息肉的干细胞样细胞接近恶性肿瘤时,OLMF4的表达增加。第4组还包括GPX2,一种已知在CRC中上调的谷胱甘肽过氧化物酶,通过减少过氧化氢来缓解氧化应激,促进肿瘤发生和转移(图6 h)。
结论8 息肉显示TCF和LEF活性增加
为了鉴定与侵袭性转化相关的息肉组,作者将至少两个样本中与最接近的未受影响细胞类型相比,将36374个峰值显着差异聚类为十个k均值簇(图6 f),揭示了五个在癌症过渡的不同阶段变得更容易接近的簇和五个变得不那么容易接近的簇。为了识别TF在从正常结肠到CRC的转变中驱动染色质可及性变化,作者从图6 f计算了每个峰簇中基序的超几何富集,并确保了这些结果的稳定性(图6 g)。
TCF和LEF家族基序在所有簇中都得到了丰富,这些簇在整个恶性肿瘤连续体(簇1-5)中变得更加容易获得,这与APC的丢失导致细胞核中β连链蛋白积累的事实一致,其与TCF和LEF TFs相互作用以驱动WNT信号传导。
在后期息肉和CRC中更容易接近的3簇峰也表现出ASCL2基序的富集(图6 g)。ASCL2是肠道干细胞命运的主要调节剂,诱导ASCL2缺失导致小鼠LGR5肠道干细胞丢失。与息肉上皮中更茎样状态与更晚期恶性连续评分之间的联系一致,ASCL2表达随着息肉接近恶性转化而逐渐增加(图6 h),再次表明“超级茎”样表型,其中干状态的主调节因子甚至比正常干细胞中更活跃。
沿恶性连续体丢失的基序包括HOX家族基序,KLF基序和GATA基序(图6 g)。簇4和5仅在CRC样品中表现出较大的可及性增加,并且HNF4A基序的富集最大(图6 g)。这一观察结果表明,HNF4A在息肉中的使用差异,其中它减少以驱动WNT信号传导,而在CRC中,它被上调以驱动癌症特异性可及性差异。
结论9 细胞组成的沿恶性连续体的重塑
作者计算了每种细胞类型对每个样品的分数贡献作为恶性肿瘤连续体中位置的函数,并发现一些细胞类型与沿恶性肿瘤连续体的进展高度相关。例如,在整个恶性转化过程中,样品中干细胞的比例逐渐增加(图7 a,i)。随着息肉转化为癌,组织中成熟肠细胞的数量减少(图7 b,i)。Milo分析显示,在恶性肿瘤连续体的末端,干细胞样细胞的邻域往往明显更丰富。在主要由未成熟和成熟的高脚杯细胞组成的分泌室中,观察到许多息肉中未成熟高脚杯细胞的分数增加。作者在癌症组织中看到普遍缺乏对分泌谱系的分化,有效地消除了未成熟和成熟的高脚杯细胞(图7 c,d,i)。这一观察结果与先前报道非粘性结肠腺癌中杯状细胞耗竭的工作一致。在以前的工作中还发现,MUC2的敲除导致小鼠中形成更多的腺瘤和癌,这表明未成熟和成熟的高脚杯细胞的丧失甚至可能导致肿瘤发生。
在上皮隔室之外,作者还观察到从未受影响的息肉到癌的转变过程中细胞组成的变化。在基质室内,前CAFs的比例逐渐增加,而CAFs仅出现在CRC中(图7 g,h)。在免疫区室内,在更恶性的息肉和CRC中增加Tregs,而疲惫的T细胞仅出现在CRC中(图7 e,f)。已知Tregs抑制抗肿瘤免疫反应,并且通常以高水平存在于肿瘤微环境中,Tregs的逐渐增加可能是癌前息肉免疫逃逸的一种机制。
结论10 比较CRC DNA甲基化变化与连续体可及性
异常DNA甲基化是CRC肿瘤发生的主要机制,但甲基化变化的时间和程度在恶性转化之前和期间驱动染色质可及性的变化尚不清楚。在癌症基因组图谱(TCGA)DNA甲基化数据(Illumina 450K阵列)中鉴定了正常和CRC样品之间的差异甲基化探针。对于来自至少一个450K阵列探针的上皮细胞的~89000个染色质可及性峰,确定有多少重叠至少一个高甲基化位点,至少一个低甲基化位点或没有差异甲基化位点。然后,作者根据峰是图6 h中确定的显着上调或显着下调簇的成员将峰分成组。
对于重叠的低甲基化探针的峰,大约三分之一(534)属于沿连续体变得明显更容易接近的簇,而<0.5%(5)变得明显不那么容易接近(图8 a)。作者看到重叠的高甲基化探针的峰的相似对应关系,大约四分之一(754)变得不那么容易接近,<0.5%(9)变得更加容易接近。因此,CRC中的高甲基化和低甲基化几乎完美地预测了该位点的可及性将分别减少或增加,或者保持不变。在未达到显著性阈值的峰中,作者观察到重叠的高甲基化探针的峰内的总可达性较低,而当它们重叠的低甲基化探针时,可及性更高(图8 b)。然而,作者还观察到,79.4%(2,096)的明显更容易接近的峰和76.3%(2,440)的较难接近的峰与非差分探针重叠,这意味着大多数染色质可及性变化可能不是由甲基化驱动的。
接下来,作者绘制了恶性肿瘤连续体中重叠的高甲基化和低甲基化探针的差异峰的数量(图8 c),并发现在CRC中最终差异甲基化的区域发生的染色质可及性变化沿着从正常到癌症的转变积累,在晚期息肉和CRC中观察到的最大数量。
在CRC中与高甲基化探针重叠的区域中,息肉变得不那么容易接近,这是几个先前报道的癌症特异性高甲基化位点。例如,在正常结肠、未受影响的FAP结肠和非常早期的息肉中,ITGA4基因附近的启动子区域和多个远端调节元件是可触及的,但在进展为CRC的早期变得闭合,即使在低级别息肉中也保持闭合(图8 d)。在作者的数据集中,与高甲基化探针重叠的差分峰最近的基因是NR5A2。该基因附近的多个峰沿着恶性肿瘤连续体变得不那么容易接近(图8 d),并且NR5A2的表达也沿着恶性肿瘤连续体逐渐减少。NR5A2是一种核受体,与广泛的功能有关,包括炎症和细胞增殖。NR5A2的高甲基化,可及性降低和基因表达降低表明,可能由NR5A2丢失引发的促炎状态可能在肿瘤发生中起作用。
参考文献
[1] Davies R J, Miller R, Coleman N, et al. Colorectal cancer screening: prospects for molecular stool analysis[J]. Nature Reviews Cancer, 2005, 5(3): 199-209.
[2]Blank CU, Haining WN, Held W, et al. Defining 'T cell exhaustion'. Nat Rev Immunol. 2019;19(11):665-674.
[3]Ping Q, Yan R, Cheng X, et al. Cancer-associated fibroblasts: overview, progress, challenges, and directions [published correction appears in Cancer Gene Ther. 2021 Jun 28;:]. Cancer Gene Ther. 2021;28(9):984-999.
[4]Mao X, Xu J, Wang W, et al. Crosstalk between cancer-associated fibroblasts and immune cells in the tumor microenvironment: new findings and future perspectives. Mol Cancer. 2021;20(1):131.
[5]Becker WR, Nevins SA, Chen DC, et al. Single-cell analyses define a continuum of cell state and composition changes in the malignant transformation of polyps to colorectal cancer. Nat Genet. 2022;54(7).