这一篇我们要继续分享单细胞空间联合分析的内容,参考文献在Mapping pediatric brain tumors to their origins in the developing cerebellum,单细胞空间技术,在肿瘤领域的运用作为常见。
Abstract
Understanding the cellular origins of childhood brain tumors is key for discovering novel tumor-specific therapeutic targets(了解儿童脑肿瘤的细胞起源是发现新的肿瘤特异性治疗靶点的关键). Previous strategies mapping cellular origins typically involved comparing human tumors to murine embryonal tissues, a potentially imperfect approach due to spatio-temporal gene expression differences between species(由于物种之间的时空基因表达差异,这是一种可能不完美的方法). Here we use an unprecedented single-nucleus(单核技术) atlas of the developing human cerebellum and extensive bulk and single-cell transcriptome tumor data to map their cellular origins with focus on three most common pediatric brain tumors – pilocytic astrocytoma, ependymoma, and medulloblastoma. Using custom bioinformatics approaches, we postulate the astroglial and glial lineages as the origins for posterior fossa ependymomas and radiation-induced gliomas (secondary tumors after medulloblastoma treatment), respectively. Moreover, we confirm that SHH, Group3 and Group4 medulloblastomas stem from granule cell/unipolar brush cell lineages, whereas we propose pilocytic astrocytoma to originate from the oligodendrocyte lineage. We also identify genes shared between the cerebellar lineage of origin and corresponding tumors, and genes that are tumor specific; both gene sets represent promising therapeutic targets. As a common feature among most cerebellar tumors, we observed compositional heterogeneity in terms of similarity to normal cells, suggesting that tumors arise from or differentiate into multiple points along the cerebellar “lineage of origin”(表明肿瘤起源于或分化为沿小脑“起源谱系”的多个点 )。
Introduction
小儿中枢神经系统 (Pediatric central nervous system,CNS) 肿瘤是儿童中最致命的疾病之一。尽管在这些肿瘤的分类和诊断方面取得了重大进展,例如 DNA 甲基化分析和基于下一代测序的常规检查,但当代治疗分层与在儿童中枢神经系统肿瘤中观察到的巨大肿瘤间异质性不匹配。目前的放疗和化疗方法经常导致神经认知障碍和终生副作用,包括原发疾病存活的患者的继发性恶性肿瘤。未来的治疗方法必须发展以针对肿瘤特异性脆弱性,理想情况下不影响正常组织结构——由于大脑的组成和功能的复杂性,这是一项艰巨的任务。为了应对这些挑战,专注于小脑,这是小儿脑肿瘤最常见的解剖位置。试图揭示人类小脑细胞的多样性,识别易受肿瘤形成影响的细胞,并检测作为潜在肿瘤特异性治疗靶点的调控基因或表面标志物。
在这项研究中,专注于三种最常见的儿童小脑肿瘤类型:髓母细胞瘤 (MB)、后颅窝室管膜瘤 (PFA-EPD) 和毛细胞星形细胞瘤 (PA)。髓母细胞瘤是最常见的恶性小脑肿瘤,分为 WNT、SHH、Group 3 和Group 4 分子组以及相关亚组。虽然 WNT MBs 被认为是由背侧脑干的菱形下垂而非小脑产生,但已知 SHH MBs 起源于颗粒细胞前体,而Group 4 MBs 最有可能来自unipolar brush cells。Group 3 MB 的细胞起源仍然不太清楚。 PFA 是一种后脑特异性室管膜瘤类型,由于其化疗耐药性,通常是致命的。在之前的研究中,当与鼠小脑细胞类型进行比较时,这种肿瘤类别与径向神经胶质细胞亚型——“屋顶板样干细胞”和“神经胶质祖细胞”——最相似。毛细胞星形细胞瘤虽然代表良性肿瘤,但通常与终生发病率和多次肿瘤复发有关。
While the origin of these tumors is unknown, PAs are hypothesized to arise from oligodendrocytes。值得注意的是,儿科肿瘤的细胞起源主要是从鼠细胞图谱中推断出来的,由于这些物种之间的时空发育基因表达差异,这是一种有限且可能不完美的方法。因此,有必要基于全面的人类细胞图谱重新审视儿科肿瘤的细胞起源。
为了填补这一空白,将代表来自发育中的人类小脑的细胞类型、分化状态和亚型的转录组与来自儿科 CNS 肿瘤的大量和单细胞基因表达谱进行了比较。对这些数据集的综合分析揭示了髓母细胞瘤、室管膜瘤和毛细胞星形细胞瘤类别和亚类的最佳匹配细胞谱系。使用肿瘤与正常组织的比较,将候选靶基因和通路确定为推定的肿瘤特异性弱点。此外,我们检测到胶质细胞谱系,星形胶质细胞和少突胶质细胞的来源,作为辐射诱导的神经胶质瘤的起源谱系,这是一种相对常见的继发性肿瘤,在髓母细胞瘤治疗后出现,表明这些肿瘤独立产生,而不是通过原发性髓母细胞瘤的进化或转分化发生。
Result
Distinct origins for different tumor classes
分析生成了一个广泛的单核 RNA 测序 (snRNA-seq) 数据集,涵盖了从神经发生开始到成年的人类小脑发育,并作为本研究中肿瘤匹配分析的参考。在参考图谱中,180,956 个细胞分为 21 种细胞类型(例如星形胶质细胞),进一步分为 37 种细胞分化状态(例如祖细胞),以下称为细胞状态。 此外,针对细胞类型和状态指定了亚型,从而产生了 65 种转录组学定义的细胞亚型(例如,祖细胞分为九个时空亚型,包括菱形唇祖细胞)。 值得注意的是,细胞类型内的细胞状态沿着分化轨迹形成一个连续体,我们在本研究中将其称为“细胞谱系”。 例如,星形胶质细胞谱系包括祖细胞(神经上皮和放射状胶质细胞)、胶质母细胞和星形胶质细胞状态。
使用了一组unprecedented Affymetrix bulk 表达数据作为主要肿瘤转录组队列。 为了消除样本或研究特定的分类偏差,使用了基于甲基化的分类,覆盖了 55% 的目标样本; 对于缺失甲基化数据的样本,使用随机森林模型来估算缺失的甲基化类别。 该 Affymetrix 数据队列代表 2,923 个样本,这些样本被标注为 45 个定义的分子类别(例如髓母细胞瘤 G3)和 68 个甲基化亚类(例如髓母细胞瘤 G34_II)。 用独立的bulk RNA-seq 数据集补充了这个 Affymetrix 队列,其中最大的来自儿童脑肿瘤网络(CBTN,n = 626)。
在考虑现有的计算方法后,我们选择了两个主要措施来确定肿瘤类别与正常细胞类型的相似性:共享高变基因表达模式的相关性和基因集方差分析 (GSVA)。 使用 SHH 髓母细胞瘤作为阳性对照对这些措施进行了验证,因为实验表明该肿瘤类别是由颗粒细胞祖细胞 (GCP) 产生的。 训练髓母细胞瘤 RNA-seq 数据集(ICGC 队列,n = 160)与小脑细胞类型的直接比较也证实了这些结果。 此外,发现在使用组合相关和 GSVA 方法时,每个参考cluster至少需要 400 个细胞才能获得稳定的分数,并且估计了这些计算值的过滤阈值。
We next compared the large Affymetrix transcriptome tumor cohort to cerebellar cells. We included non-cerebellar tumor classes, such as meningioma (MNG), or glioma profiles enriched with immune cells (GLIOMA_NORM_HI) as external controls for this global comparison, which demonstrated matches to the expected cell states.
从这个比较中,进一步证实了 SHH MB 与 GCP 和分化颗粒细胞 (GC_diff1) 的最密切关联。 Group 4 MB最匹配的分化单极刷细胞 (UBC_diff),证实了之前使用小鼠图谱进行比较的研究。 Group 3 组成神经管细胞瘤的关联不明确,在谷氨酸能谱系中显示出几个匹配项,包括 GC/UBC 谱系的祖细胞和分化细胞等,但它们都没有通过分析的过滤阈值。 可以预见的是,WNT-髓母细胞瘤与发育中小脑的任何细胞状态都不匹配,因为它被认为来自发育中的脑干。
两类后颅窝 A (PFA) 室管膜瘤 PFA1 和 PFA2 与星形胶质细胞谱系中的细胞最相似,包括祖细胞、胶质母细胞和星形胶质细胞。 注意到人类小脑数据集中缺少包括室管膜在内的一些神经胶质细胞类型。 其他后颅窝室管膜瘤肿瘤类别,在儿童中更为罕见,包括后颅窝 B (PFB) 和后颅窝室管膜下瘤 (PF_SE),显示出与星形胶质细胞谱系相似的关联。
幕下毛细胞星形细胞瘤 (PA_INF) 是一种主要发生在小脑的肿瘤类别,显示与少突胶质细胞状态 - 少突胶质祖细胞 (OPC) 和少突胶质细胞的关系最密切,从而验证了先前关于其细胞起源的假设。 几种仅偶尔位于小脑的胶质母细胞瘤 (GBM) 分子类别显示出与不同神经胶质细胞状态的相似性,例如星形胶质细胞、少突胶质细胞及其各自的前体。
在甲基化亚类水平上对肿瘤的进一步比较概括了在分子类水平上检测到的关联; 例如,MB SHH 亚组与 GCP 明显相关。 使用 CBTN 队列作为验证数据集获得的结果与我们使用 Affymetrix 数据发现的结果完全兼容,从而使用不同的表达数据集和平台验证了我们的方法。
After obtaining these global results, we next sought to investigate the cellular origins of pediatric tumors in greater detail and at single-cell resolution focusing on the three most common entities arising in the cerebellum.
Posterior fossa ependymomas likely arise from the astroglial lineage
PFA 和 PFB 是位于小脑/后窝的两种主要类型的室管膜瘤,以前被认为起源于径向胶质细胞。 这一结果在基于小鼠小脑的参考图中得到了部分证实,该图发现了与“屋顶板样干细胞”和“神经胶质祖细胞”的关联,但之前并未针对人类参考进行验证。 使用人类小脑单细胞数据集,发现后颅窝室管膜瘤的转录谱最类似于小脑星形胶质细胞谱系内的各种分化状态,从径向神经胶质和神经上皮祖细胞开始,到胶质母细胞,然后是星形胶质细胞,其中 Turn 显示出与已发表的鼠小脑图谱中定义的“屋顶板样干细胞”和“神经胶质祖细胞”的相似性,从而有可能解决明显的矛盾。
为了提高细胞类型关联的分辨率,接下来关注星形胶质细胞谱系中的细胞亚型。 小脑中有两条空间分离的胶质生成路径,分别从胶质祖细胞(产生 Bergmann 胶质细胞和实质星形胶质细胞)和双能祖细胞(产生 GABA 能中间神经元和实质星形胶质细胞)开始,并通过相应的胶质母细胞亚型向成熟星形胶质细胞发展。 我们发现与双能祖细胞、预期白质胶质母细胞 (glioblast_PWM)、星形母细胞和成熟实质星形胶质细胞亚型特征相匹配的转录组在 PFA 和 PFB 室管膜瘤样本中均富集。
基于这些观察,假设肿瘤从星形胶质细胞谱系中最早的节点发展并在恶性转化后沿着特定的轨迹分化,或者后颅窝室管膜瘤细胞的转录组由祖细胞和成熟细胞特征的混合组成. 为了进一步研究这些可能性,调查了来自三项独立研究的已发表的后颅窝室管膜瘤单细胞数据。 使用调整后的 SingleR-SVM 方法将每个肿瘤细胞分配到其最匹配的细胞状态标识。 分配后,在使用 10x chemistry分析的 PF 室管膜瘤样本中发现了非恶性免疫细胞cluster。 正如预期的那样,与肿瘤细胞cluster相比,这些细胞cluster也具有正常的 DNA 拷贝数分布; 因此,将它们排除在进一步分析之外以防止模糊肿瘤特征。(正常细胞也会有拷贝数的变化)。
类似地,还过滤掉了与星形胶质细胞谱系(例如脑膜、GCP、寡祖细胞等)不一致的具有指定身份的细胞,因为这些肿瘤细胞不形成独立的细胞cluster,因此可能很少见来自肿瘤微环境的非免疫正常细胞。过滤后,发现每个肿瘤样本都有类似于祖细胞、胶质母细胞和成熟星形胶质细胞样细胞的细胞,但在同一类肿瘤中的比例分布不同。该结果表明,肿瘤由起源谱系内沿分化轨迹的细胞组成。通过将肿瘤细胞覆盖在星形胶质细胞谱系上来测试这一假设,发现肿瘤细胞沿着整个谱系分布,这表明 PF 肿瘤内的分化梯度可能来自双能祖细胞和胶质祖细胞。令人惊讶的是,祖细胞样和星形胶质细胞样肿瘤细胞的转录组学特征没有显示出在正常谱系阶段所见的相互排斥的标记基因表达;然而,标记基因(例如祖细胞:TENM3、星形胶质细胞:AQP4)的富集支持这些肿瘤细胞的指定身份。因此,预测即使是“成熟的”肿瘤细胞也能保持增殖能力。还在独立的 Smart-seq2 数据集中观察到类似的分化梯度。总而言之,在我们的数据集中没有室管膜细胞的情况下,我们的研究结果表明 PF 肿瘤由沿星形胶质细胞谱系成熟梯度的细胞组成。
接下来确定了小脑星形胶质细胞谱系和 PFA 之间的共享基因。在共享基因中,关注那些在大脑和/或小脑中特异性表达的基因,并且根据其人类蛋白质图谱注释确认为质膜定位或可能的药物靶标。作为最佳候选者之一,确定了在室管膜瘤中表达的潜在可药物 MLC1 基因,该基因也在星形胶质细胞谱系中特异性表达,但不在小脑或大脑外部的任何其他细胞谱系中表达。同样,识别并过滤了肿瘤特异性候选基因,包括基因 BEST4,该基因编码一种膜蛋白,在任何小脑细胞谱系中均未检测到;它在其他正常组织中也不存在或低表达。可以探索这两个潜在的治疗靶点,用于 CAR-T 疗法来特异性攻击肿瘤细胞。通过对受影响通路的进一步研究,观察到肿瘤和星形胶质细胞谱系之间常见基因的神经发生特异性,而与癌症相关的通路(例如,因甲基化或软组织肿瘤活性而沉默的 GBM)在肿瘤特异性基因集中富集。
Pilocytic astrocytomas correspond to postnatal OPC
Our global comparisons confirmed previous observations that two pilocytic astrocytoma molecular classes, PA_INF (infratentorial or posterior fossa, predominantly cerebellum) and PA_MID (supratentorial midline), most closely resembled oligodendrocyte progenitor cells (OPCs)
检查了一个额外的大量 RNA-seq 队列,涵盖另一类儿科低级别神经胶质瘤,即 supratentorial gangliogliom(GG_ST),它也最类似于 OPC。从全局比较中观察到,弥漫性中线胶质瘤、H3 K27 改变(DMG_K27)与星形胶质细胞和少突胶质细胞有关;因此,将 DMG_K27 肿瘤包括在内作为进一步研究 PA 起源的外部比较。然后检查了沿少突胶质细胞谱系的亚型,发现与出生后小脑中存在的晚期少突胶质祖细胞 (OPC_late) 的最佳匹配。相似性水平表明与大脑中肿瘤的解剖位置相关,即后颅窝 PA 显示与小脑 OPCs 最接近的匹配,中线 PA 的匹配不太明显。使用来自独立队列(如上所述排除非肿瘤细胞)的单细胞基因表达数据,证实了毛细胞星形细胞瘤和 OPCs 之间转录组的相似性。然后将单细胞肿瘤数据叠加到少突胶质细胞谱系上,发现大多数肿瘤细胞与 OPC_late cluster整合,一些细胞与早期 OPCs 和成熟少突胶质细胞重叠。
接下来评估了毛细胞星形细胞瘤和 OPCs 之间的共享基因,并确定了一些值得注意的候选基因,例如编码细胞表面蛋白的 GPR17。 对肿瘤独特基因的检查还揭示了一些有趣的候选者,包括潜在的可药物 TRPM8 作为治疗干预的可能候选者。
使用基因集富集分析,发现 OPC 和毛细胞星形细胞瘤共享参与少突胶质细胞发育的基因,而有趣的是,肿瘤特异性基因在主要组织相容性复合体 II (MHC II) 和免疫系统相关基因中特别富集。由于这种免疫特征可能来自肿瘤微环境中的免疫细胞,因此检查了毛细胞星形细胞瘤的单细胞数据。在排除了非恶性细胞后,仍然发现肿瘤细胞中有 MHC II 类基因(例如 CD74、HLA-DRB5)的表达,与之前在毛细胞星形细胞瘤中对一些 MHC I 类成员的观察结果相似;因此这些基因确实在肿瘤细胞中过度表达。值得注意的是,MAPK 信号传导的已知下游靶标(在毛细胞星形细胞瘤中组成性激活的通路),包括 CCND1(细胞周期蛋白 D)、KRAS 或 MAPK1,在大多数正常和肿瘤细胞cluster以及少突胶质细胞谱系中表达。这种模式在肿瘤发生方面的免疫学作用以及可能对 PA 中通常观察到的衰老表型的贡献仍有待研究。
Medulloblastomas originate from the GC/UBC lineage
From our global comparison, SHH, Group 3, and Group 4 MBs closely associated with one or both branches of the GC/UBC lineage; therefore, we next focused on a high-resolution lineage map to delineate the potential origins of different medulloblastoma subclasses (further referred also as subgroups based on WHO terminology6).发现大多数 SHH 髓母细胞瘤亚组与 GCP 和新生的有丝分裂后 GC (GC_diff1) 密切对应。 SHH-髓母细胞瘤亚组 I、II、IV 显示出与出生后阶段出现的分化 GC 的晚期亚群 (GC_diff1_late) 高度相似。 SHH-II (beta) 亚群与婴儿的发病和转移相关,而是类似于更多分化的 GC 细胞状态,包括已到达内部颗粒细胞层的明确 GC (GC_defined)。
Group 3 和Group 4 髓母细胞瘤亚组范围从 I-VIII,亚组 II/III 限于第 3 组,亚组 VI/VIII 限于Group 4。 亚组 V-VIII(主要是Group 4 髓母细胞瘤)与 UBC 最匹配(区分和定义) . 亚组 I-IV(主要是Group 3 髓母细胞瘤)与 GC/UBC 谱系中的亚型显示出低转录组相关性; 尽管如此,GSVA 富集分数表明与 GC/UBC 祖细胞和早期分化 UBC 有一些相似性。 在Group 3/4 亚组 II 中观察到与正常细胞类型的最低相关性/GSVA 相似性,已知其与 MYC 扩增相关。 这种体细胞 MYC 变化可能会驱使肿瘤进一步偏离原始谱系。
使用髓母细胞瘤单细胞数据,概括了这些发现。 Group 4 肿瘤细胞与分化的 GC 和 UBC 对齐,表明这些肿瘤沿着分叉的 GC/UBC 轨迹分化,其中 UBC 样细胞占优势。 同样,发现Group 3 肿瘤细胞沿着相似的轨迹分化,但主要是增殖和分化 GC 样细胞。 值得注意的是,Group 3和Group 4 髓母细胞瘤样本都具有很高比例的未分配细胞(分类概率低于 50%,被归类为“未分配”),但根据最佳匹配身份与 GC/UBC 样细胞最相似 . 与这些观察结果一致,最近的动物研究提出了 Atoh1 阳性谱系如 GC 和 UBC 向 MYC 驱动的第 3 组和 SRC 驱动的第 4 组肿瘤的转化能力。
Some Group 3/4 tumor cells best matched to differentiating Purkinje cells or nuclear transitory zone neuroblasts, suggesting the presence of cells outside of the GC/UBC lineages. However, these tumor cells did not cluster separately from other GC/UBC-like cells and expressed GC/UBC lineage specific genes, suggesting the expression of multi-lineage markers leading to this ambiguous identity. Alternatively, somatic alterations in proliferative genes driving tumor development, such as MYC/MYCN amplifications (like in Group 3 subgroup II as described above), could possibly explain this phenomenon, and may prevent the tumor cells from resembling a defined lineage. A similar phenomenon has been shown in mice. In addition, when separately examining MYC (Group3) and MYCN (SHH and Group 4) amplified tumors, they did not show the expected similarity to the GC/UBC signature, confirming the impact of these somatic changes 。
为了确定临床相关的候选者,专注于髓母细胞瘤类别和 GC/UBC 谱系之间共享的基因。 共享基因的一个例子,EOMES,一种特定于Group 4 髓母细胞瘤的转录因子,已知在大脑发育中起着重要作用,并且与胎儿的结构缺陷有很强的关联。 在可能的肿瘤独特候选者中,确定了表面蛋白编码基因 IMPG2,它对Group 3 肿瘤具有特异性,在正常组织中低表达。
接下来确定了在这些基因组中检测到的基因GO通路,以进一步检查它们的分子关联。 尽管在所有成神经管细胞瘤类别中都发现了与 CNS 发展的关联,但Group 3 肿瘤特异性基因在正常干细胞中高度富集了 H3K27me3 抑制基因。 发现其中一些基因(例如 GABRA5)仅存在于肿瘤中。 已观察到 H3K27me3 的变化在第 3 组成神经管细胞瘤的形成中起作用; 值得注意的是,**还发现 H3K27me3 在这些基因中丢失,特别是在Group 3 **
Radiation-induced gliomas are independent secondary tumors based on lineage of origin
放射诱导的神经胶质瘤 (RIG) 可能是颅脑放疗的结果,通常用于治疗中枢神经系统肿瘤,包括成神经管细胞瘤。Based on their glioblastoma-specific genetic landscape, the lack of overlapping mutations with the initial medulloblastoma, and on functional studies in non-human primates, it is assumed that these tumors arise de novo from healthy cells after radiation rather than by trans-differentiation of residual medulloblastoma cells。然而,这从未被正式证明过。为了进一步研究这一假设,我们将重点放在辐射诱导的神经胶质瘤(n = 11)和各自的原发性髓母细胞瘤样本(n = 11)上,以与小脑细胞类型进行比较。正如预期的那样,拷贝数变异分析显示了原发性和继发性肿瘤不同的、非重叠的特征,RIG 中插入和缺失事件的数量增加。基因表达谱的无监督层次聚类进一步区分了原发性髓母细胞瘤和继发性 RIG。对于福尔马林固定石蜡包埋 (FFPE) 原发性复发匹配样本的一个子集,我们将转录组谱与额外的 FFPE 批量 RNA-seq 数据集(n = 410)进行比较,代表散发性成神经管细胞瘤和胶质母细胞瘤样本。肿瘤对与对照数据的 UMAP 可视化导致原发性和继发性肿瘤分别具有成神经管细胞瘤和 GBM clusters。
接下来将每个成神经管细胞瘤-RIG 对与小脑细胞状态进行比较,仅使用相关性分析(GSVA 富集需要来自 >2 个样本的差异表达基因),包括来自散发性成神经管细胞瘤和胶质母细胞瘤数据集的合并特征。 RIG 肿瘤以及胶质母细胞瘤对照与构成神经胶质谱系的成胶质细胞/星形胶质细胞/少突胶质细胞相关,而髓母细胞瘤原发性肿瘤和对照与 GC/UBC 谱系中的细胞最相似。 我们还将所有 RIG 样本合并为一个组,并计算相关性和 GSVA 分数; 这些样本对应于少突胶质祖细胞和成胶质细胞。 根据这些数据,我们得出结论,原发性髓母细胞瘤和继发性 RIG 肿瘤的起源谱系不同,并且继发性 RIG 完全来自神经胶质谱系 。
Method
Cell type assignment to tumor cells
生活很好,有你更好