单细胞分辨率下肾细胞癌和微环境的多区域表征[10X单细胞联合10XVDJ分析、Mutation Calling]

hello,大家好,我们的分析也慢慢进入深水区了,很多方法需要联合起来使用,如何灵活运用各种方法,就需要我们的经验和智慧了。今天分享的文献在Multi-regional characterisation of renal cell carcinoma and microenvironment at single cell resolution,几乎用到了我们常见的所有的单细胞的分析思路和方法,当然了,生物学意义也进行了很好的诠释,尤其是利用单细胞数据calling Mutation,大家多多学习和积累。

放一张我觉的最关键的图

1.png

Abstract

肿瘤行为取决于癌细胞的致癌特性及其多细胞相互作用。 通过从 12 名肾肿瘤患者获得的 270,000 个单细胞转录组和 100 个微解剖的完整外显子组检查这些依赖性(现在的单细胞数据都是以大数据量著称)。 从肿瘤核心、肿瘤-正常界面、正常周围组织和外周血的多个区域取样组织(这个时候空间转录组更具有说服力)。 发现 CD8+ T 细胞克隆型的主要空间位置在很大程度上定义了衰竭状态,而体细胞瘤内异质性无法解释克隆型异质性。 从单细胞 RNA 测序数据中calling从头突变使我们能够谱系追踪和推断细胞的克隆性。 发现了六个区分肿瘤细胞功能的meta程序。 在肿瘤-正常界面富集的上皮-间质转化meta程序似乎通过巨噬细胞表达的 IL1B 进行调节,可能形成治疗靶点。

Introduction

Clear cell renal cell carcinoma (ccRCC) 是肾细胞癌 (RCC) 最常见的亚型,约占 RCC 病例的 75% 和the majority of deaths from kidney cancer。许多努力已经表征了 ccRCC 的基因组landscape,揭示了重要的驱动事件,例如 VHL 的双等位基因失活(最常见的是伴随着染色体 3p 的丢失和 VHL 中的突变/表观遗传沉默),随后是染色质重塑和组蛋白修饰相关的突变基因 PBRM1、BAP1 和 SETD2。已经系统地研究了 ccRCC 演变过程中启动事件的时间。正如之前的多区域外显子组测序研究所揭示的那样,随后突变事件的肿瘤内异质性 (ITH) 似乎是 ccRCC 的一个显着特征。相比之下,ccRCC 在转录水平上的 ITH 不太清楚,部分原因是包含肿瘤微环境 (TME) 的多细胞生态系统的复杂性。特别是,ccRCC TME 中恶性和非恶性细胞的表型异质性及其与空间定位的关系仍然不清楚。
ccRCC 是一种免疫细胞大量浸润的癌症类型。免疫检查点阻断 (ICB) 治疗已被证明可有效提高患者的生存率,突出了探索 ccRCC 免疫微环境的重要性。以前的研究使用批量测序分析了 ccRCC 的免疫状况,这限制了它们剖析不同免疫细胞群的能力。使用质谱流式细胞术的 ccRCC 综合免疫图谱揭示了 ccRCC 肿瘤生态系统中的免疫细胞多样性。单细胞 RNA 测序 (scRNA-seq) 的最新进展及其在癌症研究中的应用彻底改变了我们对肿瘤细胞表型异质性、肿瘤免疫landscape、TME 的复杂性和可塑性以及 TME 中细胞间通讯的理解。具体而言,在 ccRCC 中,最近的一项 scRNA-seq 研究提供了支持其起源于近端肾小管细胞的证据。其他研究利用 scRNA-seq 研究 ccRCC 的免疫状况,主要关注 ICB 治疗相关队列和不同疾病阶段,揭示与治疗效果或疾病进展相关的关键特征。
在考虑 TME 的异质性时,感兴趣的空间区域扩展了与突变 ITH 相关的区域。更广泛的目标区域包括循环血液、肿瘤-正常界面或肿瘤假包膜(代表肿瘤与相邻正常肾脏之间的边界)、相邻正常肾脏和肾周脂肪组织。假包膜的纤维结缔组织似乎在空间上限制了生长,侵袭与肿瘤分期和分级相关。由于 RCC 中的obesity paradox,肾周肥胖引起了人们的兴趣,其中肥胖是诊断肾癌的最强风险因素之一,但也与肿瘤学结果的改善有关。了解 ccRCC 在肿瘤细胞、各种免疫/基质细胞方面的空间异质性和进化,以及它们在更广泛的 TME 中的相互作用仍然缺乏。为了解决这个问题,对 12 名患者进行了基于多区域的 scRNA-seq,对外周血、正常肾脏、肿瘤核心的四个不同空间区域和肿瘤-正常界面进行了采样,同时对激光捕获显微切割进行了局部详尽的外显子组测序(LCM) 衍生的肿瘤样本。

Results

Multi-region based genomic and single-cell transcriptomic profiling of RCC

对 12 名接受放射学诊断肾肿瘤手术切除的患者进行了多区域基因组和单细胞转录组分析。 在组织病理学检查后,12 名患者中有 10 名的肿瘤被评估为 ccRCC,1 名(PD47172)为嗜酸细胞瘤,1 名(PD44714)为大的良性厚壁囊肿。 在每位患者中,从外周血、正常肾脏、肿瘤核心的四个不同空间区域以及肿瘤-正常界面采集组织。 此外,如果有的话,还从肾周脂肪、正常肾上腺、肾上腺转移和肿瘤血栓中取样。
2.png
在可以从这些样本中提取足够数量的活单细胞的情况下,使用 10x 平台进行了基于液滴的 5' scRNA-seq 和 T 细胞受体 (TCR) 富集。 同时,在执行全外显子组测序 (WES) 之前,使用 LCM 从每个含有肿瘤组织的区域解剖每个患者的微活检样本。 LCM 方法使我们能够通过询问亚毫米大小的活检来探索 ITH 的极限。 基于 WES 数据,确定了在 ccRCC 中报告为复发/驱动事件的基因组改变。 9 名 ccRCC 患者中有 7 名(一名 ccRCC 患者没有数据)具有 VHL 突变,4 名具有 PBRM1 突变,3 名携带 BAP1 突变。 在所有 9 名患者中都检测到染色体 3p 的拷贝数丢失。 嗜酸细胞瘤携带整个 1 号染色体的特征性拷贝数丢失。
使用 scRNA-seq,在严格的质量控制后从大约 270,000 个细胞中捕获转录组,根据典型标记基因的表达可以将其大致分为 12 种主要细胞类型
3.png
由于合适的单细胞分离方案,T 细胞(表达 CD3D、CD3G 和 CD3E)在数据中最为丰富,其次是骨髓细胞(表达 CD68 和 CD14)和自然杀伤 (NK) 细胞(表达 NCR1 和 KLRC1 )。还捕获了大量其他免疫细胞群:B 细胞(表达 CD79A 和 MS4A1)、浆细胞(表达 IGKC 和 IGHG1)、肥大细胞(表达 TPSAB1 和 TPSB2)和浆细胞样树突细胞(pDC;表达 IRF7 和 LILRA4) .除了免疫区室,数据中还鉴定了四种基质细胞类型:内皮细胞 (EC)(表达 PLVAP 和 TIMP3)、成纤维细胞(表达 ACTA2 和 TAGLN)、近端肾小管 (PT) 细胞(表达 SLC22A8 和 GPX3)和非 PT 上皮细胞(表达 DEFB1 和 UMOD)。从 scRNAseq 数据推断,RCC 肿瘤细胞在特异性表达 CA9 并在其基因组中具有广泛拷贝数变异 (CNV) 的cluster内被鉴定出来。接下来,我们研究了 12 种主要细胞类型的起源组织,并观察了这些细胞类型的不同组织分布(分析中合并了四个区域)
%1S6}NI9`AYD_JVVL}%I0D8.png

image.png
  • 注:(A) Heatmap illustrating the clinical features (left panel) and the genomic landscape (middle panel) and copy number profiles (right panel) of the tumours sequenced. (B) UMAP, (C) cell type, and (D) sampled region depicting the interpatient variability of scRNA-seq results. (E) UMAP showing marker gene expression for all cells. (F) Copy number inference based on scRNA-seq data.
进一步研究中涵盖的主要细胞区室进行了亚群聚类分析。 NK 细胞的亚群产生了 14 个具有差异表达基因 (DEG) 和异质组织来源的cluster。在这些cluster中,确定了众所周知的 CD56 (NCAM1) 和 CD16 (FCGR3A) 表达群体。先天淋巴细胞 (ILC) cluster的特征在于 IL7R 和 FXYD7 的表达。两个 NK cluster(cluster 2 和 6)显示干扰素γ(IFNG)的高表达,cluster 6 也高表达细胞因子 CCL4L2,并可能在正常肾上腺中富集。确定了一些特征较少的 NK cluster,例如cluster 4,它特异性表达 KRT81 和 KRT86。这种 NK 细胞亚群之前曾在肝细胞癌中报道过,但其功能尚不清楚。 B/浆细胞区室被分为 13 个cluster,其中确定了众所周知的主要 B 细胞群,如幼稚、转换记忆和非转换记忆 B 细胞。活化的 B 细胞(AREGhigh 和 RHOBhigh cluster)可能在肿瘤中富集,而 AREGhigh cluster在肾周脂肪中更富集。与主要细胞类型的外周血组织分布相比,发现血浆 IgA、IgG 和循环细胞(分别表达 IGHA1、IGHG1 和 MKI67)在组织中富集。
image.png
  • 注:(A&E) UMAPs, (B&F) dotplots of marker genes, (C&G) tissue distribution, and (D&H) regional enrichment of NK and B cells.

CD8+ T cell lineages reveal evolutionary trajectories and the influence of spatial location on exhaustion

T 细胞包含数据中最丰富的细胞类型,大致分为两个主要部分:CD4+ 和 CD8+ T 细胞(包括 gamma delta T 细胞)。 CD8+ T 细胞区室的亚聚类导致鉴定出 18 个具有不同 DEG 和异质组织位置的cluster。
image.png
总的来说,根据典型标记基因的表达确定了典型的 CD8+ T 细胞cluster,它们代表了不同的 T 细胞功能状态,包括幼稚、效应、记忆、前功能障碍和功能障碍。发现高表达 LEF1 和 CCR7 等基因的幼稚/中枢记忆 (CM) CD8+ T 细胞主要在外周血中富集。鉴定了常驻记忆 (RM) T 细胞,因为它们表达组织驻留标志物(即 ITGAE 和 CD69),并且主要在正常肾脏中富集。特别是,cluster 10 还高表达 CXCL13,它可能在 B 细胞募集和三级淋巴结构的形成中发挥潜在作用。我们发现cluster 6 高度表达 FGFBP2 和 CX3CR1,并且在外周血中大量富集,因此该cluster可能代表最近激活的效应记忆 T 细胞(CD8+ T_EMRA)。基于包括 LAG3、TIGIT、PDCD1、HAVCR2 和 CTLA4 在内的基因表达升高,鉴定了两个耗尽的 T 细胞cluster(cluster 7 和 8)。有趣的是,我们发现cluster 8 具有最高的 LAG3 表达,并特异性表达免疫抑制细胞因子 IL10。该cluster可能代表具有极高效应子和功能障碍水平的 CD8+ T 细胞,它们通过产生 IL-10 发挥调节功能。发现粘膜相关不变性 T (MAIT) 细胞高表达 TRAV1-2 和 IL7R。鉴定出两个循环细胞cluster:一个(表达MCM5和PCNA)代表细胞周期G1/S期的细胞,另一个(表达TOP2A和MKI67)代表G2/M期的细胞。除了传统的 CD8+ T 细胞cluster,我们还鉴定了两个 gamma delta T 细胞cluster:gdT_Vd1(表达 TRDV1)和 gdT_Vd2(表达 TRDV2)。我们还对 CD4+ T 细胞群进行了亚群聚类分析,揭示了各种亚型,例如 CD4+ naïve/CM 和 CD4+ 调节性 T 细胞 (Tregs) 及其不同的组织分布.
image.png
  • 注:(A) UMAP of the subclustering result, (B) UMAP and (C) barplot showing tissue distribution, and (D) regional enrichment of CD8+ T cell population. (E) UMAP showing the RNA velocity result and (F) exhaustion score across the pseudotime trajectory of CD8+ T cells. (G) UMAP of the sub-clustering result, (H) dotplot showing marker gene expression, and (I) UMAP of tissue distribution of CD4+ T cells. (J) Barplot showing the comparison of TCR clonal expansion between CD8+ and CD4+ T cells, breaking down into three different locations: blood, tumour and other regions
接下来,我们使用 Monocle 3 和 RNA 速度分析对 CD8+ T 细胞进行了伪时间轨迹分析,不包括 gamma delta T 和循环cluster。沿着假时间轨迹,我们发现细胞毒性相关基因(即 KLRG1、GNLY 和 GZMH)是逐渐下调而功能障碍相关基因(即 CTLA4、HAVCR2 和 LAG3)逐渐上调。典型的 T 细胞功能障碍前相关基因(即 CXCR4、GZMK 和 GZMA) 最初被上调,然后沿着伪时间轨迹下降。因此,这个伪时间轨迹概括了 CD8+ T 细胞从细胞毒性状态经过功能障碍前状态到功能障碍状态的进展,同时耗竭程度逐渐升高。假时间和耗竭评分之间的正相关也支持这种进展。此外,将前 10 个扩展的 TCR 克隆型投影到轨迹上导致观察到单个 TCR 谱系通常仅限于类似的表型状态,而不是分布在整个轨迹上。在所有肿瘤中,发现 90% 的具有 23 个或更多细胞的克隆型被限制在假时间值范围内(Wilcoxon 检验,p < 0.05)。在多位患者中观察到每个克隆超过 100 个细胞的高度扩增的 TCR 克隆,其中显着高达 30% 的 CD8+ T 细胞可以来自单个克隆型。相比之下,与 CD8+ 群体中的 TCR 克隆型相比,CD4+ 群体中的 TCR 克隆型扩展较少。许多扩增最多的 CD8+ TCR 克隆具有相当比例的循环细胞,但在较少消耗的克隆型中观察到的情况除外。这一发现表明 RCC 中高度耗竭的 T 细胞的增殖并未完全停止,类似于先前在黑色素瘤中的发现。
检查了血液中检测到的 TCR 克隆型是否反映了在其他区域检测到的那些。研究发现,无论克隆大小如何,平均耗竭程度(推断的假时间)和在外周血中检测到 CD8+ TCR 克隆的概率都具有很强的反相关性,以至于在血液中很少检测到耗竭的克隆型。这一发现出乎意料,表明组织驻留的耗竭 CD8+ T 细胞克隆似乎不会在外周血中再循环。为了进一步说明 T 细胞耗竭、克隆扩增及其组织分布之间的关系,我们根据 CD8+ T 细胞是单细胞还是扩增以及它们的主要组织位置(血液、正常组织或肿瘤)对它们进行分类。肿瘤中扩增的 T 细胞进一步细分为出现在所有肿瘤区域的那些和不出现的(肿瘤同质和异质)。值得注意的是,CD8+ T 细胞的表型状态,就耗竭程度而言,表现出对克隆扩增和组织位置的强烈依赖。同时,clones that were private to one tumour region were not significantly more exhausted than those shared between different regions 。
image.png
  • 注:(A) Dotplot showing marker gene expression defines principal CD8+ cell types. EM, effector memory; Act, activated; EFF, effector; EX, exhausted. (B) UMAP depicting the pseudotime inference of CD8+ cells。 (C) Expression of canonical exhaustion markers across cells ordered by pseudotime analysis. All marker genes are statistically significant across pseudotime values (q value = 0). (D) UMAP showing the 10 most expanded clones from patient PD43948. Grey dots represent cells outside the 10 most expanded clones. (E) Boxplot depicting the most expanded clonotypes (>100 cells) across all patients, ordered by their mean pseudotime values, showing the median, interquartile range and outlier pseudotime values (top panel); barplots showing the maximum expansion for the most expanded region (middle panel) and percentage of cycling cells (lower panel). (F) The probability of detecting a given TCR clone in peripheral blood as a function of minimal clone size and mean pseudotime value of the clone. (G) Mean pseudotime values based on the categorisation of clonotypes according to their principal region of enrichment.

Spatial localisation rather than intra-tumoural heterogeneity primarily influences CD8+ clonotypic heterogeneity

使用从 WES 数据中calling的体细胞突变,构建了系统发育树来阐明我们研究中肿瘤中的克隆进化和 ITH。 总体而言,我们发现所有肿瘤克隆共享一个长主干但有短分支
image.png
  • 注:Reconstructed phylogenies from WES of multi-regional LCM biopsies. Each node represents a mutant clone present in one or more of the biopsies.
这表明大多数体细胞突变在个体肿瘤中普遍存在,只有少数个体突变被检测到。大多数检测到的驱动突变和关键 CNV(即 VHL 突变和染色体 3p 杂合性丢失 (LOH))由个体肿瘤内的所有肿瘤克隆共享,因此位于系统发育树的树干上。此外,根据变异等位基因频率分布,我们测序的绝大多数 LCM 样本都出现了克隆性。综上所述,WES 显示我们队列中肿瘤的 ITH 范围是有限的。先前的研究通过比较在来自肿瘤不同空间定位的样本中检测到的体细胞突变,广泛研究了各种癌症的肿瘤内遗传异质性。然而,体细胞异质性对不同空间定位的局部肿瘤微环境的影响,尤其是抗肿瘤免疫反应,在很大程度上仍未得到表征。在这里,我们系统地比较了个体肿瘤中 CD8+ T 细胞的体细胞突变、空间定位和 TCR 克隆型之间的关系。
image.png
  • 注:Comparison of WES derived phylogenies (left) with geographic location (centre) and CD8+ TCR clonotype expansion (right). Colours reference somatic clones to spatial localisation. Each column in the right panel represents a TCR clonotype, those with significant regional enrichment are highlighted in red. a, c, d, and e represents four different regions of the tumour core; g, tumour-normal interface; n, normal kidney; b, peripheral blood; h, normal adrenal gland.
出乎意料的是,发现 T 细胞克隆型在不同的空间定位中具有高度异质性和差异性,即使在仅观察到体细胞突变异质性可忽略不计的肿瘤区域也是如此。 在肿瘤细胞上产生新抗原的体细胞突变被认为是抗原呈递时 T 细胞克隆扩增的驱动因素。 我们的发现表明 TCR 克隆扩增的异质性更多地与 T 细胞在组织中的不同空间定位相关,而不是与体细胞突变的 ITH 相关。 为了正式检验这一点,我们计算了 T 细胞克隆型距离与 1) 突变距离之间的相关性; 2)空间定位距离
image.png
  • 注:Scatter plot of the Mantel correlation between tree distances. x-axis represents the correlation coefficient between WES derived clones and TCR clonotype distances. y-axis represents the correlation coefficient between spatial localisation and TCR clonotype distances.、
通过比较这两种相关性,我们发现 CD8+ T 细胞中的 TCR 异质性与空间定位而非体细胞异质性的相关性更强(配对 Wilcoxon 检验,p < 0.05)。

Precise de novo somatic mutation calling from scRNA-seq data

从转录组序列检测单个细胞内的体细胞突变可能有助于推断它们的克隆关系。 尽管理论上可以从 scRNAseq 数据中calling突变,但目前没有高精度的方法可用。 在这里,我们开发了一种算法/pipeline来从 scRNA-seq 数据执行从头体细胞突变calling。 简而言之,我们在初始过滤步骤之前使用 bcftools 从单细胞 BAM 文件中calling突变,以去除单个细胞中存在的突变和不同细胞谱系之间共享的突变。 在应用二项式过滤器之前,我们检查了初始步骤中calling的所有位点的参考和变异等位基因计数。 然后,我们在对变体进行注释后应用了一组最终的过滤指标
image.png
  • 注:Schematic of the de novo mutation calling algorithm.
为了对我们的突变calling方法进行基准测试,我们首先比较了从肿瘤细胞的 scRNA-seq 数据calling的体细胞突变与从肿瘤 WES 数据calling的那些突变。所有检测到的突变都被归类为真阳性(由突变calling检测到,或未被突变calling者calling但在原始数据中有足够的支持证据)、假阳性、假阴性或不确定(其中突变在没有足够的 WES 覆盖来验证呼叫)。总体而言,我们的方法取得了良好的性能,精度为 0.64(仅考虑外显子突变时为 0.70),灵敏度为 0.53。我们还能够在 CD8+ T 细胞中对该方法进行基准测试,结果表明 84% 的被calling突变仅限于单个 TCR 克隆。这证实了预期的发现,即在 CD8+ T 细胞中calling的大多数突变仅限于克隆型,因为在胸腺成熟前 T 细胞克隆之间可以共享的突变数量非常有限。
image.png
  • 注:Benchmarking results for scRNA-seq derived calls against WES data for each patient donor
使用这些突变calling,我们研究了不同细胞类型表达的突变数量,这可能有助于揭示它们的克隆扩增程度。我们计算了具有一个、两个、三个或三个以上突变的细胞的比例。我们需要来自每个细胞谱系和患者的至少 100 个细胞来解释稀有细胞群中缺乏辨别力的问题。正如预期的那样,表达所谓突变的细胞数量最多的谱系是肿瘤细胞,这主要由谱系的已知克隆结构来解释,但也由于与正常细胞类型相比突变负担增加的可能性。出于类似的原因,基质细胞通常不会有可辨别数量的细胞具有不止一种被称为突变的细胞。然而,我们观察到大量表达突变的骨髓细胞,表明这些细胞中有相当大的比例是无性系相关的。随后是成纤维细胞和 CD8+ T 细胞(我们知道这些细胞是根据 TCR 测序结果进行克隆扩增的)。极少比例的 CD4+ T 细胞表达突变,与基于 TCR 分析的低克隆度一致。
image.png
  • 注:Somatic mutation analysis and the relationship with TCR heterogeneity. (A) Density plots showing the VAF distribution of mutations called from WES data from LCM biopsies of tumour samples. (B) Comparison of WES derived phylogenies (left) with geographic location (centre) and CD8+ TCR clonotype expansion (right) for each patient with matching data. Colours reference somatic clones to spatial localisation. Each column in the right panel represents a TCR clonotype, those with significant regional enrichment are highlighted in red. a, c, d, and e represents four different regions of the tumour core; g, tumour-normal interface; f, perinephric fat; n, normal kidney; b, peripheral blood; h, normal adrenal gland; i, adrenal metastasis; t, thrombus. (C) Bar chart showing benchmarking results of the number of called mutations in CD8+ T cells derived from scRNA-seq data that are restricted to individual TCR clonotypes. (D) Comparison of the proportion of cells with one, two, three, and more than three mutations across the major cell types.

Regional characterisation and evolution of myeloid populations

Overall, we captured transcriptomes from 50,603 myeloid cells in our dataset, which were categorised into 19 clusters in sub-clustering analysis
image.png
我们首先根据典型标志物的表达和细胞的组织起源对这些cluster进行了广泛的注释
image.png
cluster 1、2、3 和 4 主要存在于血液中,CD14 高表达但缺乏 FCGR3A 表达,因此代表循环经典单核细胞。 cluster 5 代表循环非经典单核细胞,具有 FCGR3A 高表达但缺乏 CD14 表达。 我们确定了三个树突状细胞 (DC) cluster:pDC、1 型和 2 型常规 DC(cDC1 和 cDC2),分别以 JCHAIN、CLEC9A 和 CD1C 的特异性表达为特征。 与其他区域相比,cDC1 在三个 DC cluster中显示出在肿瘤核心中的富集。 我们发现以 TPSAB1 特异表达为特征的肥大细胞可能在肿瘤核心中富集,这与之前的报道一致。 值得注意的是,我们根据 CD163 和 C1QC 的高表达确定了 9 个巨噬细胞cluster(cluster 6-8、11-16),反映了 RCC 中巨噬细胞群的显着异质性。
image.png
  • 注:Sub-clustering analysis of myeloid cell compartment. (A) UMAP depicting interpatient variation, (B) tissue distribution, and (C) patient contribution to the different regions sampled. (D) UMAPs showing marker gene expression in myeloid cells. (E) Scatter plot of M1 versus M2 polarisation for all of the macrophages showing individual cells (grey), and mean values for each subtype (coloured). (F) Heatmap plotting the similarity of myeloid clusters derived in our study (G) Violin plots showing expression levels of SPP1 and GPNMB across all myeloid cell subtypes.
为了进一步表征我们数据集中的异质巨噬细胞群,我们探索了 DEG 和九个巨噬细胞cluster的组织富集。 我们发现与其他正常组织相比,六个巨噬细胞cluster(cluster 11-16)优先富集在肿瘤核心/界面中,因此被定义为肿瘤相关巨噬细胞(TAM)。 其余三个cluster(cluster 6、7、8)在正常组织中富集,被认为是组织驻留巨噬细胞 (TR Mac)。 在六个 TAM cluster中,MHC-II TAM(cluster 14)高表达 HLA-DRB5、APOE 和 APOC1,与肿瘤-正常界面相比,肿瘤核心更富集。 相比之下,其他五个 TAM cluster在肿瘤核心和界面中显示出相当程度的富集。 促炎性 TAM(clster 11)高表达趋化因子 CXCL9/10 和 NLRP3 炎症小体组装激活剂 GBP1/5,表现出 M1 极化的主要特征。
image.png
FN1+ TAM(cluster 15)高表达纤连蛋白 1 (FN1) 和清道夫受体 MARCO,此前曾报道其为肾癌中的特定巨噬细胞亚群。我们发现 FN1+ TAM 可能在 ccRCC 中促肿瘤,这反映在髓源性抑制细胞 (MDSC) 特征和 M2 极化基因的高表达上。我们在我们的数据集中发现了一个 SPP1+ TAM cluster(cluster 16),该cluster已在各种癌症类型中有所报道,但在肾癌中不存在。有趣的是,我们发现 ccRCC 中的 SPP1+ TAM 表达 GPNMB,并显示出与先前研究确定的 GPNMB+ TAM 高度相似。考虑到我们还确定了一个 GPNMB+ TAM cluster(cluster 15)并且可以在多个 TAM cluster中检测到 GPNMB 的表达,这一发现表明 SPP1+ TAM 可能代表 GPNMB+ TAM 的一个subset。除了表达 SPP1,我们发现 SPP1+ TAM 还表达 TREM2 并具有高血管生成评分。 TREM2+ 巨噬细胞与各种生物和病理过程有关,例如肥胖和癌症。
在三个 TR Mac cluster中,TR Mac.2 高表达白细胞介素 IL1B 和表皮生长因子受体配体 AREG,这可能反映了其在体内平衡组织修复中的可能作用。 TR Mac.3,显示SEPP1和MRC1的高表达,并且在正常肾上腺中极其富集。 有趣的是,TR Mac.3 表现出极高的 M2 表达和吞噬特征,并显示出与促肿瘤 TAM cluster(即 FN1+ TAM)相似的通路激活。 在该数据集中,我们无法清楚地区分胚胎接种的组织巨噬细胞与单核细胞衍生的组织巨噬细胞。
image.png
  • 注:Heatmap showing the results of pathway enrichments of macrophage subsets using GSVA analysis
接下来,我们探索了在我们的研究中确定的不同 TR Mac 和 TAM 集群的潜在起源。 使用 RNA 速度分析,我们发现从循环单核细胞到组织中的巨噬细胞有两个明显的定向流动:(1)经典 mono.3 到 TR Mac.2 和(2)非经典单核细胞到 TR Mac.1。 TR Mac.1 和 TR Mac.2 然后可能在组织中产生其他巨噬细胞
image.png
  • 注:UMAP with superimposed RNA velocity analysis of the monocyte and macrophage subsets with zoomed windows highlighting possible directional flows from monocytes to macrophages.
为了确定巨噬细胞亚群与循环单核细胞的关系,我们利用体细胞突变进行谱系追踪,其方式类似于通过共享 TCR 克隆型确定 T 细胞表型状态的关系。 在这里,我们构建了一个邻接树来描述不同单核细胞和巨噬细胞cluster的关系,利用从 scRNA-seq 数据calling的体细胞突变
image.png
  • 注:Neighbour-joining tree depicting the relationship of different monocyte and macrophage clusters, utilising the somatic mutations called from scRNA-seq data. The numbers of supporting votes in bootstrapping (100 times) are labelled.
我们发现循环单核细胞与组织中的巨噬细胞分离,与其他经典单核细胞相比,非经典单核细胞(cluster 5)与组织中的巨噬细胞显示出更密切的关系。 我们的数据支持代表循环单核细胞和巨噬细胞之间中间状态的非经典单核细胞,大多数巨噬细胞似乎来自单核细胞祖细胞而不是卵黄囊起源。

Regional heterogeneity of endothelial cells, fibroblasts and epithelial cells

我们在数据集中观察到异质基质细胞群。 内皮细胞 (EC) 区室的亚cluster显示 11 个具有不同 DEG 和组织位置偏好的cluster。
image.png
Pericytes(cluster 11),以 RGS5 和 TAGLN 的表达为特征,优先富集在肿瘤核心中。发现一个小cluster(cluster 9)在肾周脂肪中极度富集,并高度表达 TFF3 和 PDPN,因此代表淋巴 EC。其余 9 个cluster代表血管 ECs,其中cluster 10 代表循环 EC,高表达 TOP2A 和 MKI67。我们确定了三个潜在的肿瘤相关 EC cluster:胶原蛋白 EC、IGFBP3+ EC 和 ACKR1+ EC,因为它们在肿瘤组织中显示出相当多的富集。在这三个cluster中,发现胶原蛋白 EC(表达 COL4A1 和 COL15A1)在界面中更加丰富,这可能通过细胞外基质 (ECM) 产生与其他细胞相互作用。 ACKR1+ EC 特异性表达非典型趋化因子受体 ACKR1,其支持免疫细胞的粘附和组织迁移。我们发现 IGFBP3+ EC 也表达高水平的免疫抑制酶 IDO1,暗示其在 TME 中的免疫调节作用。我们发现 CRHBP+ EC 和 IGF2+ EC 优先富集在正常肾组织中,而 DNASEL3+ EC 显示在正常肾上腺中富集
我们在sub-clustering分析中确定了九个成纤维细胞(Fibro)cluster。 与 EC 类似,我们发现了一组成纤维细胞(cluster 8)高表达的胶原相关基因(COL1A1 和 COL6A2)并优先富集在interface。
image.png
这表明不同的产生 ECM 的基质细胞倾向于在界面中富集和共定位,发挥不同的功能,包括细胞外环境重塑和细胞间相互作用。 MMP 纤维的特点是基质金属蛋白酶 MMP2、补体因子 CFD 和 lumican LUM 的高表达。 发现 MMP 纤维富含肾周脂肪和肾上腺。 Cluster 7 高度表达 MYH11、SNCG 和 RERGL,因此被认为是平滑肌细胞 (SMC),如成纤维细胞。 发现 SMC 样纤维在正常肾组织中富集
数据集中的正常上皮细胞群表现出预期的多样性,并在sub-clustering分析中分为 13 个聚类。 我们鉴定了两个近端肾小管 (PT) 细胞cluster(均表达 NAT8 和 PDZK1IP1):cluster 1 具有更高的金属硫蛋白 MT1H 和 MT1G 表达,因此可能代表 PT3 细胞,而cluster 2 可能代表 PT1/2 细胞,因为它表现出更高的 PT2 标记 SLC22A6,和 PT1 标记 SLC5A12 和 SLC5A2。
image.png
两个 Henle 环(LoH)cluster:cluster 3 代表升细肢(ATL)细胞,表达 CLDN3 和 TACSTD2; cluster 8 代表厚升肢 (TAL) 细胞,其特征在于 SLC12A1 和 UMOD 的表达。 确定了三个集合管 (CD) 上皮细胞cluster:A 型插入细胞(表达 SLC4A1)、B 型插入细胞(表达 SLC4A9)和 CD 主细胞(表达 AQP2 和 FXYD4)。 我们鉴定了特异性表达 SLC12A3 的远曲小管 (DCT) 细胞(7 cluster)、高表达 SLC8A1 和 CALB1 的连接小管细胞(10 cluster)、显示 PSCA 和 KRT17 特异性表达的盆腔尿路上皮细胞(13 cluster)和足细胞(11 cluster) ) 专门表达 PTGDS 和 PTPRO。

RCC expression meta-programmes show differential abundance at the tumour-normal interface and affects prognosis

为了探索肿瘤细胞群中的肿瘤内表达异质性,我们首先使用非负矩阵分解(NMF)定义了由每个肿瘤中的共表达基因组成的肿瘤内表达程序。这些表达程序代表了每个肿瘤中仅由肿瘤细胞亚群高度表达的基因模块,如代表性肿瘤 PD45816 中的 NMF 结果所示。总的来说,我们从 10 个 ccRCC 肿瘤中剖析了 45 个肿瘤内表达程序。其中一些程序虽然是个体肿瘤中的亚群事件,但被发现由不同的肿瘤共享,因此被定义为 ccRCC 中肿瘤细胞表达的meta程序。通过聚类分析确定了六个meta程序。第一个meta程序 (MP1) 的特征是 FOS 和 JUN 等基因的表达,因此代表了肿瘤细胞中与应激反应相关的特征。 MP2 由近端肾小管 (PT) 细胞特异性表达的基因 (即 NAT8 和 ACSM2B) 组成。肿瘤细胞中 PT 特征的存在证实了先前的发现,即 PT 细胞是 ccRCC 的细胞类型。有趣的是,我们发现第三个meta程序 (MP3) 富含 TGFBI 和 MT2A 等与上皮间质转化 (EMT) 相关的基因。这表明 MP3 可以概括 ccRCC 中的 EMT 过程,这在之前的 RCC scRNA-seq 研究中尚未报道。 MP4 由 NEAT1 和 HCG18 等非编码 RNA 基因组成,可能反映了一些压力或细胞死亡 (CD) 相关的细胞状态。 MP5 的特点是表达 MHC-II 相关基因,如 CD74 和 HLA-DRA。 MP6中发现TOP2A、MKI67等基因,说明该meta程序与肿瘤细胞增殖有关。
接下来,我们整合了来自十个肿瘤的肿瘤细胞,通过去除批次效应来减轻患者间的异质性。通过sub-clustering和 DEG 分析,我们验证了肿瘤细胞中六个meta程序的存在。我们计算了使用 NMF 破译的六个meta程序的基因评分,并将它们映射到肿瘤细胞的 UMAP 上。这再次反映了在肿瘤细胞中亚群的meta程序的表达。有趣的是,我们发现 PT 和 EMT 程序的表达显示出反转模式,这通过在 TCGA 样本的大量 RNA-seq 数据中计算的 PT 和 EMT 分数之间的反相关性得到进一步证实。此外,我们发现与肿瘤核心相比,EMThigh 肿瘤细胞在肿瘤-正常界面(肿瘤的前沿)更丰富,这反映了 EMT 状态代表肿瘤细胞更具侵袭性和迁移性的事实。 PT/EMT 程序的异质表达与肿瘤细胞的空间位置偏好相结合,以个体肿瘤为例。例如,在肿瘤 PD45815 中,我们发现当通过 EMT 评分对肿瘤细胞进行排序时,PT 程序是反向表达的。同时,EMThigh肿瘤细胞倾向于定位在界面,而PThigh细胞相对更富集在肿瘤核心的R1和R2区域。最后,通过对 TCGA 样本的大量 RNAseq 数据进行评分,我们发现根据 TCGA 研究显示出最差预后的 TCGA 分子亚型 m3,与其他亚型相比,显示出显着更高的 EMT 评分但较低的 PT 评分。这一发现表明我们的meta程序可以成为患者生存的潜在指标.
image.png
  • 注:RCC cell expression programmes, regional enrichment and prognosis. (A) Heatmap showing expression programmes derived in a representative patient using NMF. (B) Heatmap depicting shared expression meta-programmes across all patients. (C) UMAP representing clusters of tumour cell population. (D) Relative expression scores of meta-programmes in each RCC cell cluster (left) and the distributions of cells with different meta-programmes in tumour core and tumour-normal interface. (E) Cells from patient donors PD45815 and PD45816, ranked by decreasing EMT score with corresponding PT score and cell location. (F) Box plots showing the EMT and PT scores of TCGA samples in different molecular subtypes. ***, P < 0.001 (Wilcoxon rank sum test)


    image.png

Cellular interactions associated with spatial location reveal biological insights and promising therapeutic targets

为了表征 RCC 微环境中不同空间位置的细胞间通讯,我们使用 CellPhoneDB 评估了正常肾脏、肿瘤-正常界面和肿瘤核心中主要细胞类型之间的细胞间相互作用。有趣的是,界面和肿瘤核心中 12 种主要细胞类型之间发生的细胞间相互作用的数量相对可比,即使我们排除了那些涉及肿瘤细胞的相互作用,也比正常肾组织中的数量高出约两倍.接下来,我们比较了在正常肾脏、肿瘤-正常界面和肿瘤核心的不同细胞类型上表达的特定配体-受体对介导的细胞-细胞相互作用。首先,该分析揭示了肿瘤与正常微环境之间相互作用的显着差异。例如,在 CD8+ T 细胞和 ECs 之间,我们发现 EC 募集(CCL5-ACKR1)和免疫抑制(LGALS9-HAVCR2)信号在界面和肿瘤核心中更加活跃,反映了肿瘤中血管生成和免疫抑制水平的升高。到正常组织。其次,我们始终观察到肿瘤边缘和核心之间的差异。例如,由 PVR-TIGIT 介导的潜在免疫抑制相互作用分别在肿瘤核心中更活跃,而细胞生长/迁移相关相互作用 IGF-IGF2R 在界面中更活跃。第三,界面处的肿瘤细胞表达转录物,预测其介导独特的细胞间相互作用,可能促进肿瘤发生。例如,在界面中,与肿瘤核心中的相比,髓系细胞表达增强的细胞迁移相关信号,可以与肿瘤细胞相互作用(THBS1-整合素α3β1)。
image.png
  • 注: (A) Comparison of the number of cell–cell interactions between cells present in the adjacent normal kidney, tumour-normal interface, and the tumour core. (B) Dot plots representing mean expression levels and significance of important differentially expressed ligand receptor pairs by spatial region.
我们的结果表明,具有高表达 EMT 特征的肿瘤细胞(EMThigh 肿瘤细胞)优先定位于肿瘤的前缘。这促使我们探索界面处是否存在任何可能促进肿瘤细胞 EMT 的活跃细胞间相互作用。我们使用 NicheNet 分析将来自 TME 中细胞的配体与肿瘤细胞中的 EMT 程序联系起来。从该分析中,我们发现巨噬细胞表达的配体可能调节在肿瘤细胞上表达的大量 EMT 基因。特别是,巨噬细胞来源的 IL1B 对这些 EMT 基因显示出高度和广泛的调节潜力,可能是通过肿瘤细胞中表达的受体 IL1R1。有趣的是,我们发现 IL1B 由 TR Mac.2 特异性表达,其再次在肿瘤正常界面优先富集。总之,我们的研究结果表明,表达 IL1B 的巨噬细胞 (TR Mac.2) 优先存在于肿瘤-正常界面,通过产生 IL1B 上调肿瘤前沿肿瘤细胞中的 EMT 程序。这种致癌途径可能最终促进肿瘤细胞的迁移和侵袭
image.png
  • 注: (C) Heatmap depicting the potential regulation of genes expressed by the EMT meta-programme and ligands expressed by macrophages. (D) Schematic illustrating the importance of IL1B signalling between IL1B+ macrophages and RCC cells in promoting EMT.

DISCUSSION

我们使用基于多区域的基因组和单细胞转录组测序来表征 ccRCC 的表型异质性和多细胞生态系统。 总体而言,我们的研究描绘了 ccRCC 的 TME 的综合图谱以及 ccRCC 中已建立的 ITH,包括肿瘤细胞和免疫/基质细胞的表型分类,以及它们在 TME 中的细胞间通讯,主要与其地理定位相关。
扩增的 CD8+ TCR 克隆型内的细胞在很大程度上受到耗竭评分的限制。最近在黑色素瘤中报道了类似的观察结果。克隆型的表型限制可能主要与给定克隆的时间成熟有关,而不是环境因素,因为个体肿瘤在完全不同的状态下都具有克隆型。除了表型限制之外,我们还发现扩增的 TCR 克隆型在一个或多个宏观肿瘤活检中也经常受到空间限制。由于我们的研究中观察到的体细胞突变的 ITH 有限,因此无法通过暴露于不同的突变相关新抗原来完全解释 TCR 克隆扩增的这种空间限制。我们无法在 TME 中定义任何其他可以预测这种克隆型空间异质性的因素。感知到的 T 细胞克隆型的随机定位可能是物理和环境因素驱动细胞从外周循环到肿瘤驻留的初始迁移的结果。可以采用纵向取样策略或方法来确定准确的 T 细胞系统发育,以询问 T 细胞扩增和迁移的精确时间。我们对扩增 TCR 克隆区域限制的观察是否在其他癌症类型中更广泛地被发现,可能需要部署类似采样和测序策略的额外研究。
外周 TCR 用于非侵入性癌症检测和监测的效用显示出前景,尤其是在循环肿瘤 DNA 片段稀缺的 RCC 中。 虽然我们发现在血液和肿瘤区域都存在许多扩增克隆型,但我们观察到衰竭程度与外周血中检测到 TCR 克隆的概率呈负相关,以至于在血液中很少检测到衰竭克隆型。 研究结果表明,一旦 T 细胞克隆浸润到肿瘤中并经历从激活到功能障碍的表型转变,它们就很少再循环,这可能是由于 CD69 所证明的组织驻留表型。 因此,对肿瘤反应性 TCR 的外周采样更有可能检测到耗尽的肿瘤驻留克隆的前因,而不是那些目前在肿瘤中活跃的克隆.
作者开发了一种策略 (deSCeRNAMut),可以根据基于液滴的 scRNA-seq 数据准确检测不同细胞群中的体细胞突变。使用许多过滤指标(包括不同细胞类型谱系之间共享胚胎后突变的不可信性)消除了缺乏一致覆盖、低读取深度和容易出错的测序读取的主要挑战。我们检测到我们数据集中不同细胞谱系的体细胞突变,并确定了骨髓细胞中的高度克隆扩增。我们使用从这种方法calling的体细胞突变来构建巨噬细胞和单核细胞中的相邻连接树,以推断非经典单核细胞可能是肾癌中循环单核细胞和大多数组织驻留巨噬细胞之间的中间状态。我们设想在未来,使用空间成像技术来可视化一系列细胞类型中表达基因的突变将有助于破译多细胞 TME 的系统发育组织。
EMT meta程序是通过每个患者的肿瘤细胞亚群的表达来定义的,并且在我们的研究中由多个 ccRCC 肿瘤共享。 更丰富的肿瘤细胞群和帮助规避具有挑战性的批次变化的方法的使用使我们能够发现这个以前未报告的特征。 EMT 程序在 ccRCC 肿瘤细胞中的表达与 PT 程序(一种上皮表达特征)的表达呈负相关。 同时,ccRCC中的EMThigh肿瘤细胞倾向于定位于肿瘤-正常界面,这是肿瘤的前沿和迁移边缘。 这些发现与头颈癌的 scRNA-seq 研究中报道的结果相似,反映了 EMT 的定义特征:细胞中上皮特征的丧失,有利于促进其迁移和侵袭能力。
分析细胞间相互作用揭示了与 ccRCC 的 TME 中不同空间定位相关的预测细胞间通讯的异质性。特别是,通过使用 NicheNet 连接配体和目标基因,我们发现 IL1B,由在肿瘤-正常界面 (TR Mac.2) 富集的组织驻留巨噬细胞亚群特异性表达,可能促进肿瘤细胞进行 EMT。据报道,IL1B 的表达与 RCC 的肿瘤分期呈正相关,并且与招募到癌症基因组图谱的患者中 RCC 患者的较差预后相关。此外,在 RCC 中抑制 IL1B 已显示在 RCC 的同源小鼠模型中诱导肿瘤消退。 IL1B 阻断剂也被证明可以减少动脉粥样硬化患者肺癌的发生率,目前正在几项临床试验中研究其使用。在我们的数据中,我们表明导致 IL1B 在 RCC 中不利作用的潜在机制通过巨噬细胞衍生的 IL1B 信号传导促进 EMT 起作用。利用这一途径可能在治疗上是有用的。

Method

scRNA-seq merge and QC

image.png

Cell type sub-clustering and annotation

image.png

image.png

Pseudotime inference, TCR analysis

image.png

De Novo Mutation Calling from scRNA-seq Data 重点

image.png

image.png

image.png

Inferring copy number variations based on scRNA-seq data

image.png

image.png

Cell subtype abundance in different tissues

image.png

Correlation between spatial, somatic RCC evolution and TCR clonotype evolution

image.png

image.png

Gene set enrichment analysis and gene signature scoring in macrophage population

image.png

RNA velocity analysis

image.png

image.png

Lineage tracing using scRNA-seq called somatic mutations

image.png

image.png

Deciphering intra-tumour expression programmes and meta-programmes

image.png

image.png

Integrating and analyzing tumour cells from different patients

image.png

细胞通讯分析

image.png

生活很好,有你更好

你可能感兴趣的:(单细胞分辨率下肾细胞癌和微环境的多区域表征[10X单细胞联合10XVDJ分析、Mutation Calling])