Comprehensive Genomic Characterization of Tumor Microenvironment and Relevant Signature in Clear Cell Renal Cell Carcinoma
肿瘤微环境的综合基因组特征和透明细胞肾细胞癌的相关特征
发表期刊:Front Oncol
发表日期:2022 May 16
DOI: 10.3389/fonc.2022.749119
一、背景
肾癌是世界范围内常见的泌尿系统恶性肿瘤,其中肾透明细胞癌(ccRCC)占所有诊断病例的近85%,同时每年与癌症相关的死亡人数越来越多。
越来越多的研究对免疫相关治疗靶点有了更深入的了解,特别是肿瘤微环境(TME)在癌症进展和药物反应中的重要作用。肿瘤微环境的结构主要由母体肿瘤细胞、肿瘤相关巨噬细胞(TAMs)、间质干细胞(MSCs)、树突状细胞(DCs)、细胞毒性T细胞、辅助T细胞和其他炎症相关因子组成,这些因素被有力地证明与多种恶性肿瘤的预后有关。
ccRCC与免疫浸润有明显的相关性,为了提高免疫治疗的精确性,人们致力于探索更敏感的生物标志物,包括免疫相关特征、肿瘤突变负担(TMB)和其他特异性免疫细胞。到目前为止,可以利用先进的计算方法来推断免疫细胞和其他细胞类型的丰度,包括ssGSEA、CIBERSORT和ESTIMATE。一些队列研究了TME的临床效率,揭开TME和免疫治疗反应的潜在机制已经在几种恶性肿瘤中得到了很好的实验描述。
二、材料与方法
1.数据来源
1) 从TCGA中获得KIRC RNA-seq(N = 530)、单核苷酸变异(SNV)数据(N = 417)、拷贝数变异(CNV)数据(N = 534)、miRNA(N = 592)以及相应的预后数据(仅筛选了生存信息,N = 527)
2) 从ICGC下载91个样本的RNA-seq与临床数据
2.实验流程
1)以使用CIBERSORT算法和LM22基因特征推断肿瘤样品中免疫细胞的比例
2)使用ConsensusClusterPlus聚类;我们使用ConsensionClusterPlus包来找到具有最佳优化K类别的TMEcluster,根据TMEcluster的结果,聚类结果被映射到RNA-seq数据上,并利用limma软件包搜索差异表达基因(DEGs);利用随机森林法去除冗余基因,得到了集群特征基因,进行功能富集分析;Cox回归模型来计算ccRCC的TMEscore,用maxstat寻找TMEscore的最佳cutoff。
2) TCGA-KIRC的突变景观:根据下载的TCGA-KIRC SNP数据(N=336)、CNV数据(N=534)、甲基化数据(N=483)和生存数据(N=539),将它们与RNA-seq数据相交,最终得出210个样本;使用maftools和SomaticSignatures来绘制ccRCC的突变景观和特征;GISTIC算法用于检测所有样本中常见的CNV区域,包括染色体臂水平CNV和跨样本的最小共同区域;应用ABSOLUTE算法从预先设计的癌症核型和体细胞突变频率中计算出分数,然后进行整合,从中得到的最高分数为最佳模型。
3) ccRCC TME的综合分析:确定了几个集群中miRNA或mRNA的差异转录组,并进行功能富集分析;对TME高组和TME低组的差异基因进行了预后分析;TIDE工具被用来评估免疫检查点抑制治疗的临床效率。
三、实验结果
01 - TME中浸润的免疫细胞的景观和聚类分析
根据整合后的RNA-seq数据(N=618),利用CIBERSORT在1000次交互作用中获得了512个样本中各种免疫细胞的丰度,包括CD4细胞、CD8细胞、B细胞和单核细胞(图2A)。进一步描述了免疫细胞之间的潜在联系和它们各自的预后意义,发现在Cox回归模型中,Tregs细胞和T滤泡辅助细胞与生存结果呈负相关,而Mast resting细胞和T gamma delta细胞与预后呈正相关(图2B)。此外,结合ConsensusClusterPlus软件包,迭代1000次以稳定分类类别,获得样本的优化分类。观察到当K = 5时,TME cluster分类与生存结果有明显的关联,其中TME cluster4(N = 35)的预后最差,TME cluster5(N = 105)的预后最好(图2C)。进一步比较了不同TME亚群的免疫细胞比例,发现这5个亚群之间存在明显的生存差异(图2D,图3)。
02 - 识别与TME相关的重要预后特征
作者设定p<1e-3和|logFC|>2的临界值来筛选DEGs,在不同的亚群中共获得了13571个基因(图4A)。功能分析表明,这些基因主要参与体液免疫应答、免疫球蛋白介导的免疫应答和B细胞介导的免疫(图4B)。此外,利用Cox回归模型分析基因与生存结果,并将样本分为两组,即TME-高组和TME-低组。K-M分析表明,TME低组的病人比TME高组的病人预后更差(图4C)。Sankey图也显示了TMEcluster、TME高低组和生存状态之间的潜在联系(图4D)。
03 - 癌症体细胞基因组的概况及与TME的关系
作者对210个肿瘤样本的突变数据进行了统计分析,包括突变注释、碱基变化的比例和前10个驱动因素。在KIRC中,错义突变发生的频率最高,主要类型是SNP,其次是DEL和INS。在这些样本中,前10位突变的驱动因素包括VHL、TTN和PBRM1(图S3)。进一步将患者分为TME高组和TME低组,图4E说明了不同组别的突变情况。还观察到在KIRC中,VHL的突变位点最多,分布在近一半的病例中。此外,UBBP4、SPEN和BDP1等肿瘤基因驱动因子在两组之间表现出明显的突变频率差异(图5A)。作者将突变分为96种类型,并计算210个KIRC样本的分布频率(图5B)。基于COSMIC数据集估计了突变频率和特定特征之间的关系,进行了非负矩阵分解,将210个样本作为行,96个突变类型作为列,提取了这些特征,并将其与COSMIC中的特征进行了比较。TME高组的突变特征主要与signature 5和signature 12相关,而TME低组的突变特征与signature 5、signature 6和signature 24相关。signature 6被发现涉及DNA错配修复缺陷,而signature 24与黄曲霉毒素暴露有关(图5C)。
作者还用GISTIC软件分析了两组的CNV,发现15p、5q、5p的扩增和9q、15p、14q的缺失在TME高的组中最为突出。然而,7q和5q的扩增以及9q、3p和14q的缺失在TME低组中最为显著(图6A)。此外,在TME高组中总共检测到102个扩增和79个拷贝数缺失(图6B)。其中,5q11.2、17q12和4q34.1是最显著的扩增区域,4p16.1、3q29和1q21.3是最显著的删除区域。在TME低组中,完全检测到87个扩增和58个拷贝数缺失,其中17q12、20p13和5q11.2是最明显的扩增区域,4p16.1、1q21.3和12p13.31是最明显的删除区域(图6C)。样本的肿瘤纯度和倍性是根据ABSOLUTE软件估计的。肿瘤纯度为0.28-1,肿瘤细胞基因组的倍性为1.78-9.06,表明基因组紊乱在肿瘤发生过程中普遍存在。此外,Wilcoxon检验表明,高低TMEscore组之间没有显著差异(图S4)。
04 - TMEscore在预测免疫治疗获益方面的综合结果和意义
差异分析显示,在TME高组和TME低组之间共有45个差异表达的miRNAs和163个mRNAs。功能富集分析表明,这些差异基因主要涉及B细胞介导的免疫、体液免疫应答和其他与癌症相关的途径(图S6)。
对数检验显示了19个生存相关的miRNAs和23个mRNAs,包括hsa-mir-21、hsa-mir-223、hsa-mir-146b、hsa-mir-139、SAA1、SLC27A2、PPP1R1A和SAA2(图7)。
图8A中进一步说明了整合TMEcluster、TMEscores、突变特征(纯度、倍数和TMB)和临床特征(年龄、性别和整体状况)的综合基因组图谱。利用TIDE数据集来估计两组之间免疫检查点阻断(ICB)治疗的临床效率,发现低TMEscore组的TIDE得分计算结果明显低于高TMEscore组,肿瘤中较高的TIDE预测分数与ICB的效果较差和生存结果不佳相关。因此,在目前的分析中,作者推测TMEscores较高的KIRC患者可能更容易从ICB治疗中受益并预后良好(图8B)。作者绘制接受者操作特征(ROC)曲线以比较传统TMB和已建立TMEscores在预测ICB效率方面的差异,其中TIDE评分被定义为观察值。根据Bootstrap检验,TMEscore被证明是肿瘤预后和ICB效率的有效指标(图8C)。
四、结论
本研究整合了ccRCC队列(TCGA-KIRC、ICGC-ccRCC)的多组学数据,将基因组、转录组和突变谱与临床特征相结合,详细描述了TME亚群的特征、TMEscore的建立、TMEscore与突变谱、CNV负担、风险特征和ICB效率的潜在关联,并评价了TMEscore在临床效用中的预后意义,从多个方面将TMEscore评估为ccRCC中对免疫检查点抑制剂反应的稳健预后标志物或预测因子,为后续关于TME在ccRCC肿瘤发生中的研究提供了宝贵的生物信息资源。