基于免疫浸润的综合多组学方法构建免疫表型相关风险模型

Integrated Multi-Omics Analysis Identified PTPRG and CHL1 as Key Regulators of Immunophenotypes in Clear Cell Renal Cell Carcinoma(ccRCC)

综合多组学分析发现PTPRG和CHL1是透明细胞肾细胞癌(ccRCC)免疫表型的关键调节因子

发表期刊:Front Oncol

发表日期:2022 Mar 30

影响因子:5.738

DOI:  10.3389/fonc.2022.832027

期刊相关信息

一、背景

        肾癌是全球第三大泌尿系统癌症,透明细胞肾细胞癌(ccRCC)占所有RCC病例的70%以上,其特点是大多数(60-80%)肿瘤中早期缺乏肿瘤抑制基因(VHL)。已有研究证明,免疫检查点抑制剂(ICI),如nivolumab,通过抑制PD-L1介导的信号传导,延长了转移性ccRCC患者的总生存期。

        IFN-γ是一种细胞因子,在肿瘤生长和肿瘤微环境的基础上起着关键作用。越来越多的研究揭示了高IFN-γ水平与加速淋巴细胞浸润和PD1/PD-L1免疫检查点抑制治疗的临床获益之间的相关性。最近,T细胞浸润评分被发现与ccRCC患者的预后和对免疫治疗的反应密切相关,并发现了三种具有不同预后特征的免疫分子表型。

二、材料与方法

1.数据来源

1) GSE66270(n = 28),GSE53757(n = 144),GSE36895(n = 76),GSE76351(n = 24)

2) UCSC xena GDC TCGA KIRC(535个肿瘤样本和72个正常样本,去除同一患者的重复样本后,得到527个肿瘤样本和72个正常样本)

3) 突变数据从UCSC xena TCGA hub KIRC的MC3公开版(n = 368)下载

4) CNV数据按基因(n = 536)从UCSC xena GDC TCGA KIRC下载

5) Illumina Human Methylation450k(n = 480)数据从UCSC xena TCGA hub KIRC下载

6) 用R包TCGAbiolinks下载miRNA数据(n = 592)

7) 蛋白质数据(n = 454)从UCSC xena RPPA TCGA中心下载

8) 生存数据(n = 979)从UCSC xena GDC TCGA KIRC下载。

2.实验流程

研究策略的流程图

三、实验结果

01 - 免疫表型的特征

        使用Cibersort计算五个独立队列中22种免疫细胞的相对含量。选择6种免疫细胞(CD8+T细胞、CD4+记忆性静止T细胞、CD4+记忆性活化T细胞、滤泡辅助T细胞、活化NK细胞、M2巨噬细胞)进行后续分析,它们与上述5个队列中的PD-L1和IFN-γ的表达显著相关(图2A)。

图2    (A)22个免疫细胞含量与PD-L1和IFN-γ表达水平的相关性。(B)4个免疫亚簇的PD-L1表达水平。

        根据PD-L1和IFN-γ的表达水平以及所选的6种免疫细胞亚型,使用无监督层次聚类法将这些样本分为两个主要集群:集群A(PD-L1和IFN-γ表达较高)和集群B(PD-L1转录物较低)(图2B)。此外,M2巨噬细胞和CD4+记忆静止T细胞在簇B中明显富集,而不是在簇A中,而CD8+T细胞在簇A中的浸润率高于簇B(图3A)。根据这些特征性变化,进一步将A群分为A1和A2亚群,而B群分为B1和B2,PD-L1、IFN-γ表达水平和免疫细胞浸润率的差异在A1亚群和B1亚群之间甚至更大(图2B和3A)。考虑到以前的研究表明M2巨噬细胞与总生存率呈负相关,而CD8+T细胞在抗肿瘤免疫中起着主要作用,因此将A1亚群定义为高细胞毒性免疫表型,而B1亚群则为低细胞毒性免疫表型。在数据中,CD8+T细胞的含量与巨噬细胞M2的含量呈负相关,而在以前的一些研究中,CD8+T细胞的含量被认为可以预测多种肿瘤类型的更好的生存效益,巨噬细胞则相反。与此相呼应,A1群的患者表现出明显比B1群的患者有更好的总生存率(图3B)。此外,作者还调查了四个簇中表皮生长因子受体(EGFR)的蛋白水平,因为越来越多的证据强调了它在驱动各种类型癌症的免疫浸润分层中的独特作用,发现A1簇中EGFR的表达明显高于B1或B2簇(图3C)。因此,选择了A1和B1群进行进一步分析,并试图强调驱动ccRCC中不同免疫亚型的机制。

图3    (A)GEO和TCGA-KIRC队列6种免疫细胞浸润热图。(B)4个免疫簇的总生存期(C) 4 个免疫簇中 EGFR 表达水平箱形图。

02 - 不同免疫表型差异

        根据TCGA-KIRC队列评估了所有免疫表型的体细胞突变的质量和数量,以揭示突变和免疫改变之间的关联。就总突变负荷而言,A1和B1群没有差异,而A2群突变负荷明显高于B2(图4A)。尽管在A1(HMCN1,LRP1B)、B1(ANK3,KDM5C)、A2(CENPF,XIRP2)和B2(DNAH2,MYH4)集群中分别观察到几个具有高突变频率的独特基因,但VHL、PBRM1、SETD2和BAP1在所有集群中都排名前四,揭示了其在驱动突变中不可替代的地位(图4B)。作者还计算了四个子群中的突变共存和排他事件(图4C),PBRM1和BAP1的排他性可以在A1亚群中观察到,而VHL和SETD2的共存则发生在B1亚群中。

图4(A)各种免疫簇突变负荷的巴氏图。(B)各种免疫簇之间突变谱的瀑布图。(C)突变共存和互斥时间概述。

03 - 与免疫表型相关的mRNA表达差异

        对A1和B1亚群之间的mRNA表达进行了差异化分析,发现A1中有1890个上调基因,B1中有1155个上调基因(图5A)。A1中显著上调的基因包括CD8A、CD8B、LAG3、IFN-γ,而SLC4A1在B1中上调。与细胞因子-细胞因子受体相互作用、异体排斥、移植物抗宿主病有关的通路在A1中被激活,而与神经活性配体-受体相互作用和蛋白质消化吸收有关的通路在B1中被激活,这与以前定义A1为高细胞毒性免疫表型和B1为低细胞毒性免疫表型的结果一致(图5B、C)。

图5    (A)DGE火山图。(B)A1簇中上调DEG 的KEGG。(C)B1簇中上调 DEG 的KEGG

04 - 免疫亚型遗传拷贝数的差异

        为了进一步研究拷贝数的差异,作者对A1和B1进行了GISTIC分析,发现A1有15个明显的扩增区域和6个明显的删除区域,而B1则相应有9个和4个(图6)。将这些区域所包含的基因与之前得到的差异表达基因相交,可以看到A1和B1的明显删除的基因存在于3号染色体的相邻区域而不是相同的区域。此外,在5号染色体上也发现了A1和B1的拷贝数差异,在此确认了其中的几个重要基因:CD74、NKX2-5、EGR1和FOXI1。

图6    群集 A1 和 B1 之间拷贝数变异的 IGV 配置文件。

05 - 免疫亚型中DNA甲基化,miRNA和lncRNA的差异

        根据|log FC|>0.15和P<0.05,确定了A1中523个差异上调的高甲基化探针和B1中1456个差异上调的高甲基化探针。其中,发现156个β值较高的探针与A1群中94个差异上调的基因有关,而93个β值较高的探针与B1群中72个差异上调的基因有关(图7)。

图7    A1和B1簇之间差异DNA甲基化和DEG相交的热图。

        接下来根据三个数据库-mircode miRTarBase和Targetscan搜索了miRNA-mRNA关系对,前提是相应的mRNA至少在三个数据库中的两个中出现。对于A1的33个上调基因,发现了739个miRNA-mRNA关系对,而对于B1的47个上调基因,发现了2443个miRNA-mRNA关系对(图8)。

图8    (A)A1和B1之间差异miRNA。(B、C)簇A(图B)和簇B(图C)中上调的mRNA与mircode,miRTarBase、TargetScan数据集中的miRNA-mRNA相互作用对关系对。

        如上所述,在A1中发现了1288个上调的lncRNA,在B1中发现了754个上调的lncRNA。同样,根据mircode、miRTarBase、TargetScan数据库搜索了miRNA-lncRNA关系对,然后为A1中上调的lncRNA确定了7个miRNA-lncRNA关系对,为B1中上调的lncRNA确定了11个miRNA-lncRNA关系对(图9)。

图9    (A)A1和B1之间差异lncRNA。(B、C) 簇 A(图B)和簇B(图C)中上调的lncRNA与mircode,miRTarBase和TargetScan数据集中的miRNA-lncRNA相互作用对关系对 。

06- 构建差异表达基因(DEGs)中心

        将mRNA-miRNA-lncRNA关系对合在一起,两个重要的miRNA:miR-155和miR-215,被确定为与A1和B1中多个不同分布的mRNA和lncRNA相关的调控中心的关键节点(图10)。

图10   DEGs-miRNA-lncRNA的Cytoskype网络图。

        由于发现了A1和B1群之间相似的拷贝数变异模式,而且之前通过比较不同的lncRNA-mRNA群得到的基因数量有限,作者没有将这两部分的结果纳入到DEGs中心的构建中。从上述结果中得到的差异表达基因的交集,即mRNA表达分化的基因、甲基化分化的基因和miRNA-mRNA关系对分化的基因,共筛选出40个基因,其中18个在A1中上调,22个在B1中上调。接下来在STRING数据库中对这40个基因进行了PPI分析,并画出了一个网络(图11A)。结果显示,A1的甲基化表达均高于B1(图11B),A1的RNA表达均低于B1,而CNV则相似(图11B)。使用Gepia在线工具,CHL1和PTPRG的单变量K-M生存曲线都表明,低表达组的ccRCC患者的OS明显短于高表达组(图11C)。

图11

07 - DEGs与免疫细胞丰度之间的相关性验证

        作者对之前描述的PTPRG和CHL1基因的表达水平和22个免疫细胞的内容进行了相关分析,得到了与PD-L1、IFN-γ和22个免疫细胞之间类似的相关模式(图12A),这在一定程度上推断出这两个基因可能通过与PD-L1和IFN-γ相关的途径调节免疫微环境。还利用在线工具TIMER验证了这两个基因与TCGA-KIRC中CD8+T细胞和巨噬细胞M2细胞的浸润之间的相关性(图12B)。使用人类蛋白质图谱数据库,确定PTPRG和CHL1在肾脏肿瘤组织中的表达水平都低于邻近的正常组织(图12C)。

图12   (A)22个免疫细胞相对含量与PTPRG和CHL1表达水平的相关性。(B)PTPRG / CHL1的mRNA水平与巨噬细胞M2细胞和CD8 T细胞的相对含量与在线工具TIMER 2.0的相关性。(C)基于人蛋白图谱数据库的PTPRG和CHL1的免疫组化结果。

08 - 探讨CHL1在ccRCC中的内在作用

        作者进行了体外实验以研究CHL1在786O细胞和Caki-1细胞的肿瘤生长中的作用。ccRCC细胞中CHL1的mRNA水平明显高于正常肾脏组织(图13A),与TCGA-KIRC数据库下载的结果一致(图13B)。接下来,构建了过表达质粒和shRNA质粒(图13A),并将其转染到786O和Caki-1细胞。转染后,CHL1的过表达抑制了肿瘤细胞的生长,而与对照组相比,敲除组表现出细胞存活率加速,细胞生长趋势加快(图13C)。此外,流式细胞仪分析表明,CHL1过表达后,凋亡细胞的比例明显增加(图13D)。总之,这些结果强调了PTPRG和CHL1在ccRCC的肿瘤生长和发展中的关键作用。

图13

09 - 建立基于DEGs枢纽的Cox-Lasso回归分析模型

        首先进行了单变量Cox回归分析,在A1和B1的3045个差异表达基因中确定影响ccRCC患者预后的关键基因。接下来,进一步进行套索回归分析和多变量逻辑回归分析,发现了22个具有潜在预后价值的关键候选基因。基于这22个基因,建立了预后模型,进行了Kaplan-Meier分析,同时在之前选取的样本中应用了风险评分,并检测了这22个基因在选取样本中的表达水平,然而高风险组和低风险组的预后差异并不明显。因此,采用了更严格的过滤标准,排除了多余的读数。与上述方法类似,根据A1群和B1群之间的DEGs来过滤潜在的基因。然后,根据风险评分的中位数将训练组的313名患者分为高风险和低风险组。经过接下来的单变量Cox回归分析、套索回归分析和多变量逻辑回归分析,最终确定5个关键基因(C17orf66、PAEP、WNT2、IRF4、RUFY4)与训练组ccRCC患者的预后显著相关(图14A,B)。K-M生存曲线分析表明,与低风险组ccRCC患者相比,高风险组ccRCC患者的OS明显缩短(图14C)。每位患者的风险得分用以下公式计算:风险分数=(-0.0398∗Exp IRF4)+(0.2617∗Exp WNT2)+(0.0556∗Exp RUFY4)+(0.5507∗Exp C17orf66)+(0.1441∗Exp PAEP)。风险评分模型的ROC曲线表明,在预测一年期OS(AUC = 0.715)、三年期OS(AUC = 0.728)和五年期OS(AUC = 0.814)方面表现中等至良好(图14D)。图14E -G显示了A1、B1组患者的存活状况,风险曲线分析和高、低风险组ccRCC患者的五个基因的表达谱。然后用同样的预后风险评分公式计算出试验组患者的风险评分,并评估预后风险模型的预测性能。与低风险组ccRCC患者相比,高风险组ccRCC患者的OS明显缩短。

图14  基于5基因特征的预后模型在训练组ccRCC患者中的风险评分分析。

四、结论

        本研究将ccRCC分为不同的免疫集群,从而确定了两个DEGs,即PTPRG和CHL1,这两个DEGs被验证在抑制肿瘤生长方面发挥了关键作用,可能是ccRCC中不同免疫集群形成的原因。还根据高免疫浸润集群和低免疫浸润集群之间的DEGs构建了一个预后模型,希望ccRCC患者在ICI治疗前或治疗期间可以从这个免疫表型相关的风险分层模型中获益。

你可能感兴趣的:(基于免疫浸润的综合多组学方法构建免疫表型相关风险模型)