公共数据挖掘竟然还可以发到15分+?

Identification of a cytokine-dominated immunosuppressive class in squamous cell lung carcinoma with implications for immunotherapy resistance

鳞状细胞肺癌中细胞因子为主的免疫抑制类的鉴定,对免疫疗法抗性的影响

发表期刊:Genome Med

发表日期:2022 Jul 8

影响因子:15.266

DOI:  10.1186/s13073-022-01079-x

一、研究背景

        肺癌是最常见的癌症,非小细胞肺癌(NSCLC)约占肺癌病例的85%。除了肺腺癌,肺鳞癌(LUSC)是NSCLC最常见的组织学亚型。

        随着近年来免疫检查点阻断(ICB)免疫疗法的发展,抗PD-1/PD-L1免疫检查点抑制剂已被批准用于肿瘤程序性死亡配体1(PD-L1)高表达(≥50%)患者的NSCLC的一线治疗。ICB疗法旨在重振功能失调或衰竭的T细胞以消除肿瘤。肿瘤微环境(TME)由癌细胞、免疫细胞、基质细胞和细胞因子组成。TME成分动态地调节着T细胞的衰竭。

        LUSC的TME是高度复杂和异质的,但对TME如何影响LUSC的免疫疗法的疗效却知之甚少。基于非负矩阵因子化(NMF)的虚拟显微切割分析方法已经能够有效地解读来自肿瘤细胞、炎症细胞、基质细胞和细胞因子的基因表达信号。

二、材料与方法

1、数据来源

1) 从TCGA(497个 RNAseq)和GEO(127个微阵列数据集)检索了总共624个LUSC人类样本的基因表达谱:将497名TCGA LUSC患者分为晚期组(IIA至IV期,250名患者)进行训练,早期组(I至II期,247名患者)进行内部验证

2) 其他来自两个独立数据集的127个LUSC微阵列样本(Affymetrix人类基因组U133 Plus 2.0阵列)被用来进行外部验证:GSE30219和GSE37745

3) 从GEO检索了28个抗PD-1治疗的黑色素瘤患者样本(GSE78220)的临床结果和基因表达谱的数据,这些样本包括15个有反应的和13个无反应的治疗前肿瘤

4) 从TCGA下载了319名LUSC患者的蛋白质表达数据,包括487个由反相蛋白质阵列(RPPAs)分析的蛋白质,这319名LUSC患者是497名患者的一个子集

2、分析流程

1) 通过无监督聚类识别衰竭免疫类别:首先使用R中的NMF对250名患者的训练队列的基于RNAseq的基因表达谱进行了虚拟微剖析,TCGA训练队列数据集被有效分解;通过单样本基因组富集分析(ssGSEA)计算免疫和基质的富集分数,确定免疫-基质集群中特定免疫细胞的丰度;从TIMER下载22个浸润性免疫细胞的绝对分数数据(CIBERSORT);白细胞部分的数据是根据Thorsson的研究中的DNA甲基化来估计的;肿瘤浸润淋巴细胞(TIL)的百分比,通过TCGA肿瘤(包括LUSC)的病理图像进行评估;提取了TCGA LUSC患者的22个浸润免疫细胞的绝对分数数据、白细胞分数和TIL百分比,然后通过Wilcoxon秩和检验,比较了免疫-基质簇和其他簇的情况,验证了淋巴细胞在免疫-基质簇中的富集;通过ssGSEA对代表T细胞衰竭的基因特征进行了评分;将免疫-基质集群内的患者群体定义为衰竭免疫类(EIC),其余群体定义为其余类。

2) 衰竭免疫类的分子特征分析:通过GSEA和ssGSEA进行分析,评估EIC中分子通路和基因表达特征的富集程度;ClueGO,一个Cytoscape插件,被用来生成KEGG通路的功能分组网络,以解释元基因的生物作用;确定EIC和其他类别之间的差异表达基因,使用DESeq2进行基因差异表达分析;在元基因特异性基因中,EIC和其他类别之间的差异表达基因被定义为识别TCGA训练队列中EIC的衰竭免疫分类器基因;应用GSEA来识别富集在EIC中的激活通路和标志基因组

3) 早期TCGA LUSC中EIC的内部验证:采用上述同样的方法对247个早期样本的基于RNAseq的批量表达谱进行NMF和ssGSEA分析;在这些样本中,免疫细胞的比例、白细胞分数、TIL百分比以及多种抑制性受体的表达在EIC和其他类之间进行了比较;使用ssGSEA计算在训练阶段得到的167个衰竭免疫分类基因的富集分数,并将其定义为EIC分数

4) ICB疗法对EIC的预测:TIDE被用来预测潜在的ICB治疗反应;检索黑色素瘤肿瘤表达的公开数据和接受抗PD-1治疗的患者的临床结果,以验证ICB治疗抗性与167个衰竭免疫分类基因之间的关联

5) 对EIC的基因组突变、染色体改变和甲基化特征的分析:评估了体细胞突变的差异,新抗原的数量,以及EIC和其他类别之间拷贝数的改变;使用R 'limma'进行线性模型,以确定在EIC和转录组分析确定的其余类别之间有差异甲基化的重要CpG位点,只选择了位于EIC中与其他类别不同表达基因的启动子区域的不同甲基化的CpG位点

6) 独立数据集中的EIC验证:用无监督随机森林评估衰竭免疫分类器基因的鲁棒性;使用RandomForest R软件包对训练队列进行无监督学习;通过NMF,在另外两个数据集中验证了疲惫免疫分类器基因预测衰竭免疫状态的能力

7) 高度可视化的互动网络应用:使用R "shiny "建立了一个交互式网络应用程序供其他研究人员在多组学水平上探索免疫疗法耐药的潜在机制

8) 蛋白质表达分析:对EIC和其他类别的蛋白质表达进行了比较,鉴定EIC中明显上调的蛋白质;搜索了HPA中的基因,找到了12个LUSC患者样本,这些样本在免疫组化染色图像中具有相应的蛋白质表达数量信息

流程图

三、实验结果

01 - 晚期LUSC中一个新的衰竭免疫类的鉴定和特征描述

        对训练队列中250个晚期LUSC样本的基于RNAseq的基因表达谱进行了NMF分析,训练队列的数据集被有效地分成四个表达簇(图1A)。第2簇中的LUSC患者同时拥有较高的免疫和基质富集分数,表明免疫细胞和基质成分基因表达特征的明显富集,将该组命名为免疫-基质簇(图1B)。免疫-基质簇还显示了免疫细胞特征的明显富集(图1C),包括免疫细胞亚群、T细胞、B细胞、巨噬细胞、三级淋巴结构(TLS)、Tem、th1细胞、细胞毒细胞和T.NK.元基因。为了进一步验证这些免疫细胞在免疫-间质集群中的富集,比较了免疫-间质和其他集群之间的免疫细胞的绝对比例。与我们通过ssGSEA富集分析的结果一致,免疫基质簇中CD8 T细胞、巨噬细胞和B细胞的比例高于其他簇(图1D)。此外,通过DNA甲基化估计的白细胞比例在免疫层集群中明显高于其他集群(图1E)。通过病理图像评估的肿瘤浸润淋巴细胞(TILs)在免疫层集群中明显高于其他集群(图1F)。

        为了探索LUSC中的T细胞衰竭(TEX,进行了多种抑制性受体的表达谱分析,这些抑制性受体在免疫球团内的肿瘤样本中明显上调(图1G)。同时,在免疫性染色体集群内的患者样本显示出多个基因组在识别TEX方面的显著富集(图1H)。

        基于上述抑制性受体的表达分析和TEX信号基因组的富集分数,作者确定了一个新的属于免疫-体细胞群的人群亚群,占训练队列的36.4%(91/250),在此称为耗尽免疫类(EIC)(图1H)。训练队列中的其余亚群组被定义为休息类。为了进一步验证EIC的T细胞衰竭,收集了3个基因签名,这些签名描述了参与TEX调节的三种免疫抑制细胞类型(NK细胞、巨噬细胞和CD4_Treg_细胞),以及4个促进TEX的细胞因子的标志性基因集(图1H)。上述基因组的高富集分数验证了EIC的免疫抑制性TME。

        为了描述EIC的分子特征,基于训练队列的基因表达谱的GESA确定了48条KEGG途径(图S2B)和17个标志基因集(图S2C)在EIC中富集。特别是细胞因子相关的途径和标志,如细胞因子和细胞因子受体相互作用途径、趋化因子信号途径和补体标志(图1 I),在EIC中显著富集。

图S2 耗竭免疫表达模式的识别和特征分析

        作者通过NMF提取了253个代表EIC表达模式的元基因,并通过ClueGO将其归入KEGG路径网络(图1 J),以进一步揭示其分子功能。这些基因大多与细胞因子及其补体有关,而这些补体是介导免疫反应和炎症反应的。转录组学在EIC和其余类别之间的比较确定了167个明显不同的基因,这些基因是上述元基因特异性基因的一部分。这些基因被定义为衰竭免疫分类基因,可用于确认LUSC的衰竭免疫状态,包括165个与免疫抑制有关的上调基因,如趋化因子和趋化因子受体、白细胞介素受体分子、肿瘤坏死因子相关分子、补体相关分子和WNT6。上述分子功能的特征表明,细胞因子相关的表达信号在LUSC的疲惫免疫状态中起主导作用。

图1 EIC的鉴定和分子特征

        为了验证早期LUSC中是否存在衰竭免疫类,对另外247个早期TCGA LUSC样本的基于RNAseq的基因表达谱进行了NMF,随后得到了4个聚类(图2A)。当把由ssGSEA计算出的特征富集分数与大量基于RNAseq的基因表达谱整合在一起时,观察到集群2的基质和免疫富集分数高于其他集群(图2B)。此外,集群2还显示了免疫细胞和其他与TEX相关的细胞因子标志的明显富集(图2B)。因此,集群2被定义为早期TCGA LUSC样本中的衰竭免疫类。与晚期LUSC的EIC一致,早期LUSC的EIC中的样本通过CIBERSORT推算的免疫细胞(CD8 T细胞、巨噬细胞和NK细胞)比例高于其他样本(图2C),白细胞比例更高(图2D),肿瘤浸润淋巴细胞比例更高(图2E)。而且在早期LUSC的EIC中也观察到多种抑制性受体的共调(图2F)。GSEA分析显示,在早期LUSC的EIC中,细胞因子通路和补体标志物明显富集。然而,没有观察到细胞凋亡标志在早期LUSC的EIC中的富集,表明早期LUSC的EIC比晚期LUSC的EIC具有较低的TEX水平。ROC曲线的AUC为0.918(图2H),表明167个耗竭免疫分类器基因在预测EIC方面有良好的表现。

图2 对247个早期(I-II)LUSC样本进行EIC的内部验证

02 - EIC在晚期LUSC的预后较差,且与免疫疗法的抗性有关

        作者通过研究耗竭免疫状态与临床病理变量的相关性来研究其预后价值。研究表明,高密度的TILs与有利的预后相关,如更长的无进展生存期(PFS)或改善的总生存期(OS)。在本研究中,在晚期和早期LUSC中,与其他类别相比,EIC中的TILs比例较高(图1F和2E)。然而,在晚期LUSC中,KM估计显示,EIC内的患者的OS(图3A)和PFS(图3D)明显差于其他等级。使用Cox回归模型的多变量生存分析表明,在晚期LUSC中,EIC被保留为OS的独立预后因素(图3G)。对于早期LUSC,EIC和其他等级的OS和PFS都没有差异(图3B,E)。最后,调查了所有阶段LUSC患者的预后价值。正如预期的那样,EIC患者的OS和PFS都比其他等级的患者差(图3C,F)。这些结果验证了虽然EIC内存在丰富的T细胞,但大多数T细胞处于免疫抑制状态,失去了控制肿瘤进展的效应功能,导致预后较差。生存结果也验证了晚期LUSC的EIC比早期LUSC表现出更严重的T细胞衰竭。

图3 在LUSC的不同阶段,EIC和其他阶层的预后分析

        为了研究EIC内的患者对ICB治疗的反应,比较了EIC和其他阶层的PD-L1表达,发现在早期和晚期LUSC中,EIC的PD-L1表达水平都高于其他阶层(图4A,B)。还使用TIDE算法来预测ICB治疗反应,观察到EIC在早期和晚期LUSC中的TIDE预测得分均高于其余类(图4A,B)。较高的TIDE预测得分通常与较差的ICB反应有关。结果表明,虽然EIC内的患者有较高的PD-L1表达,但他们可能对ICB治疗有抵抗力。

        为了进一步验证EIC的免疫治疗耐药性,根据28名接受抗PD-1治疗的转移性黑色素瘤患者和TCGA的497名所有肿瘤分期的LUSC患者的RNAseq数据计算了167个耗竭免疫分类器基因的富集分数。发现对ICB治疗没有反应的黑色素瘤患者比对ICB治疗有反应的患者具有更高的富集分数(图4C)。EIC内的患者也表现出比其他阶层更高的富集分数,进一步证明了EIC的抗性(图4D),还观察到TGFB1在EIC中的表达水平高于其他阶层(图4E)。这些都说明了EIC的ICB治疗抗性。

图4 预测ICB疗法的抗性

03 - EIC具有独特的甲基化模式和拷贝数改变

        为了探索与EIC中失调基因相关的表观遗传学改变,对TCGA队列中所有肿瘤阶段进行了全基因组甲基化分析,发现与其他类别相比,位于162个免疫相关基因启动子区域的216个CpG位点在EIC中被不同程度地甲基化(图5A,B)。162个基因中共有111个基因的甲基化与基因表达之间有明显的相关性。这表明,EIC显示出特定的甲基化特征,162个基因中的大多数与它们的启动子甲基化明显相关。

        特别是,多个基因受到其启动子甲基化的调控,并参与TGF-β信号通路,该通路在免疫逃避和免疫治疗抗性中发挥重要作用。作者观察到,与其他类相比,ARTN在其启动子区域表现出较高的甲基化水平,在EIC的基因表达水平较低(图5C-E)。相反,转录因子SMAD7可被TGF-β激活以减弱或抑制免疫细胞的激活,在EIC中表现出较低的甲基化水平和较高的表达(图5C-E)。此外,质膜相关的I类肌球蛋白(MYO1G)、C-C Motif Chemokine Receptor 4(CCR4)和干扰素调节因子7(IRF7)也在EIC中过量表达且甲基化程度低(图5C-E)。

图5 LUSC的EIC具有独特的甲基化特征

        作者描述了晚期和早期LUSC中EIC和其余类别的常见突变基因的景观。在EIC和其他类别之间,单个基因突变没有明显差异(图6A,D)。还将体细胞突变和突变的新抗原的负担与LUSC的免疫状态相联系,没有观察到晚期(图6B,C)和早期(图6E,F)LUSC的肿瘤突变或新抗原的负担在两个等级之间的明显变化。这些结果表明,体细胞突变和相关的新抗原与免疫抑制性TME没有明显关联。在本研究中,EIC评分是由ssGSEA根据基因表达谱计算出来的,EIC患者与其他类患者相比,TMB没有差异。因此,研究了EIC评分和TMB之间的相关性。如图6G显示,在晚期、早期和全期的LUSC队列中,EIC评分和TMB之间没有明显的相关性,表明EIC评分可以独立预测免疫疗法的耐药。

        另一方面,观察到EIC的样本显示出较低的细胞带拷贝数改变的负担。具体来说,在晚期(图6H)和早期LUSC(图6L)中,EIC的细胞带扩增数低于其他等级(图6I,M),EIC的细胞带缺失数也较低(图6M)。关于驱动基因的扩增(图6J,N)或缺失(图6K,O),发现这些基因在EIC中的改变频率也比其他类别的低。

图6 EIC与体细胞突变、新抗原和拷贝数改变的关系

04 - 在两个独立的数据集中对新的衰竭免疫类进行外部验证

        为了验证250个LUSC样本的训练队列中是否存在衰竭免疫状态,作者通过使用167个衰竭免疫分类基因进行无监督的随机森林聚类。如MDS图所示(图S3A),大多数患者被成功地分成两个聚类,这与EIC和其余类的分类一致。在两个额外的独立测试数据集(n=127个LUSC样本)中估计了耗竭免疫分类器基因预测免疫衰竭状态的能力。与训练队列相似,在整个测试数据集中,大约30-35%的LUSC样本被成功地识别为EIC。基于基因表达谱,测试数据集的分子特征也验证了EIC表现出较高的免疫和基质富集分数。

        以GSE30219(n=61 LUSC样本)为例,19个LUSC样本被预测为EIC,包含免疫衰竭特征,促进TEX的TGF-β信号通路,IFN特征,以及由NF-kB调节的响应TNF的标志基因(图S3B)。此外,KM生存分析显示,免疫衰竭状态也与预后不良相关(图S3D)。在GSE37745(n=66 LUSC)的另一个例子中,23名患者也显示了T细胞衰竭特征和衰竭分子特征的富集(图S3C)。根据免疫衰竭状态对66名患者进行的KM生存分析表明,66名患者中有23名倾向于预后不佳(图S3E)。

        临床结果与免疫衰竭状态之间的相关性表明,衰竭的免疫细胞不能控制肿瘤的发展,导致生存率下降。通过TIDE对GSE30219和GSE37745的ICB反应的预测也表明,EIC对ICB治疗表现出潜在的抗性(图S3F,G)。

图S3 耗竭免疫类的外部验证

05 - IDO蛋白的表达在EIC中更高

        作者利用LUSC的RPPA数据探讨了EIC和其他类别的蛋白质表达的差异。EIC在晚期(图7A)和早期(图7B)LUSC中表现出明显高于其他类的PD-L1和IDO(吲哚胺-2,3-二氧酶编码的IDO1)蛋白表达,与前述的转录组表达分析一致(图1G和2F)。众所周知,通过免疫组化评估PD-L1蛋白的表达被应用于选择NSCLC患者接受抗PD-1抑制剂治疗。因此,通过HPA的免疫组化染色组织图像研究了不同LUSC患者的IDO蛋白表达。观察到,LUSC患者表现出不同的IDO免疫组化表达量,图7C显示了三个LUSC患者的免疫组织化学表达。三个LUSC患者的IDO表达量不同,分别为小于25%,25-75%,和大于75%。此外,据报道,高IDO活性与NSCLC免疫疗法的原发耐药性有关。这些证据表明,LUSC患者在转录组学、蛋白质组学和染色组织水平上有不同的IDO表达,表明IDO免疫组化表达可能是PD-L1高表达的LUSC免疫治疗耐药的潜在生物标志物。

图7 IDO蛋白在EIC的表达分析

四、结论

        总之,作者发现了一个占大约30%的LUSC患者的免疫抑制类,其PD-L1表达升高,但表现出对ICB治疗的潜在耐药性和TME独特的免疫抑制分子特征。本研究结果为理解ICB治疗耐药的分子机制和为具有不同分子特征的患者量身定做合适的免疫治疗策略提供了新的见解。

你可能感兴趣的:(公共数据挖掘竟然还可以发到15分+?)