纯生信分析 | 肺腺癌中焦亡相关特征的鉴定,为癌症免疫治疗提供新思路

Comprehensive molecular analysis of a four-pyroptosis-gene signature with prognosis and immune landscape in lung adenocarcinoma

肺腺癌中具有预后和免疫景观的4-焦亡基因signature 的综合分子分析

发表期刊:Genomics

发表日期:2022 Mar 29

DOI:  10.1016/j.ygeno.2022.110355

期刊相关信息

一、背景

        肺癌是中国和世界各地最常见的癌症类型,也是癌症相关死亡的主要原因。腺癌(LUAD)是肺癌最常见的诊断亚型,约占所有肺癌的40%。尽管近年来肺癌治疗取得了显著进展,如分子靶向治疗和免疫检查点抑制剂(ICIs),但肺癌的5年生存率仅为17%。因此,确定一个可以预测肺癌预后的标志物至关重要。

        细胞焦亡(Pyroptosis)又称细胞炎性坏死,是一种程序性细胞死亡,主要表现为细胞不断胀大直至细胞膜破裂,导致细胞内容物的释放进而激活强烈的炎症反应。细胞焦亡是机体一种重要的天然免疫反应,在抗击感染中发挥重要作用。 细胞焦亡是由 gasdermin 介导的细胞程序性坏死。细胞焦亡与包括恶性肿瘤在内的多种人类疾病密切相关。 一方面,细胞焦亡导致许多信号通路和炎症介质的释放,这些信号通路和炎症介质与致癌和化疗耐药有关。另一方面,细胞焦亡作为一种细胞死亡,可以预防癌症的发生和进展。然而,LUAD 中细胞焦亡相关基因的表达模式和临床意义尚未确定。

二、材料与方法

1.数据来源

(1).TCGA中526名LUAD患者的RNA-seq和临床数据作为训练集

(2).GEO中GSE72094的442例,GSE13213的107例,GSE42127的133例,GSE68465的442例,GSE31210的226例,GSE37745的106例数据作为独立的验证集,对这些GEO数据集的每个mRNA表达数据进行Log2转化和分位数归一化,并以平均表达量作为基因表达量。

2.实验流程

(1)鉴定焦化病相关的差异表达基因(DEGs)并进行无监督聚类:从早期的综述和GSEA数据集中提取了51个与细胞焦亡相关的基因;使用 "limma "R软件包确定焦亡相关的DEGs;使用无监督聚类算法对患者样本进行分类。

(2)药物敏感性:从CellMiner下载了两个名为“RNA:RNA seq”和“化合物活性:DTP NCI-60”的文件

(3)四个焦亡相关基因的鉴定和特征生成:从TCGA验证集中选择DEGs进行单变量cox回归分析;采用LASSO和多变量cox回归分析来缩小候选基因的范围并构建预后模型

(4)通路和功能富集分析:通过 "clusterProfiler "R软件包对DEGs进行GO和KEGG分析;进行GSEA分析

(5)LUAD的免疫景观分析:利用多种分析方法估计高风险组和低风险组的免疫细胞浸润情况,包括TIMER、CIBRESORT、QUANTISEQ、MCPcounter、XCELL和EPIC;ESTIMATE算法被用来估计恶性肿瘤中基质细胞和免疫细胞的含量,并推断出肿瘤的纯度,计算出免疫评分和基质评分

(6)肿瘤免疫功能紊乱和TIDE分析

三、实验结果

1.正常组织和肿瘤组织之间的DEG的鉴定

        通过比较TCGA数据集中正常和恶性组织之间51个焦亡相关基因的表达水平,在LUAD中确定了41个DEGs:12个基因下调,29个基因上调(图1A-B)。此外还研究了体细胞拷贝数变异(CNVs),观察到CNVs在所有与焦亡相关基因中都很常见。GPX4、NLRP7、ELENE、NLRP6、CASPS3和CHMP7普遍增加,而GSDMC、GSDMD、NLRP3、GSDME、GSDMA、GADMB和IL6则大幅下降(图1C)。GSDMC、AIM2、GSDMD、NLRP3、GSDME、GSDMA、GADMB等焦亡相关基因的CNV增益导致LUAD样本的表达水平升高,而包括IRF1、ELANE、NLRP1等焦亡相关基因的CNV缺失导致表达水平明显下降,这意味着CNV可能调节mRNA的表达。然而,几个有CNV增益的焦亡相关基因,如IL-6、IL-1β和TNF,显示mRNA下调,而其他有高频率CNV丢失或增益的热化相关基因在癌症和正常样本之间的表达没有差异。这些焦亡相关基因在染色体上的CNV改变位置见图1D。561个样本中,有327个发生了基因改变,主要包括错义突变、无义突变和多发突变。在焦亡相关的DEG中,TP53的突变频率最高,其次是NLRP3(图1E)。此外,探讨了对重要的焦亡相关DEGs敏感的化学药物,发现有许多药物对GSDM家族敏感,如吉非替尼、米多罗林、硼替佐米、维索代尼(图1F)。

图1    41个与焦化作用有关的DEGs的表达和它们之间的相互作用

2.基于焦亡相关DEG的肿瘤分类

        无监督聚类算法被用来对LUAD患者进行分类。发现通过将聚类变量(k)从2增加到9,当k=2时,组内相关性最高,组间相关性最低,说明患者可以很好地被分为两个分子亚型(图2A)。大多数与焦亡有关的DEGs在集群A亚型中低表达,但在集群B亚型中大量表达(图2B)。重要的是,两种分子亚型的K-M曲线显示出明显的差异(图2C)。

图2    基于焦亡相关DEG的肿瘤分类

3.两种不同的肿瘤分子亚型揭示了不同的生物过程、TME和免疫景观

        为了探索这两种肿瘤分子亚型之间的生物学行为,作者进行了GSVA富集分析和单样本富集分析(ssGSEA)。如图3A所示,49条信号通路在Cluster B中明显富集,这些通路与细胞死亡、细胞生命活动和机体代谢有关。这些通路在B群亚型中明显富集,可能也是其预后不佳的重要原因。TME可以影响肿瘤患者的免疫状态,进而影响他们对免疫疗法的反应。因此,用ssGSEA研究了这两个亚型中16种不同类型的免疫浸润细胞和13种免疫途径的相对丰度。研究结果显示,多种抗肿瘤和免疫抑制细胞和免疫途径在ClusterB亚型中富集,包括CD8+T细胞、NK细胞、TIL、促进炎症的信号和HLA(图3B)。此外,Cluster B亚型显示出较高的基质评分、免疫评分和较低的肿瘤纯度(图3C-F)。正如预期的那样,大多数免疫检查点在Cluster B亚型中明显表达,如著名的免疫疗法生物标志物PD-L、PD-L1和CTLA4(图3G)。

图3    不同分子亚型中富集的生物途径和免疫景观

4.构建基于焦亡的特征

        首先,确定了11个与LUAD预后相关的焦亡相关基因供进一步研究(图4A)。接下来,进行Lasso回归分析以缩小候选基因的范围(图4B-C)。最后,构建了一个4-焦亡相关基因特征,风险得分按以下公式计算:风险得分=-0.08983*NLRP7-0.0120*CASP1-0.0645*PLCG1-0.0598*NLRP1。这个基于4-焦亡相关基因特提供了两个最佳的患者亚组,具有明显的生存差异和良好的模型适用性。热图显示这四个基因在高风险组的表达水平较低,但在低风险组的表达水平较高(图4D)。此外,低风险组的大部分样本属于A群亚型,而高风险组的样本属于B群亚型,表明根据风险评分的临界值进行分组是合适的(图4D)。此外,高危组的死亡率高于低危组(图4E)。当风险评分与细胞焦亡基因GSDMD和GSDME进行比较时,发现与GSDMD和GSDME的表达呈负相关,而低风险组这两个基因的患病率高于高风险组(补充图S2)。PCA和tSNE分析结果显示,风险评分可以有效地将LUAD患者分为两组(图4F),这在6个GEO验证数据集中得到了验证。K-M曲线显示,高风险组和低风险组之间的OS有很大差异,无论患者是处于早期阶段(I或II)还是晚期阶段(III或IV)(图4G-I)。然而,通过ROC工具来评估模型的敏感性和特异性,注意到1年、2年和3年的ROC曲线下的面积分别只有0.579、0.56和0.617。为了证明该特征的分层能力,调查了不同临床亚型的OS,发现无论患者是老年还是年轻,男性还是女性,有无吸烟史,处于N0还是N1-3期,低风险组的OS都优于高风险组。

图4     基于TCGA数据集构建焦亡相关的基因预后模型

        作者采用六个GEO数据集进行外部验证,以验证风险模型的预测能力。六个GEO验证集中的患者根据其风险评分的临界值被分为两组。同样,在GSE72094、GSE13213、GSE42127、GSE68465、GSE31210和GSE37745中,高危组的死亡比例更高(图5A-F)。此外,作者使用基于这七个独立数据集(n = 1782)的预后荟萃分析,以确定这些公共队列中与焦亡相关特征的预后意义。这种焦亡特征是LUAD患者的危险因素(图5G)。

图5    GEO数据集验证

        作者还进行单因素和多因素Logistic回归分析,以确认这种4-pyroptosis-gene signature是否受到其他临床参数的影响,结果显示风险评分可能是一个独立的危险因素。(表1)

表1

5.    4-pyroptosis-gene signature的生物途径

        鉴于4-pyroptosis-gene signature在对LUAD患者分类方面的展现的强大功能,作者进一步研究了生物途径,在这两个风险组中得到2509个差异表达的基因,这些基因与风险评分呈负相关(图6A)。此外,利用GO和KEGG分析这些被选中的基因,发现它们在许多免疫相关的途径中明显富集,如适应性免疫反应、淋巴细胞介导的免疫、B细胞介导的免疫、Th1、Th2和Th17细胞分化等,如图6B和C所示。在GSEA分析中也验证了类似的结果,显示多种免疫学途径与风险评分相关,在低风险组中富集程度很高(图6D-E)。

图6    基于4-pyroptosis-gene signature的生物学途径和功能

6.     4-pyroptosis-gene signature的炎症和免疫学特征

        鉴于确定的特征与一系列的免疫途径密切相关,作者进一步研究了这两个亚组之间的免疫景观。首先,应用多种方法来估计免疫细胞。如图7A所示,热图描述了免疫细胞浸润的情况。低风险组的B细胞和CD8 T细胞的比例较高,而高风险组的CD4 T细胞、巨噬细胞M2、自然杀伤细胞和中性粒细胞的比例较高(图7A)。除此之外,还研究了骨髓源性抑制细胞(MDSC)和肿瘤相关巨噬细胞M2(TAMM2)细胞与风险评分的关系,发现这两种细胞在高危组中高表达,与风险评分有明显的负相关。当进一步研究LUAD的TME时,发现低风险组的基质评分、免疫评分、ESTIMATE评分和干性评分较高,但肿瘤纯度较低(图7B-F)。然后,用GSVA分析模拟了七个免疫炎症元基因的相应结果。热图描述了七个元基因中每个基因的表达情况(图7H)。与高风险组相比,七个炎症元基因在低风险组中明显富集,与风险评分有很大的负相关(图7I)。Vesteinn Thorsson等人将恶性肿瘤分为六种免疫亚型,包括伤口愈合型、IFN-γ主导型、炎症型、淋巴细胞型、免疫静息型和TGF-β主导型。当比较高危组和低危组的不同免疫亚型时,发现低危组有更多的IFN主导型和TGF主导型免疫亚型,而高危组有更多的炎症型和伤口愈合型免疫亚型(图7J)。

图7    LUAD中基于焦亡特征的免疫景观

7.免疫治疗的4-pyroptosis-gene signature与生物标志物的关系

        鉴于基于细胞焦亡特征在肿瘤免疫炎症和肿瘤免疫微环境中的重要性,作者深入研究了该特征与免疫治疗反应之间的关系。首先分析了不同亚组中的免疫检查点基因富集,发现低风险组中有许多基因被富集(图8A)。TIDE是比TMB和免疫检查点更准确的生物标志物,因为它反映了肿瘤免疫逃逸的两种基本机制:显著细胞毒性T淋巴细胞(CTL)侵袭的肿瘤中的T细胞功能障碍,低CTL水平癌症中的T细胞排斥。T细胞功能障碍评分和T细胞排斥评分是根据给定基因集中基因的表达水平计算的,在预测免疫检查点阻滞(ICB)反应方面具有很高的准确性。结果显示,基于焦亡的风险评分与TIDE评分和T细胞排除评分呈正相关(图8C,E),而与T细胞功能障碍评分,Merck 18,PD-1,PD-L1和CTLA4呈负相关(图 8G,I,K,M)。

图8    焦亡特征与免疫治疗反应之间的关系

8.焦亡相关特征与其他生物标志物的预测能力并构建nomogram

图9    比较与其他预后生物标志的预测能力,并在TCGA队列中构建nomogram

四、结论

        研究通过描述LUAD中4-pyroptosis-gene signature的表达谱和临床特征,提供了有关免疫微环境和免疫治疗反应的重要信息。这是LUAD首次提出细胞焦亡风险模型,这为选择ICI的新候选药物和为未来的LUAD患者提供适当免疫治疗的可能性。

你可能感兴趣的:(纯生信分析 | 肺腺癌中焦亡相关特征的鉴定,为癌症免疫治疗提供新思路)