双CpG位点DNA甲基化特征为LGG患者提供准确的生存风险分层(IF5+)

Genome-wide methylomic analyses identify prognostic epigenetic signature in lower grade glioma

全基因组甲基组学分析确定低级别胶质瘤的预后表观遗传特征

发表期刊:J Cell Mol Med

发表日期:2022 Jan

DOI:  10.1111/jcmm.17101

期刊相关信息

一、背景

        胶质瘤是临床上最常见的原发性脑肿瘤之一,约占所有恶性脑肿瘤的80%。根据WHO 2016年的分级系统,胶质瘤分为低级别和侵袭性高级别胶质瘤,即低级别胶质瘤(LGG)和胶质母细胞瘤(GBM)。尽管LGG的预后相对较好,但70%的患者在10年内会转变为更高等级的肿瘤。

        基于RNA或蛋白质的信息曾被用来确定癌症的生物标志物,如EGFR(和PTEN。然而,由于RNA和蛋白质在癌症生物学和生物标本中的高度动态性,所提供的信息有时是不稳定的,在临床应用中存在着缺陷。鉴于DNA在一段时间内比RNA或蛋白质更稳定,基于DNA甲基化的信息可能更可靠。

二、材料与方法

1.数据来源

1)DNA甲基化数据和LGG患者的相应临床信息、RNA测序(RNAseq)数据来自TCGA数据库;有485577个DNA甲基化位点的514个病例被纳入本研究中;三分之二的病例被随机选为训练队列,以确定和构建预后模型,另外三分之一的病例被作为验证队列

2)郑州大学第一附属医院收集了20个配对的石蜡包埋的人类LGG组织和相匹配的相邻正常组织,并进行了切片,用于免疫组化

3)外部数据集(GSE104293,N=132;GSE10850,N = 185)

2.实验流程

实验流程

三、实验结果

01 、预后性DNA甲基化生物标志物

        通过对来自训练队列的DNA甲基化水平数据进行单变量Cox比例回归分析,共筛选出26183个与OS相关的DNA甲基化位点。这些候选甲基化标记被用来进行多变量的Cox回归分析。最后,选择两个预后生存相关的DNA甲基化位点的组合模型作为生存预测因子。根据其估计的回归系数,计算出每个患者的组合预后风险得分:风险得分=(-6.733×cg00390143的β值)+(-7.902×cg19598875的β值)。与这两个位点对应的基因分别是GALNT9(多肽N-乙酰半乳糖胺转移酶9)和TMTC4(靶向钙粘蛋白4的跨膜O-甘露糖基转移酶)。

        同时,采用Mann-Whitney U检验来比较短生存期(<3年)和长生存期(>3年)组的DNA甲基化水平的差异。结果显示,长期生存的患者表现出明显较高的DNA甲基化水平(图1A,B),这与之前的多变量Cox回归分析结果一致。进一步分析发现,GALNT9在LGG组织中的表达明显较低(图1C),免疫组化分析显示GALNT9基因在LGG组织中低表达(图1D),这与GEPIA数据库的结果一致。

图1    短生存期和长生存期患者的OS和甲基化水平

02 、两个CpG位点DNA甲基化特征与OS之间的关联

        以风险分数为连续变量的Cox回归分析显示,在训练队列和验证队列中,两个CpG位点DNA甲基化特征与患者的OS均有明显关系。使用中位风险评分(-6.95)作为截断值,将患者分为高风险和低风险组。采用K-M曲线和Log-rank检验来评估和比较不同组别中患者的OS。结果显示,这一特征能够将患者明显地分为高风险组和低风险组,而风险分数较高的患者表现出较短的OS(图2A)。为了检验这一预后指标,计算了验证队列中患者的风险分数,并观察到类似的结果,即高风险患者的OS较差(图2B)。作者进行了时间依赖性的ROC分析,通过使用分类变量计算出与甲基化特征相比,OS<3年的AUC值。在训练组和验证组中,AUC值均超过0.90(图2D),显示该特征在预测预后方面具有良好的鉴别能力。这些结果表明,双CpG位点DNA甲基化特征在临床应用中具有很大的潜力,可以作为一个可靠的预后生物标志物。

图2    Kaplan-Meier曲线和Log-rank检验

        为了进一步评估该特征的预后潜力,下载了一个额外的数据集(GSE104293,N=132)。K-M分析表明,风险评分大于训练队列中的风险评分的患者的无进展生存期(PFS)明显短于低风险评分的患者(图2C)。AUC估计值为0.736(图2D),表明该特征也是其他独立队列中LGG患者预后的一个有效预测因素。

03 、2-CpG位点特征在OS预测中与临床和病理因素的独立性

        临床因素,如性别、年龄、肿瘤等级、癌症家族史或IDH突变状态都会影响患者的生存。为了分析特征的独立性和适用性,作者根据不同的临床病理特征对患者进行了重新分组。首先,年龄是癌症风险最大的单一预测因素之一,作者发现初始诊断年龄与OS之间存在明显的负相关(图3A),将患者分为两个亚组(小于45岁与45岁或以上)。K-M分析表明,高危组患者的OS与低危组患者相比要差得多,ROC分析证实2-CpG位点特征具有很高的预测性能(图3B,C)。其次,以往的研究表明,胶质瘤患者的发病率和结局都存在性别差异,男性的发病率和死亡率都高于女性,在本实验中根据患者的性别进行了重新分组。结果显示,低风险评分的患者有明显的较长的OS,AUC值>0.90(图S2),表明2-CpG位点特征是独立于患者的性别。

图3

        众所周知,胶质瘤的恶性程度随WHO等级不同而不同。虽然在疾病进展方面有明显的结果差异,但它在高危组和低危组患者的OS上有明显的差异,G2和G3组的AUC值分别为0.878和0.912。同时,LGG由星形细胞瘤、少突胶质瘤和混合型少突胶质瘤组成,星形细胞瘤患者的预后一般比少突胶质瘤患者差。在这里,无论组织学亚型如何,2-CpG位点特征都能很好地区分低风险组和高风险组,高风险组的患者往往有较差的OS(图S4)。异柠檬酸脱氢酶(IDH)突变状态是LGG的一个已知的预后指标,与IDH1野生型相比,IDH突变的患者表现出有利的生存结果。在这里,发现在TCGA队列和另一个GEO数据集(GSE10850,N = 185)中,IDH状态的AUC值分别为0.750和0.668,表明在预测OS方面,2-CpG位点特征可能比IDH状态具有更高的性能。然后研究了该特征是否可以用来区分不同IDH突变状态的患者的生存风险,发现可以区分低风险或高风险的患者,无论他们是否有IDH突变(图S5)。此外,根据是否给予放疗将患者分为亚组,结果发现2-CpG位点特征的预测性能与患者是否接受辅助放疗之间没有关联。家族史也是胶质瘤的一个重要危险因素,胶质瘤患者的一级亲属患胶质瘤的风险明显增加(图S6)。这里,有132名患者有癌症家族史。无论家族史如何,该特征都有助于将患者区分为具有不同结果的亚组(图S7)。

图S2-S7

        此外,还进行了分层分析,分别使用2-CpG位点特征风险评分和年龄或性别或WHO分级或组织学亚型或IDH突变状态作为协变量。结果表明,2-CpG位点特征、2-CpG位点特征以及作为协变量的临床因素在回归模型中没有显着差异,表明2-CpG位点特征可作为一个独立的预测因素。

04、2-CpG位点特征与其他已知的预后标志物的比较

        最近,已经确定了几个LGG的预后标志物。例如,NF-κB已被确定为LGG的OS和恶性PFS的独立预测因素。PD-1启动子甲基化已被证明是弥漫性LGG IDH突变患者的一个预后因素。有研究发现,21种mRNA的表达水平可以作为LGG患者的预后生物标志物进行组合。为了将本研究预后特征与已知模型进行比较,作者在TCGA验证和GEO数据集中对2-CpG位点特征和其他模型进行了时间依赖的ROC曲线分析。结果显示,在TCGA验证队列(图4A)和GEO队列(图4B)中,我们的特征比几乎所有其他已知模型(包括所有临床因素、mRNA标记、DNA甲基化标记)的AUC值都高,说明2-CpG位点特征在预测LGG患者的OS方面有令人满意的效果。

图4

        最近,使用针对程序性细胞死亡1(PD-1)、程序性细胞死亡配体1(PD-L1)、程序性细胞死亡配体2(PD-L2)和细胞毒性T淋巴细胞相关蛋白4(CTLA-4)的免疫检查点阻断(ICB)的癌症免疫疗法在癌症中提供了显著的临床效益。铁死亡是一种新发现的与癌症有关的细胞死亡类型,并在癌症进展和治疗期间发挥重要作用。在此,为了进一步研究甲基化特征在ICB治疗和癌症进展中的可能作用,对这些已知的免疫治疗相关基因、铁死亡调节基因和两个CpG位点DNA甲基化特征进行了一对一的相关分析。结果显示,免疫检查点分子PD-1、PD-L1、PD-L2和CTLA-4共同表达,2-CpG位点特征与PD-1、PD-L1、PD-L2和CTLA-4明显正相关(图4C和图S8)。对于铁死亡调节基因,DNA甲基化特征与HSPB1、HSPA5、DPP4、TFRC、SAT1、SLC1A5、FANCD2、ATP5MC3、SLC7A11、NFE2L2显著正相关,而与ACSL4、CISD1、RPL8、FDFT1、NCOA4显著负相关(图4C)。这些结果意味着2-CpG位点DNA甲基化特征可能在衡量ICB免疫疗法的反应性和肿瘤的发生和发展中起作用。

图S8    两种DNA甲基化风险评分与ICB免疫疗法相关特征之间的相关性

05、 GO和KEGG分析2-CpG位点DNA甲基化特征中与两个基因相关的基因

        相关性分析显示,2736个基因与GALNT9和TMTC4显著相关,其中688个基因与这两个基因显著正相关。GO富集分析显示,这些被筛选的基因主要富集于细胞内信号转导、生物过程调控和对刺激的反应。KEGG通路的富集分析表明,这些被筛选的基因主要集中在代谢通路、吞噬体、MAPK信号通路、B细胞受体信号通路、Rap1信号通路上(图S9A)。Reactome通路分析显示,参与免疫系统、中性粒细胞脱颗粒、Rho GTPases或白细胞介素的信号传导和细胞周期的基因占优势(图S9B)。对高危组和低危组中明显差异表达的基因集富集分析显示,几个与癌症相关的途径,包括ECM受体相互作用、细胞粘附分子CAMs和细胞因子细胞受体相互作用,在高危组中富集,意味着该特征可能参与了与转移相关的途径(图5)。

图5    基因集富集分析显示TCGA队列中与风险评分相关的生物途径和过程
图S9    KEGG和Reactome路径富集分析结果

四、结论

        本研究通过分析TCGA和GEO的DNA甲基化数据,发现并验证了一个双CpG位点DNA甲基化特征。该特征与LGG患者的OS有明显关系,并能根据生存风险区分患者的预后。该特征将有助于改善风险分层,为临床个体化提供更准确的评估。除了作为生物标志物外,这些DNA甲基化位点还需要进一步详细研究,以确定其机制并阐明它们如何影响患者的结果。

你可能感兴趣的:(双CpG位点DNA甲基化特征为LGG患者提供准确的生存风险分层(IF5+))