DNA甲基化癌症预后分型

随着新春佳节的临近,大家的心是否已经蠢蠢欲动坐立难安了呢,估计也有很多小伙伴是沉醉科研不能自拔。今天小编给大家介绍的是2019年12月发表在Aging(IF 5+)上的一篇关于结肠腺癌(COAD)患者预后的文章。肿瘤的异质性给结肠腺癌的早期诊断和有效治疗带来了困难,而DNA甲基化作为基因表达的重要调控因子,会影响肿瘤的异质性,所以在这里作者基于DNA甲基化的分子亚型预测结肠腺癌患者的预后。

Molecular subtypes based on DNA methylation predict prognosis in colon adenocarcinoma patients

基于DNA甲基化的分子亚型预测结肠腺癌患者的预后


一.材料和方法

1.1 数据:作者在TCGA上下载了结肠腺癌的RNA-seq数据,在 UCSC Cancer Browser上下载甲基化数据,最终得到了424例结肠腺癌样本的表达信息、 DNA 甲基化状态以及临床信息。

1.2 使用COX比例风险回归模型来确定分类特征。

1.3 使用一致性聚类识别与预后相关的分子亚型。

1.4 生存以及临床特征分析。

1.5 功能富集分析以及基因注释。

1.6 构建以及检验预后预测模型。

二.研究的主要结果与内容

2.1 识别与OS相关的潜在预后甲基化位点

在文章的第一部分作者首先对与结肠腺癌生存相关的甲基化位点进行了研究。作者先对获取的数据进行预处理,然后将样本分为两组,分别为训练集以及验证集。然后使用单因素cox分析筛选与结肠腺癌预后显著相关的甲基化位点。接着进行多因素分析来研究临床特征以及甲基化位点对结肠腺癌生存的影响,最终筛选出356个潜在的与结肠腺癌生存有关的CpG位点。

2.2 一致性聚类识别不同的DNA甲基化预后亚组以及类间预后分析

在这一部分作者使用一致性聚类对之前得到的预后相关的DNA甲基化进行分型,分型的筛选标准如图1所示。一致性聚类结果以及DNA甲基化与临床因素的热图如图2所示。最终得到七个类,这七个亚型与生存之间的关系以及每种临床因素与亚型之间的关系如图3所示。

DNA甲基化癌症预后分型_第1张图片

图1 亚型数目的筛选标准


DNA甲基化癌症预后分型_第2张图片

图2 一致性聚类结果以及热图


DNA甲基化癌症预后分型_第3张图片

图3 预后比较以及临床特征与亚型之间的关系


2.3识别不同DNA甲基化亚型的特征以及筛选亚型特异的甲基化位点

在这一部分作者首先对筛选的预后相关的CpG位点进行基因组注释,接着对涉及到的基因进行功能富集分析,功能富集分析结果如图4A所示。接着作者使用Enrichment Map Cytoscape 插件对18条通路进行分析,计算Jaccard系数和重叠系数,分析通路间的两两关系。如图4B所示,当Jaccard系数为>0.375时,通路与细胞周期、p53信号通路之间存在密切关系。作者之后探索了亚型中基因在训练集中的表达方式,结果如图4C所示。接着作者筛选亚型特异的甲基化位点,最终筛选出的甲基化位点如图5A所示,也对CpG位点进行了功能富集,功能富集结果如图5B所示。也可以看出亚型4具有最多的特异位点,甲基化水平最低(图6)。

DNA甲基化癌症预后分型_第4张图片

图4 甲基化位点的基因组注释

DNA甲基化癌症预后分型_第5张图片

 图5 亚型特异的CpG位点分析

DNA甲基化癌症预后分型_第6张图片

 图6 每个亚型的甲基化水平


2.4构建评估COAD预后预测模型

在文章的最后一部分,作者构建了一个结肠腺癌的预后预测模型并对模型进行了评估。作者首先选择了亚型4作为种子,因为亚型4包括的样本数目最多并且与好的预后有关。亚型4有18个特异性甲基化位点,均为低甲基化。然后对所有均获得了这18个特定位点的样本的甲基化谱使用层次聚类分析对它们重新进行聚类。将样本分为高甲基化组和低甲基化组,如图7A所示。预后分析显示两组间存在显著差异(图7B),这提示这些特异性甲基化位点可能作为预后标志物。作者使用这些甲基化位点结合cox风险比例回归模型建立了一个风险得分,得分的ROC曲线如图8A所示。风险得分与甲基化水平的关系如图8B所示。高低风险得分的生存分析结果如图8C所示。接着作者在检验集中将样本根据风险得分进行排序,得到的热图如图9A所示。接下来作者根据得到的风险得分将检验集样本分成高低风险组,进行生存分析结果如图9B所示,充分证明了预后模型效能的有效性。

DNA甲基化癌症预后分型_第7张图片

图7 甲基化位点可以预测结肠腺癌的预后

DNA甲基化癌症预后分型_第8张图片

 图8 在训练集中构建预后预测模型

DNA甲基化癌症预后分型_第9张图片

 图9 在检验集中观察预后模型的稳定性

你可能感兴趣的:(DNA甲基化癌症预后分型)