纯生信分析套路 甲基转移酶相关因子的预后分析

今天跟大家分享的是2020年4月底发表在Frontiers in Oncology(IF: 4.85)上的一篇文章,有套路(分型-筛marker-预后模型构建,简单吧),只是关注的点变成甲基化转移酶相关因子。甲基化是一种可逆修饰,调控这种修饰的蛋白质和基因可以作为肿瘤治疗的候选靶点。然而,在胶质瘤中甲基转移酶相关基因的特征尚不清楚。本文主要是基于TCGA数据和中国胶质瘤基因组图谱RNA测序数据集,通过一致性聚类和cox风险回归模型等常用的生物信息学方法系统分析甲基转移相关基因表达与胶质瘤患者预后的关系,构建出一个甲基转移基因相关的胶质瘤预后标志。整体而言,是一篇套路满满的生物信息学文章。


Clinical and Biological Significances of a Methyltransferase-Related Signature in Diffuse Glioma 

甲基转移酶相关特征在弥漫性胶质瘤中的临床和生物学意义

1.数据

本文所需数据主要来自于TCGA和CGGA数据库中的基因表达数据以及相应的临床和相应分子特征。甲基转移酶相关基因来自于MSigDB数据库。


2.基于甲基转移相关基因对胶质瘤进行分类

基于TCGA数据中样本改变程度最高的50个甲基转移相关基因进行一致性聚类,可以将患者分为两个明显不同的类别(图1A C),两类在预后,级别,IDH突变等临床和分子特征上存在显著差异,两个聚类的热图如图1D,预后如图1E所示,这些结果表明甲基转移相关基因与弥漫性胶质瘤的恶性程度和预后有关。

 图1. 基于甲基转移相关基因对胶质瘤进行分类


3.弥漫性胶质瘤中甲基转移相关基因预后标志的构建

基于单因素Cox回归分析识别出TCGA数据中65个预后相关基因,并通过lasso回归算法(图2A,B)对基因进行降维,最终识别出由12个基因构成的预后特征。根据患者的表达水平和回归系数计算患者的风险评分(图2B,C),以中位数为阈值,将患者分为高危组和低危组。两组患者在年龄,等级,IDH突变状态等多种临床和分子特征中存在差异。在CGGA验证数据中可以观察到在两类患者中存在相似差异。

 图2.基因预后标志的构建


4.预后风险评分与胶质瘤的病理特征有关

通过对风险评分与患者病理特征关联的研究,可以观察到按不同临床和分子特征(IDH状态,WHO评分,亚型等,图3A-J)对患者进行分组时,患者的风险评分存在显著差异。随后,并通过ROC曲线评估风险评分在预测病理特征时的特异性和敏感性(类别,IDH状态,1p/9q状态,图3K–M)。风险得分可以较好地预测TCGA和CGGA数据集中样本类别,IDH状态和1p/9q状态。

 图3.预后风险评分与胶质瘤的病理特征


5.预后风险评分与胶质瘤的预后有关

根据级别,IDH突变状态,MGMT启动子状态等常用临床和分子特征对患者进行细分,发现在表现出特定分子特征的患者中,风险评分同样可以将患者分为高低风险组两类,两类患者预后存在差别。

 图4. 5.预后风险评分与胶质瘤的预后


6.预后风险评分是独立的预后标志

基于单因素和多因素Cox分析评估风险评分是否为一个独立的预后指标。如图5A所示,诊断年龄、WHO分级、风险评分等因素与胶质瘤患者总体生存(OS)存在统计学相关。其中,诊断年龄和风险评分是TCGA数据集中胶质瘤患者OS的独立预后指标(表3,图5A)。与传统因素年龄和等级相比,风险评分在TCGA数据集中对3年和5年生存的预测都更为准确(图5B,C)。在CGGA数据中可以观察到相似结果。

 图5.预后风险评分是独立的预后标志


7.预后标志的生物学特性及通路分析

基于皮尔斯相关分析识别出表达与风险评分呈正相关或负相关的基因,分别对这两类基因进行GO和KEGG富集分析,结果如图6所示,这些通路或生物学过程被认为与甲基转移或胶质瘤预后相关。

 图6. 预后标志的生物学特性及通路分析


总结

文章内容大概就是这些,让我们最后来总结下吧。研究者先是通过50个高度可变的甲基转移相关基因表达对患者进行一致性聚类,两类患者在临床和分子特征上存在显著差异,表明甲基转移相关基因与弥漫性胶质瘤的恶性程度和预后有关。接着,通过单因素cox回归分析和lasso模型对甲基转移相关基因进行降维,构建出12基因的预后标志,该标志是独立的预后标志,并且与胶质瘤的病理特征和预后特征息息相关。

这篇文章虽然简单套路了一些,但是行文非常流畅,每一步和上一步之间均存在起承关系,完整性很高,值得我们学习。

今天的文献解读到这里就结束了,让我们下次再见吧。

你可能感兴趣的:(纯生信分析套路 甲基转移酶相关因子的预后分析)