3+肿瘤EMT纯生信,热点分析来袭

上皮-间质转化(EMT)是上皮细胞转化为间质细胞的过程,受到诱导因子、转录因子家族和一系列信号通路基因调控,参与肿瘤的侵袭和进展,增加肿瘤对临床干预的耐受。因此,基于EMT相关基因来做肿瘤的分析是多么有有意义啊!今天小编要和大家分享的是今年2月发表在Frontiers in Oncology上的一篇研究胶质瘤EMT的文章。

Genomics and Prognosis Analysis of Epithelial-Mesenchymal Transition in Glioma

胶质瘤中上皮间质转化的基因组与预后分析


 

一. 数据和主要方法

1) 数据的收集

文章收集了来自CGGA的508个样本的临床病理学信息,以及来自TCGA的613个样本的临床病理学信息。

2) EMT相关基因的选择

为了识别EMT相关基因,作者首先从已发表的文献中整理了22个EMT相关的诱导因子、转录因子和信号通路基因。同时作者系统地比较了具有不同临床病理特征的胶质瘤中EMT相关转录特征和信号通路基因的表达,包括LGG和GBM中的IDH状态,LGG中的1p19q状态等。接着利用ONCOMINE平台和人类蛋白图谱(The Human Protein Atlas)数据库进行EMT相关基因的翻译水平的验证。

3) 生物信息学分析

为了探索胶质瘤EMT相关基因的功能,作者使用R包ConsensusClusterPlus 对胶质瘤的表达进行研究,分成不同的簇。

4) EMT基因的注释及差异分析

对不同组中差异表达的基因进行GO和KEGG富集分析。应用GSEA研究不同亚型胶质瘤的相关功能。

5) 建立Lasso回归模型和生存分析

作者使用单因素Cox回归分析对22个EMT相关基因进行筛选确定了14个与生存高度相关的基因,并使用LASSO Cox回归算法开发可能的预后风险评分模型。

二. 主要结果展示

1) EMT相关基因表达模式与病理特征的关系

由于已有研究表明EMT与胶质瘤恶性程度密切相关,所以在文章的第一部分作者系统地研究了胶质瘤WHO分级、IDH状态、1p/19q共缺失状态等病理特征与EMT的关系。从热图1A- G可以看出,大多数EMT诱导因子、转录因子和信号通路基因的表达与WHO水平显著相关。接下来,作者研究了不同级别胶质瘤的EMT相关蛋白中IDH和1p19q的状态,结果发现,在CGGA数据集中,MET、SNAI1等基因在带有wildtype-IDH的LGG和带有mutan - IDH的LGG之间有显著差异(图1H)。同时在图1I的GBM中作者也发现了类似的模式。作者也研究了不同1p19q状态下的差异表达基因(图1J)。在IDH突的LGG中,SNAI1、PDGFB等基因的表达与1p/19q共缺失状态相关(图1K)。接下来为了确定EMT相关基因在胶质瘤患者中的临床意义,作者选择SNAI1、SNAI2等基因,利用Oncomine数据库进行数据挖掘和分析,评估蛋白表达情况(图2A-F)。此外,作者也从人类蛋白图谱数据库(The Human Protein Atlas)中检索到免疫组化(IHC)数据集,展示了EMT相关蛋白的水平(图3A-D)。

3+肿瘤EMT纯生信,热点分析来袭_第1张图片
3+肿瘤EMT纯生信,热点分析来袭_第2张图片

图1 EMT相关基因在不同临床病理特征胶质瘤中的表达


3+肿瘤EMT纯生信,热点分析来袭_第3张图片
3+肿瘤EMT纯生信,热点分析来袭_第4张图片

图2 SNAI1、SNAI2、BIRC5、CXCR4等mRNA水平的Oncomine数据挖掘分析

3+肿瘤EMT纯生信,热点分析来袭_第5张图片

 图3 人蛋白图谱数据库验证显著的EMT相关基因


2) EMT相关基因的一致性聚类将胶质瘤分为两个具有不同病理特征和临床结局的类

在这一部分作者利用EMT相关基因表达的相似性,如图4A-C所示,将CGGA数据集中的508例胶质瘤样本分为EM1和EM2两个亚组。并进一步比较了两个亚组的临床病理特征。EM1亚组在诊断时主要表现为低龄化和低等级(图4E)。而EM2亚组包括诊断时年龄较大并且分级较高。此外,EM2亚组的总生存(OS)较EM1亚组短(图4D)。这些结果表明,这两个簇与恶性胶质瘤密切相关。

3+肿瘤EMT纯生信,热点分析来袭_第6张图片

 图4 EM1/2亚群中胶质瘤的临床病理特征与OS的区别


3) 一致性聚类得到的分类与胶质瘤的恶性程度高度相关

在文章的这一部分作者为了更清楚地了解这22个EMT相关基因之间的相互作用,分析了它们之间的相关性。结果表明,同一信号通路的诱导因子、转录因子、信号通路基因具有显著的相关性(图5A)。采用主成分分析(PCA)比较EM1和EM2亚组的转录谱,结果表明EM2和EM1之间存在显著差异(图5B)。随后,识别出两个亚组间差异表达显著的基因,利用GO和KEGG对其功能进行注释。结果表明,差异表达基因富集结果如图5C、D所示。接着GSEA被用来确定恶性肿瘤的关键特征。结果展示上皮-间质转化等功能与恶性肿瘤相关(图5E)。这些结果说明,这两类肿瘤与胶质瘤细胞的恶性程度密切相关。

3+肿瘤EMT纯生信,热点分析来袭_第7张图片

 图5 EM1/2亚群中EMT相关基因的相互作用与功能注释


4) EMT相关基因的预后价值以及构建风险评分

接着作者为了更好地研究EMT相关基因在胶质瘤中的预后作用,使用单因素Cox回归分析来评估CGGA数据集中22个基因的表达。结果显示,22个基因中有14个与OS显著相关(图6A)。接着以CGGA数据集作为训练集,应用LASSO Cox回归算法表明这14个基因与OS高度相关(图6A-C)。然后,根据最小标准选择七个基因来构建风险特征,并使用LASSO算法得到的系数来确定CGGA数据集中每个样本的风险得分。根据风险评分中位数将患者分为两组,观察到两组患者的OS有显著差异(图6B)。接下来,使用TCGA 数据集作为验证数据集来计算风险评分,观察到两组间的OS有显著差异(图6C)。ROC曲线表明风险评分可以准确预测患者的生存(图6D,E)。接下来,应用风险评分的热图显示,在CGGA数据集中,高风险和低风险患者中7个基因高表达(图6F)。

3+肿瘤EMT纯生信,热点分析来袭_第8张图片

图6 EMT相关基因的风险特征


5) 风险评分具有良好的预后性能并与样本的临床病理密切相关

在这一部分作者对每个临床病理特征进行风险评分分析,发现两组在WHO分类、1p / 19q共缺失状态、年龄等方面存在显著差异(图7A-F)。作者还发现与年龄等相比,风险评分具有更高的预测准确性(图7G,J)。对CGGA数据集进行的多变量Cox回归和单变量分析显示,风险评分、年龄和WHO分级均与OS相关(图7K)。在验证数据集(TCGA数据集)中也得到了类似的结果(图7L)。这些结果表明,EMT相关基因的风险评分是神经胶质瘤患者的独立预后预测指标。接下来,作者分析了风险模型在不同WHO分级中的预后潜力。在WHO II、III级胶质瘤及GBM中,低风险评分亚组与高风险评分亚组的OS存在差异(图7M,O),说明在不同分级的胶质瘤中,风险评分也具有良好的预后价值。

3+肿瘤EMT纯生信,热点分析来袭_第9张图片

图7 RM1/2亚组间风险评分及临床病理特征的比较及不同级别胶质瘤OS的差异


到这里文章的主要内容就介绍完了,文章对胶质瘤中EMT相关基因涉及到的功能,预后意义等做了详细研究,使用了一致性聚类、LASSO Cox回归、单因素分析等生物信息方法,做预后的小伙伴可以借鉴研究涉及到的分析方法以及流程。

你可能感兴趣的:(3+肿瘤EMT纯生信,热点分析来袭)