医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因

​胶质母细胞瘤(GBM)是最致命的脑肿瘤之一。,平均生存率为35.7%(1年),4.7%(5年),中位总生存率(OS)为14.6个月。在TCGA数据库中,根据全球基因表达谱,GBM最初分为四种亚型:proneural、neural、classical和mesenchymal。在这些亚型中,神经亚型由于缺乏肿瘤的内在特征而不再被认为是一个主要的亚型。

肿瘤细胞内基因,尤其是主转录因子决定了GBM的发生、发展和进化。另一方面,肿瘤微环境也被报道对肿瘤组织基因表达有重要影响,从而影响临床结果。在肿瘤微环境中,免疫细胞和基质细胞是两种主要的非肿瘤成分,对肿瘤的诊断和预后评估具有重要价值。

癌症基因组图谱(TCGA)数据库,可以进行大规模的全球基因表达谱分析和数据库挖掘,以了解基因与包括GBM在内的各种恶性肿瘤的潜在相关性。已有研究表明,肿瘤微环境细胞、免疫细胞和基质细胞浸润程度对预后有重要影响。基于ESTIMATE 算法计算的immune评分和间质评分可以方便地量化肿瘤中的免疫和间质成分。为了更好地了解参与免疫和间质细胞的基因对预后的影响,作者在TCGA数据库中根据GBM患者的免疫/间质评分将GBM患者分为高和低两组,并确定了差异表达的基因,其表达与GBM患者的预后显著相关。功能富集分析和蛋白-蛋白质相互作用网络进一步表明,这些基因主要参与免疫应答、细胞外基质和细胞粘附。最后,作者在来自中国胶质瘤基因组图谱(CGGA)的一个独立的GBM队列中验证了这些基因。因此,作者获得了一系列与肿瘤微环境相关的基因,这些基因可以预测GBM患者的不良预后。

在Nat Commun. 2013,题目是:Inferring tumour purity and stromal and immune cell admixture from expression data. 本研究者开发了一个基于表达信息的肿瘤纯度判定算法,Estimation of STromal and Immune cells in MAlignant Tumours using Expression data’ (ESTIMATE) 主要是基于ssGSEA,对 stromal and immune 两个基因集进行打分。

今天我们来讲一篇IF: 4.8670的文章,题目:Mining TCGA database for genes of prognostic value in glioblastoma microenvironment

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第1张图片

作者从TCGA数据库下载了1989年至2011年间所有417例GBM初次病理诊断患者的基因表达谱和临床资料。其中女性165例(39.6%),男性248例(59.5%),性别不明4例(0.96%)。病理诊断为经典型128例(30.7%),间叶型122例(29.3%),神经型64例(15.3%),前神经型103例(24.7%)。

根据ESTIMATE 算法, stromal评分范围为-3055.72 ~ 2016.62,immune评分范围为-1448 ~3210.47。

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第2张图片

在4种亚型中,mesenchymal subtype  患者的平均immune评分最高,其次为neural subtype和classical subtype。proneural subtype病例的immune评分最低。类似地,从高到低的各gpm亚型间 stromal评分的等级顺序为mesenchymale>neuro>classical >proneal,表明immune评分和 stromal评分在亚型分类的相关性中均有意义。

根据2016年WHO分类,IDH1突变预测GBM预后较好。根据GBM患者IDH1基因突变情况,绘出immune评分和 stromal评分的分布情况。IDH1突变病例的immune评分和 stromal评分较低,但统计学意义不大。

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第3张图片

为了找出总体生存率与immune评分和/或 stromal评分的潜在相关性,作者根据评分将417例GBM患者分为上下两半(高分组和低分组)。Kaplan-Meier生存曲线显示immune评分低分组患者的中位总体生存时间长于immune评分高分组病例。与 stromal评分较高的患者相比,stromal评分较低的患者的中位生存时间也较长,尽管在统计学上没有统计学意义。

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第4张图片
医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第5张图片

为了揭示全球基因表达谱与免疫评分和/或基质评分的相关性,作者比较了TCGA数据库中所有417例GBM患者的Affymetrix芯片数据。以immune评分为基础进行比较,得分高的组有480个基因上调,得分低的组有127个基因下调。同样,基于stromal评分的高组和低组中,高评分组380个基因上调,25个基因下调。

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第6张图片

Venn图(图2C, D)显示,374个基因在高分组中普遍上调,且25个基因普遍下调。为了概述DEGS的潜在功能,作者对高免疫评分组480个上调的DEGS进行了功能富集分析。发现,这些基因涉及细胞外基质、免疫和炎症反应、趋化因子活性和整合素结合。

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第7张图片

为了探讨个体DEG在整体生存中的潜在作用,我们从TCGA数据库中生成Kaplan-Meier生存曲线。在高immune评分组上调的480个degs中,共有258个degs在log-rank检验中能显著预测总体生存率。

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第8张图片

为了更好地理解这些DEG之间的相互作用,作者使用STRING 工具获得了蛋白质-蛋白质相互作用(PPI)网络。该网络由8个模块组成,包括224个节点和1 282个边。作者选择了前三个重要的模块进行进一步的分析。即IL6, TIMP1, and TLR2 modules。

在IL6模块中,网络中形成了83条边,涉及26个节点,其中IL6、IL8、ITGB2、ICAM1、CSF1R、IL1B和CD163是显著的节点,因为它们与模块的其他成员联系最多。在TIMP1模块中,TIMP1、CCR5、CXCL12、SERPINE1、SERPING1、C3AR1、SRGN和SERPINA3具有较高的度量值。对于TLR2模块,包括TLR2、CCL2、CCL5、IGSF6和CD14在内的多个免疫应答关键基因占据了该模块的中心。

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第9张图片

作者又进行了功能富集分析具有预后价值的基因

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第10张图片

为了了解TCGA数据库中鉴定的基因是否对其他GBM患者的预后也有意义,我们从独立的胶质瘤数据库CGGA下载并分析了114例GBM患者的基因表达数据。共有44个基因被证实与不良预后显著相关,其中21个基因特别有意义,因为它们以前没有与GBM患者的不良预后相关。

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第11张图片
医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第12张图片

点击查看往期内容回顾

医学生信文献第1期:ER阳性乳腺癌患者中LLGL2通过促进亮氨酸摄取来缓解营养压力

医学生物信息学文献第2期:肿瘤微环境

医学生物信息学文献第3期(综述):PD-L1调节在癌症免疫治疗中的生化作用

医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因_第13张图片

你可能感兴趣的:(医学生物信息学文献第4期:挖掘TCGA数据库中对胶质母细胞瘤微环境预后有价值的基因)