2020-09-15 急性粒细胞白血病预后代谢风险模型的系统构建和验证

image.png

摘要

背景:急性骨髓性白血病(AML)是一种异质性疾病,具有复发性基因突变和与疾病相关的基因表达中的变异,可能对预后预测有用。
方法:从GEO,TCGA和TARGET数据库下载AML的数据。通过LASSO分析鉴定预后代谢基因以建立代谢模型。通过与时间有关的接收器工作特性曲线和曲线下面积(AUC)量化模型的预后准确性。生存分析通过对数秩检验进行。通过基因集富集分析(GSEA)评估了不同代谢风险状态下的富集途径。
结果:我们鉴定了九个基因,以构建高危与低危组中较短生存期的预后模型。该预后模型显示出良好的预测效果,在训练,成人外部和小儿外部队列中,AUC的5年总生存率分别为0.78(0.73-0.83),0.76(0.62-0.89)和0.66(0.57-0.75)。多变量分析表明,在训练,成人外部和儿童外部队列中,代谢特征具有独立的预后价值,危险比分别为2.75(2.06-3.66),1.89(1.09-3.29)和1.96(1.00-3.84)。与经典预后因素的预测相比,将代谢特征和经典预后因素相结合可改善5年总生存期预测(p<0.05)。GSEA揭示大多数途径与代谢相关,表明潜在的机制。
结论:我们发现了AML中代谢功能异常,并建立了预测AML患者生存的预后模型。

方法

数据集和数据收集

从相应的数据集中检索并下载了三个AML队列的基因表达谱。从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)下载GSE37642(16)数据集的原始微阵列数据,并在不同阵列之间进行了标准化。来自TCGA-LAML数据集和TARGET-AML数据集的RNA-seq数据可从UCSX Xena网站(https://xenabrowser.net/datapages/)

代谢基因集的构建和验证

该GSE37642数据集用作训练队列以构建代谢风险模型。TCGA-LAML和TARGET-AML数据集分别用作成人和儿童AML验证队列。根据训练队列中确定的统一公式为每个患者生成代谢风险评分。根据survminer软件包确定的最佳代谢风险评分标准,将患者进一步分为高危和低危组。

GSEA

使用GSEA v4.0.2软件(http://software.broadinstitute.org/gsea/login.jsp)来鉴定潜在的生物学途径,并使用c2.cp.kegg.v7.0比较高代谢风险组和低代谢风险组.symbols基因集。使用来自c2.cp.kegg.v7.0.symbols的代谢途径相关基因集为GSE37642数据集生成了代谢特征。仅包括验证队列以进行丰富的途径分析。标称p <0.05被认为具有统计学意义。基因云生物技术信息(GCBI)和cytoscape 3.7.2用于探索模型相关的代谢蛋白与其他已知相关蛋白之间的相互作用。

统计分析

绘制了随时间变化的接收器操作特征(ROC)曲线,以评估三个队列中代谢信号的预测性能。使用生存ROC软件包计算ROC曲线下的面积(AUC)。总生存期(OS)定义为主要结局,并计算为诊断或研究因任何原因死亡的日期。使用“生存”软件包绘制Kaplan–Meier曲线,并使用对数秩检验进行比较。通过单变量和多变量Cox分析探讨了临床和遗传信息对预后的影响。诺模图用于可视化和整合OS的代谢特征和经典独立危险因素,年龄和遗传风险评分,并通过校准评估其一致性。AUC用于评估和比较候选因素的预后价值。所有统计分析均使用R软件(版本3.6.0)和SPSS 24.0版软件(SPSS,Inc.,美国伊利诺伊州芝加哥)进行。p <0·05被认为具有统计学意义。

image.png

image.png

image.png

image.png

image.png

你可能感兴趣的:(2020-09-15 急性粒细胞白血病预后代谢风险模型的系统构建和验证)