纯生信分析套路:自噬预后相关分析

生信人推送自噬预后分析文章已经是去年很早的事情了,小编今天又要带大家看一篇肾癌自噬预后相关的文章,发表在Frontiers in Oncology(IF:4.85),有分析意向(http://gaptechsxr.mikecrm.com/1vdMmqy)该期刊影响因子还涨了,是不是后悔没有也做做自噬因子相关的预后分析呢。晚一点,结果好,写的好也是可以的发文的。科研远在不停的进步,有想法就要马上去实现,早一点点会有很大不同,饭还是要趁热吃才香嘛。

Identification of an Autophagy-Related Prognostic Signature for Clear Cell Renal Cell Carcinoma

识别肾透明细胞癌的自噬相关的预后标志物

首先让我们通过摘要了解下这篇文章的主要内容,自噬异常与癌症的发展密切相关。许多研究表明自噬在肾透明细胞癌(ccRCC)的生物学功能中起重要作用。在这里,作者基于自噬相关基因(ARG)构建ccRCC的预后标志物来预测ccRCC的预后。作者从TCGA中ccRCC RNA-seq数据获得差异表达的ARGs并对这些ARGs进行GO和KEGG富集分析。差异表达的ARGs主要富集在铂药物抗性通路中。通过Cox回归分析确定用于构建总体生存期(OS)和无病生存期(DFS)风险评分模型的预后性ARG。根据风险评分的中位数,将患者分为高风险组和低风险组并进行了Kaplan-Meier分析。基于差异表达的ARGs,作者构建了11个OS和5个DFS的预后标志物,结果表明高风险组的生存时间明显短于低风险组。应用ROC曲线来评估预测的精度。此外,作者根据不同的临床变量进行了分层分析,并评估了风险评分与临床变量之间的相关性。总之,作者构建的OS的自噬相关标志物可以独立预测ccRCC患者的预后。

一.材料和方法

1.1数据资源

作者从HADb(人类自噬数据库)获得了232个ARG,然后从TCGA数据库中的KIRC队列中下载了FPKM标准化的RNA-seq数据以及临床和OS信息。表1显示了TCGA数据库中ccRCC患者的基本临床特征。作者从cBioportal获得了431位ccRCC患者的DFS数据。总共获得了222个具有表达值的ARG。

 表1. TCGA数据库中ccRCC患者的临床特征


1.2差异表达的ARGs的富集分析

作者使用FDR<0.05以及| Log2FC| > 1作为筛选标准,以获得差异表达的ARG。应用“cluster Profiler”包进行富集分析,然后使用“GOplot package”进行可视化。

1.3自噬相关预后标志物的构建

作者首先通过单变量Cox回归分析获得ccRCC中的预后性ARGs,然后进行多元Cox回归分析和构建风险评分模型。风险评分计算如下:

其中Coef是系数,x是每个选定ARG的表达值。该公式用于计算每位ccRCC患者的风险评分。然后作者进行了Cox回归分析,以证明ccRCC患者的自噬相关标志物是否是独立的预后因素。

1.4基因集富集分析(GSEA)

作者根据风险评分的值将患者分为高危和低危组。使用GSEA 3.0进行GSEA分析。P <0.05和FDR <0.25的差异是显著的。

1.5统计分析

作者使用R进行统计分析。使用Wilcox秩和检验比较癌症组织和正常组织之间差异表达的ARG的表达水平,以及高风险和低风险组中11种预后的ARG的表达。应用t检验来比较风险评分和临床病理变量之间的相关性。使用Cox回归分析来筛选包含在风险评分模型中的基因。根据风险评分的中位数将ccRCC患者分为高危组和低危组,并通过Kaplan-Meier方法和对数秩检验分析患者的OS和DFS。使用“ survivalROC”包进行ROC分析。

二.结果展示

2.1癌组织和正常组织中差异表达的ARGs

图1显示了研究过程的流程图。

 图1.流程图


作者首先从HADb数据库获得232个ARG,然后从TCGA数据库下载了KIRC队列中530例患者的RNA-seq以及临床和预后数据最终获得了222个ARG的表达数据。作者使用FDR<0.05以及| Log2FC| > 1作为筛选标准获得了45个差异表达的ARG,其中包括9个下调的ARG和36个上调的ARG(图2A,B),并进行了可视化(图2C)。

 图2.自噬相关基因在ccRCC和正常肾脏组织中的表达


2.2差异表达的ARG的功能注释

使用45个差异表达的ARG进行功能富集分析。其在生物学过程,细胞组分和分子功能(图3A)上富集的通路如表2所示。在KEGG通路中,ARG主要富集于铂药物耐药性等通路中(表2和图3B,C)。这些KEGG通路的z评分> 0,表明ARG在这些通路中被上调。

 表2. 45个差异表达自噬相关基因的功能富集分析


 图3. 45个差异表达的自噬相关基因的功能富集分析


2.3基于OS的预后ARGs的预后标志物的构建

在分析了差异表达的ARGs在ccRCC中的表达和功能后,作者构建了一个风险评分模型来预测ccRCC患者的预后。经过单变量Cox回归分析后,有23个ARG与ccRCC患者的预后相关(图4)。经过多变量Cox回归分析后,确定了11个ARG,并将其用于构建OS的预后标志物(表3)。风险评分的计算方法为这11个基因中每个基因的回归系数乘以表达值,最后加和。

 图4. 差异表达自噬相关基因的单因素Cox回归分析


 表3. 预后自噬相关基因的多变量Cox回归分析


2.4 ccRCC患者OS的自噬相关标志与预后的相关性

为了确定OS自噬相关特征对ccRCC患者预后的预测能力,采用Kaplan-Meier分析评估两组OS的预后。结果显示高风险组患者的OS率显著低于低风险组患者的OS率(图5A)。BID,RGS19,CASP4,IFNG,ATG16L2和EIF4EBP1在高风险组中高表达,而PRKCQ,BAG1,CX3CL1,ERBB2和BNIP3在低风险组中高表达(图5B)。高风险和低风险组中患者的风险评分(图5C)显示随着风险评分的增加,越来越多的患者死亡(图5D)。这些结果表明,风险评分准确地反映了患者的生存,而自噬相关的OS特征准确地预测了患者的预后。

 图5. 自噬相关特征与ccRCC患者的预后之间的相关性


为了确定OS的自噬相关标志物是否是ccRCC患者的独立预后因素,作者进行了Cox回归分析。单变量Cox回归分析显示ccRCC患者的年龄,阶段,等级,T阶段,M阶段和风险评分与OS显著相关(图6A)。多Cox回归分析显示,年龄,阶段,等级和风险评分是影响ccRCC预后的独立因素(图6B)。然后,作者构建了ROC曲线以确定自噬相关标志物的预测准确性。这些组之间的曲线下面积(AUC)有所不同。自噬的调控和肾细胞癌通路显著富集于低风险组中(图6D,E),表明自噬的调控主要涉及低风险ccRCC患者。

 图6.OS的自噬相关标志是ccRCC的独立预后因素


2.5基于预后ARGs的OS预后特征验证

为了验证基于完整TCGA数据集构建的OS的预后签标志的适用性,作者将整个数据集中的530 ccRCC患者随机分为训练集(n = 265)和验证集(n = 265) 。同样地,计算每个患者的风险评分,然后根据风险评分的中位数将训练集和验证集中的患者分为高风险和低风险组。与整个数据集中观察到的结果一致,高风险组患者的OS率低于训练集中低风险组的患者的OS率(图7A),并且在验证组中,高危组的预后比低危组的预后差(图7C)。训练集和验证集的ROC曲线也显示出良好的性能(图7B,D)。

 图7. 基于预后ARGs的OS预后特征验证


2.6 OS标志物在临床病理变量分层对ccRCC患者预后中的作用

为了研究按临床病理学变量分层的ccRCC患者OS标志物的预后价值,根据年龄,性别,等级,分期,M期和T期对ccRCC患者进行分层。对于所有不同的分层,高风险组的OS时间短于低风险组的OS时间(图8)。这些结果表明,OS的自噬相关特征可以预测ccRCC患者的预后,而无需考虑临床病理变量。

 图8. 按临床病理学变量分层的高危和低危人群的Kaplan-Meier生存曲线


2.7 OS的预后标志物与临床病理变量之间的关系

为了确定OS的自噬相关预后标志是否影响ccRCC的进展,作者分析了OS的自噬相关预后标志与临床病理变量之间的相关性。G3-4的风险评分高于G1-2的风险评分(图9A),M1的风险评分高于M0(图9B),N1的风险评分高于N0(图9C),III–IV的风险评分高于I–II期(图9D),T3–4的风险评分高于T1-2–2(图9E) 。这些结果表明,风险评分越高,ccRCC的恶性程度越高。因此,OS的预后标志物可以准确预测ccRCC的进展。

 图9. 风险评分与临床病理变量之间的关系


2.8 ARGs与临床病理变量之间的关系

为了进一步了解自噬在ccRCC中的作用,作者还研究了OS的预后ARG与临床病理变量之间的关系。结果如表4所示。

 表4. 预后性ARG与临床病理变量之间的关系


2.9基于预后ARGs的DFS预后标志的构建

考虑到DFS在ccRCC预后中的重要性,作者还建立了DFS的预后标志。同样地,经过数据下载处理筛选最后构建了5个ARG的预后指标。KM分析显示高风险组的DFS时间明显短于低风险组(图10A),ROC分析显示,1年,3年和5年DFS的AUC分别为0.745、0.754和0.756(图10D)。这些结果表明,DFS的预后标志也可以很好地预测ccRCC患者的预后。

验证部分结果显示与从整个数据集获得的结果一致,在训练组(图10B)和验证组(图10C)中的高危组患者的DFS时间比低危组短。训练集和验证集的ROC曲线也显示出良好的性能(图10E,F)。单变量Cox分析显示,等级,阶段,T阶段,M阶段和风险评分与ccRCC的DFS显著相关(图10G)。多元Cox回归分析显示,等级,阶段和风险评分是影响ccRCC DFS的独立因素(图10H)。这些结果表明,DFS的自噬相关特征可以很好地预测患者的DFS。

 图10. DFS的自噬相关标志是ccRCC的独立预后因素


好啦,这篇文章的内容就这么多啦~每天都要开心哦!!

你可能感兴趣的:(纯生信分析套路:自噬预后相关分析)