lncRNA结直肠预后

不知不觉,2019年就只剩一个月了!!!大家定的小目标还有没有希望实现呢?小编今天跟大家分享的是一篇11月末发表在Frontiers in Oncology杂志的文章,题目见下文。结直肠癌(CRC)是一种高异质性的癌症,多年来其发病率和死亡率一直居高不下。该研究基于TCGA数据,识别出了三个CRC中差异表达的lncRNAs作为预后生物标志物。此外,还构建了一个lncRNA-miRNA-mRNA网络,以研究lncRNAs在CRC中的生物学功能。


An Integrated Three-Long Non-coding RNA Signature Predicts

Prognosis in Colorectal Cancer Patients

整合的3-lncRNAs结直肠癌预后特征


数据和方法

CRC的RNA表达谱和临床信息下载自TCGA,包含482个CRC样本和42个癌旁组织样本。lncRNAs通过Ensembl数据库中的hg38进行注释,DElncRNAs筛选条件为|log 2FC| >1.5 & P-value < 0.05(使用R包edgeR),然后用R包pheatmap进行分层聚类分析,并绘制了火山图。此外,作者还对来自江南大学附属医院的85例CRC患者做了RT-PCR作为临床验证集。研究流程如图1所示:

 图1. 研究流程


识别总生存期相关的lncRNAs

作者将没有生存信息和lncRNA表达数据的样本删除后,还剩余439个CRC患者,其中42个有配对的正常样本。然后,使用单变量Cox分析评估DElncRNAs与患者总生存期(OS)之间的关系,筛选P-value <0.05做进一步分析;接下来,用最小绝对收缩和选择算子(LASSO)模型从预后DElncRNAs中识别关键lncRNAs(基于R包”glmnet”);最后,对这些关键lncRNAs进行Kaplan-Meier分析,筛选出与OS显著相关的lncRNAs。


预后风险模型

基于lncRNAs的表达水平和回归系数,作者用多变量Cox回归分析建立了预后风险公式,计算了每个患者的风险得分,根据中位数将患者分为高、低风险组。然后,利用Kaplan-Meier生存曲线评估两组的预后情况,并根据3年和5年OS概率的风险得分,通过ROC曲线来评估其准确性。


构建ceRNA网络

该研究使用LncBOOK识别出了1,039个与三个DElncRNAs互作的miRNAs;然后基于lncRNAs和miRNAs间的得分,筛选了跟每个lncRNA相关的前30个miRNAs;接下来,利用miRDB、TargetScan和miRTarBase预测了miRNA的靶mRNAs;最后,通过Cytoscape构建了lncRNA–miRNA–mRNA网络。


功能预测和统计分析

对于差异表达的mRNAs(DEmRNAs),作者利用R包“clusterProfiler”做了KEGG通路分析,并用SPSS23.0或R做了统计分析,P-value < 0.05认为是具有统计显著性。


结果

识别OS相关的关键lncRNAs

在439例CRC患者中,研究基于42组CRC和癌旁组织配对样本的表达数据,利用R包edgeR筛选出了580个DElncRNAs(319个上调,216个下调),图2.A-B是它们相应的热图和火山图;接下来,研究通过单变量Cox回归分析,评估了lncRNA表达谱与患者OS的预后关系,46个p<0.05的DElncRNAs被筛选出来做进一步分析,它们的LASSO系数如图2.C所示,基于最小λ法筛选出了17个lncRNAs(图2.D)。

 图2. 识别CRC相关的DElncRNAs


对这17个lncRNAs的Kaplan-Meier生存分析结果表明,有10个与OS显著相关(图3);多变量Cox回归分析识别出3个lncRNAs(AP003555.2, AP006284.1和 LINC01602)作为整合的CRC患者的预后标志物(图4.A)。

 图3. 10个预后lncRNAs


训练集中预后风险评分公式的建立

利用3个预后lncRNAs构建的预后风险得分公式为:risk score = 0.2212*(the expression level of AP003555.2)+ 0.2081*(the expression level of AP006284.1)+0.1214*(the expression level of LINC01602),根据中位数患者被分为高、低风险组。患者的危险得分和生存状况的分布见图4.B-C,风险得分越高,患者预后越差。该风险模型在临床验证集中的结果与TCGA数据集一致(见图5)。

 图4. 基于三个预后lncRNAs的风险模型


图5.模型临床数据集中验证

三个lncRNAs在训练集和验证集中的预后价值

首先,作者用Kaplan-Meier分析评估了风险公式在训练集中的预后价值,发现低风险组的OS高于高风险组群(图6.A)。此外,时间依赖的ROC分析表明整合的lncRNAs特征效能优于单个lncRNA(图6.B)。验证集中的分析结果训练集中的结果一致(图6.C-D)。

 图6. 整合的lncRNAs特征的预后价值


最后,对ceRNA中mRNAs的KEGG富集分析发现,这3个lncRNAs参与到了一些癌症相关通路,如PI3K-Akt、TGF-b、CRC和P53通路。

总的来说,研究构建了一个与CRC患者OS显著相关的整合的3-lncRNA特征,能够准确地识别低预后风险和高预后风险患者。此外,作者利用临床验证集评估了该预后特征的准确性和可靠性,表明了整合的3-lncRNA特征作为CRC预后模型的潜能。

今天,送给大家的是:It's not our abilities that show what we truly are, it’s our choices. 

你可能感兴趣的:(lncRNA结直肠预后)