ceRNA纯生信分析思路 预后不够ceRNA来凑

大家好,今天要和大家分享的文章是2020年8月发表在Frontiers in Genetics(IF:3.258)上的文章。该文章构建了两个ceRNA 和3个risk score,what!!!预知详情,请听这回讲解。

背景

甲状腺癌是最常见的内分泌系统肿瘤,其中以甲状腺乳头状癌(PTC)最为常见,且近年来发病率逐渐上升。虽甲状腺乳头状癌进展缓慢且大多数进展不致命,但患者会承受极大的精神压力和经济压力。所以,探索并发现与PTC无瘤间期(PFI)相关的预后指标,对于提高患者的生活质量有重要意义。


研究过程解读

1.数据来源与统计分析

PTC患者的mRNA、miRNA、lncRNA的测序数据均来自于TCGA-THCA队列,与之匹配的临床参数从UCSC Xena下载。按1:1随机将患者分为训练集和验证集两组。所用统计分析均通过R软件3.6.1版本完成,P<0.05认为有统计学意义。


2.差异RNA筛选以及构建PFI相关ceRNA网络的

按∣logFC∣>1和FDR<0.05筛选差异RNA(DEmRNAs、DEmiRNAs和DElncRNAs,图1A、B、C)。基于这些差异RNA,利用数据库miRcode、miRDB、TargetScan、miRTarBase构建全局的ceRNA网络。

在训练集中,将差异RNA经单因素Cox回归分析,得到与PFI相关的123个lncRNA、209个mRNA和9个miRNA,并从全局的ceRNA网络中得到了PFI相关的ceRNA网络(图1D)。

3.基于RNA构建的PFI分类器

分别将单变量Cox回归识别的PFI相关差异RNA经LASSO-Cox回归分别构建了6-mRNA分类器(图2A、B),5-lncRNA分类器(图2C、D),和一个4-miRNA分类器(图2E、F)。这些mRNA、lncRNA、miRNA的信息见表1。

图2 基于LASSO-Cox构建PFI的三种RNA分类器

表1 用于构建分类器的RNA详细信息

4.三个分类器与临床参数的关系

分别按照三个分类器计算出每个患者的风险评分,以评分中位数划分高低风险组,Kaplan-Meier曲线显示,在三个分类器中,训练组(图3A、C、E)和测试组(图3B、D、F)中高风险组的PFI都低于低风险组,提示三个分类器与PFI间良好的关系。表2展示了基于分类器的风险评分与临床参数之间的关系,提示T分期较高的患者倾向于较高的风险评分。 

图3 训练集和验证集中PTC患者的PFI曲线

表2 基于分类器的风险评分与临床参数的关系


5.评估PFI分类器的预后价值

时间依赖性ROC曲线显示,三种分类器均有较好的预测能力。将TNM分期系统与三种分类器一起绘制1年、3年、5年的ROC曲线,结果显示这三种分类器的预测精度均高于TNM分期系统(图4)。

共406例患者有完整的临床资料供下一步分析。虽然单因素Cox回归显示三种分类器和各项临床特征均与PFI显著相关,但采用AIC选择标准进行多因素Cox回归分析后,仅保留6- mRNA分类器、5- lncRNA分类器和病理T分期作为PFI的独立预后因素(表3)。

图4 三种分类器1、3、5年的时间依赖性ROC曲线以及三种分类器和TNM分期系统的ROC曲线

表3 三种基于RNA的PFI分类器与临床特征单因素、多因素Cox回归分析

 

6.列线图对预后模型进行可视化

基于多变量Cox回归中验证的6- mRNA分类器、5-lncRNA分类器和病理T分期构建了列线图预测PTC患者的预后,通过计算总评分来估计PFI预后;列线图模型的C指数为0.792 (95% CI: 0.716-0.867),校准曲线显示了模型的良好识别力(图5)。以上结果均表明,这个模型具有良好预测患者PFI的能力。

图5预后模型的列线图和校准曲线

总结

这篇文章的内容大概就是这些啦,因为甲状腺癌致死率并不高,所以作者选择研究无瘤间期(宝宝们要学习哦)。基于PFS相关的三种RNA,构建了PFS生相关的ceRNA网络,并开发了三种基于RNA的分类器:

有分析意向(http://gaptechsxr.mikecrm.com/1vdMmqy)生信人WX公众号

6-mRNA、5-lncRNA、4-miRNA,并通过时间依赖性ROC来验证三种分类器良好的预测能力;最后,通过引入AIC的多因素Cox回归来构建预后模型并绘制列线图。列线图的本质其实就是回归方程的可视化,根据方程中的回归系数给模型中的每个组成制定评分标准,这样就可以给每位患者计算出一个总分,再用总分来评估预后。列线图把枯燥的方程转化成图形的形式,是一种有趣的算法,可以为你的论文、项目标书增色不少,感兴趣的朋友可以学习一下。

你可能感兴趣的:(ceRNA纯生信分析思路 预后不够ceRNA来凑)