论文模板丨最基本的生信套路换了miRNA也能发6分+

大家好!今天跟大家分享的是2020年12月发表在Genomics(IF = 6.205)上的文章。文章利用了从TCGA数据库中搜集的头颈部鳞状细胞癌(HNSCC)RNA测序数据和miRNA测序数据进行了综合分析,通过与临床数据结合,利用Cox回归分析,得到了7个与HNSCC相关的标志性miRNA,确定为用于头颈部鳞状细胞癌预后的新型miRNA标志物。

题目:miRNA biomarkers for predicting overall survival outcomes for head and neck squamous cell carcinoma

miRNA生物标志物可预测头颈部鳞状细胞癌的总体生存结果

摘要

头颈部鳞状细胞癌(HNSCC)是上消化道恶性肿瘤。miRNA功能的增加或者减少可通过多种机制促进癌症的发展。本文利用来自TCGA数据库的RNA测序(RNA-seq)和miRNA测序数据显示功能异常的miRNA微环境,并可以为miRNA治疗提供有用的生物标记。在训练集中,发现7个miRNA是HNSCC患者的独立预后因素。这些miRNA共有60个预测靶基因,其中 9个靶基因(CDCA4,CXCL14,FLNC,KLF7,NBEAL2,P4HA1,PFKM,PFN2和SEPPINE1)与患者的总生存期(OS)相关。本文确定了用于预测头颈部鳞状细胞癌预后的新型miRNA标志物。

流程图

论文模板丨最基本的生信套路换了miRNA也能发6分+_第1张图片

1. 数据的获取和整理

从TCGA数据库中下载HNSCC患者的RNA-seq数据和miRNAs-seq数据。miRBase数据库包含已知miRNA序列和注释,其中有成熟miRNA的位置和序列的信息。从miRbase获得的所有成熟miRNA序列的Fasta格式序列用于miRNA注释。分别从529名(42名正常和487名肿瘤)和552名(44名正常和508名肿瘤)患者的样本中提取RNA-seq数据和miRNAs-seq数据。同时收集的临床病理数据包括性别,年龄,分期,TMN分类,生存状况和生存天数。

2. 建立基于miRNA的预后标记

从TCGA的组学数据中分析共得到1075个差异表达的mRNA(上调581个,下调494个)以及miRNA 313个差异表达(上调203个,下调110个)。图1A-1B显示了前20个上调/下调表达差异mRNA的热图和火山图,图1C-1D显示了前20个上调/下调表达差异miRNA的热图和火山图。为了筛选预后的miRNA,利用单变量COX分析评估了差异表达的miRNA。在单变量COX分析中发现重要的26个miRNA具有显著性变化,其中7个差异表达的miRNA(hsa-miR-499a-5p,hsa-miR-99a-5p,hsa-miR-337-3p,hsa-miR-4746-5p,hsa-miR-432-5p,hsa -miR-142-3p,hsa-miR-137-3p)是HNSCC患者的独立预后因素。因此,本文模型的公式为:风险评分=(0.238×hsa-miR-337-3p)+(0.246×hsa-miR-99a-5p)-(0.232×hsa-miR-4746-5p)-(0.233×hsa-miR-432-5p)-(0.261×hsa-miR-142-3p)。此外,本文还计算了研究集中每位患者的风险评分。然后,将中位风险评分作为训练集,测试集和所有患者中的分界值,将患者分为高风险组和低风险组。

论文模板丨最基本的生信套路换了miRNA也能发6分+_第2张图片

图1.前20个上调/下调差异表达基因或miRNA的火山图和热图。

A-B:mRNA;C-D:miRNA。

3. 生存结果和多变量分析

本文通过使用KM生存曲线分析了7种miRNA在患者生存中的表达。发现hsa-miR-499a-5p,hsa-miR-99a-5p,hsa-miR-337-3p,hsa-miR-4746-5p,hsa-miR-432-5p,hsa-miR-142-3p和hsa-miR-137-3p显著影响OS结局(图2A-G)。此外,两个数据集的KM生存曲线可用于检测7个miRNA的预测值。在训练集和测试集中,高风险组的患者生存率均比低风险组低。利用ROC曲线研究生存相关miRNA的表达模式是否可以为HNSCC的发生提供早期预测。结果发现在训练集的AUC为0.716,测试集的AUC为0.654,说明该预后模型的敏感性和特异性是中等的。患者的风险生存状况图显示,随着患者的风险评分增加,死亡率也增加(图3)。为了建立基于7-miRNA的预后模型,本文使用单变量和多变量COX分析来识别风险因素,结果发现基于7-miRNA的特征,性别和N期是OS的独立预后因素(图4)。

论文模板丨最基本的生信套路换了miRNA也能发6分+_第3张图片

图2. 7个miRNA训练集和测试集的总体生存分析。

A-G:miRNA;H:训练集;I:测试集。

论文模板丨最基本的生信套路换了miRNA也能发6分+_第4张图片

图3.训练集和测试集的ROC曲线和患者的风险生存状态图。

A:训练集的ROC曲线;B:测试集中的ROC曲线;C:训练集中的生存状态;D:测试集中的生存状态。

论文模板丨最基本的生信套路换了miRNA也能发6分+_第5张图片

图4.单变量和多变量COX分析以识别风险因素。

A:单变量;B:多变量。

4. miRNA靶基因分析

利用在线数据库预测得到了这7个miRNA的60个靶基因。通过Cytoscape探索miRNA与靶基因之间的潜在联系。如图5所示,hsa-miR-137-3p是网络中最大的节点,而hsa-miR-99a-5p和hsa-miR-4746-5p没有匹配的靶基因(红色点表示上调,绿色点表示下调)。为了评估这些靶基因的生物学功能,使用GO富集和KEGG生物学通路进行分析。GO分析显示:靶基因的生物过程(BP)在细胞功能负向调节,组织发育和对抑制因子的反应等条目中富集。分子功能(MF)在细胞外基质结构成分,生长因子结合,纤连蛋白结合和蛋白质酪氨酸/丝氨酸/苏氨酸磷酸酶活性上富集,而细胞组分(CC)主要富集在血小板α颗粒,浓缩染色体动粒,细胞外基质等条目上。KEGG生物学通路分析表明,这些靶基因主要富集在磷酸戊糖通路,半乳糖代谢和糖酵解/糖异生通路中(图6)。

论文模板丨最基本的生信套路换了miRNA也能发6分+_第6张图片

图5. Cytoscape可视化miRNA与靶基因之间的潜在联系。

论文模板丨最基本的生信套路换了miRNA也能发6分+_第7张图片

图6.靶基因的GO分析和KEGG分析结果。

5. miRNA靶基因与生存情况的关系

分析miRNA靶基因表达对患者生存的影响,发现9种基因的表达:CDCA4,CXCL14,FLNC,KLF7,NBEAL2,P4HA1,PFKM,PFN2和SEPPINE1对OS产生了显著影响(图7A-7I)。蛋白质-蛋白质相互作用(PPI)网络的构建揭示了两个中心关键基因为PDGFRB和RAD51(图7J)。

论文模板丨最基本的生信套路换了miRNA也能发6分+_第8张图片

图7.鉴定出的靶基因和蛋白质-蛋白质相互作用网络(PPI)的总体生存分析。

A-1:mRNA;J:PPI网络。

结语

    本文的研究基于TCGA数据集确定了一种具有创新性的特征miRNA,并分析了HNSCC的预后。这项研究为精确预测癌症治疗结果的可靠工具开发提供了创新性的见解。

    本文研究的局限性在于结果尚未在临床样本中得到验证,并且相对较少的患者没有很高的统计效力。其分子标记应在更独立的研究和功能实验中得到验证。

版权声明:本文转自“生信发文助手”,文章转载只为学术传播,无商业用途,版权归原作者所有,如涉及侵权问题,请联系我们,我们将及时修改或删除。

沃斯(WOSCI)由耶鲁大学博士团队匠心打造,专注最新科学动态并提供各类科研学术指导,包括:前沿科学新闻、出版信息、期刊解析、论文写作技巧、学术讲座、论文润色等。

你可能感兴趣的:(论文模板丨最基本的生信套路换了miRNA也能发6分+)