纯生信分析套路 CCR|自测数据+公开数据库结合

今天跟大家分享的是三月份 发表在CLINICAL CANCER RESEARCH杂志(IF :8.911)上的一篇文章RNA splicing alterations induce a cellular stress response associated with poor prognosis in Acute Myeloid Leukemia。文章主要讲的是,通过分析急性髓系白血病(AML)不同预后情况患者之间的RNA-seq数据分析比较,研究人员发现患者之间存在异常的RNA剪接方式,并通过计算机算法分析,确定了四个基因的剪接特征,经验证,可以显著提高现有风险预后方案的准确性。

RNA splicing alterations induce a cellular stress response associated with poor prognosis in Acute Myeloid Leukemia

急性髓系白血病的预后不良与因RNA剪接改变而引起的细胞应激反应相关

一、 摘要: 

众所周知,急性髓系白血病(AML)一种五年生存率不超过30%的恶性血液肿瘤,临床预后差,特征性细胞遗传学和染色体异常,反复的体细胞驱动突变,基于这些特征,临床上目前将AML分为三类:低危、中危、高危(favorable, intermediate and adverse-risk)。最普遍的治疗方案-强化诱导化疗并不适用所有患者,AML患者缓解率以及生存率仍不客观,因此开发高效治疗方案的需求日益迫切。

许多血液学恶性肿瘤中,低频率的剪接因子突变可以导致大量RNA剪接失调,因此研究人员围绕AML中是否存在RNA剪接失调,这些分子层面的改变是否与疾病临床表现等相关问题展开研究。有分析意向(http://gaptechsxr.mikecrm.com/1vdMmqy)通过在两个数据库中TCGA和Clinseq中的数据分析,研究人员发现AML

二、 材料方法

1、患者数据来源于The Cancer Genome Atlas (TCGA)-AML cohort和the Clinseq-AML cohort。Beat-AML cohort中验证分析结果的准确性。

2、RNA-seq数据分析:通过实验室内部生物信息学方法结合可用的工具,对RNA-seq数据分析患者体内的可变剪接方式;DESeq2分析基因表达情况;新开发的计算机算法判定蛋白结构域是否因剪接改变而改变。

3、转录本motif分析:rMAPS预测RNA结合蛋白的差异结合;MaxEntScan构建最大熵模型。

4、预后模型生成:LASSO Cox回归分析得出剪接特征;HarrelHarrel一致性指数(C-index)评估预后模型效果。 

三、 结果

1、TCGA和Clinseq的AML数据库中低危和高危ELN人群Kaplan-Meier生存分析均存在显著不同(fig1A);通过对两者的RNAseq数据分析,研究人员检测到不同的剪接事件(fig1C)。同时分析了不同的剪接事件在两种AML患者中分布模式(fig1D、H)。并且研究人员在TCGA库中挖掘到典型基因中内含子和外显子的剪接变化情况(fig1E、F)并找到两个库中共同的剪接发生变化的基因(fig1I)。为了确定这些剪接变化的基因分子层面的影响,研究人员又对这些基因进行了通路分析(fig1J),证明大部分基因与蛋白翻译或者胞内信号相关。


图1. 筛选AML患者中不同的替代剪接方式


2、研究人员设计了整个分析筛选流程(fig2A),不同替代性剪接对蛋白质结构域存在一定的影响(fig2B),其中一个代表性内含子保留剪接破坏结构域的例子(fig2C);研究人员对结构域发生变化的蛋白进行通路分析,发现大多参与具有独特的分子功能,如蛋白质翻译(fig2D)。研究人员进一步挖掘高危人群中替代性剪接差异存在的根本原因,发现其与体细胞驱动无关(fig2E)。


图2. 分析预测替代性剪接对蛋白功能的影响


3、研究人员首先找到了两个数据库中共同存在的差异剪接因子们(fig3A),并对它们进行了蛋白质互作网络分析(fig3B)。我们的信息预测方法中还发现一个多功能剪接调控因子HNRNPA1的替代性剪接,并对其与HNRNPC进行了motif筛选分析(fig3C、D);研究人员进一步挖掘不同剪接方式中序列的作用,发现在患者体内存在非正常的碱基增减(fig3E、F)。


图3. AML中差异替代性剪接的上游驱动因子分析


4、整体分析流程fig4A,首先研究人员筛选了两个数据库TCGA和Clinseq中差异表达的基因(fig4B)。对这些基因进行GSEA分析,得到一批ATG4调控的整体胁迫响应基因( Integrated Stress Response,ISR)上调(fig4C)。通过对上调基因分层聚类分析,发现同一个患者体内,同一个患者体内,ISR基因受诱导表达的趋势与错误剪接的蛋白翻译基因量成正比(fig4D)。对上述基因进行通路分析,发现均参与炎症相关通路(fig4E)。并且研究人员发现,高危AML患者中,因剪接失调而受影响的蛋白基本都参与胁迫产生的炎症通路(fig4F)。最后,研究人员将受调的翻译相关基因和炎症相关基因进行了整合网络分析(fig4G)。


图4. 选择性剪接对转录组影响的分析


5、研究人员通过计算机识别方法,在两个数据库中,共同筛选到四种与AML预后相关的剪接标记(fig5A、B)。并且Kaplan-Meier分析证明ELN的风险大小与四个剪接标记一致(fig5C)。综合以上结果,研究人员提出建议将AML三种分类变为两组,将方便更有效的制定治疗方案(fig5D)。最后研究人员还将从两个数据库得到的结论,放在BEAT-AML数据库中进行独立验证结果的准确性(fig5E)


图5. AML中替代性剪接对于预后评估的意义


四、 结论

研究人员发现在AML疾病中,会存在替代性剪接,接近45%影响蛋白保守结构域,导致整体应激反应以及炎症相关基因的上调。并且通过生信分析,确定了四个剪接特征,这些剪接标记提高了现有风险预后方案的准确性,并在一个完全独立的BEAT-AML数据库中对其研究结果进行了验证。

你可能感兴趣的:(纯生信分析套路 CCR|自测数据+公开数据库结合)