非编码RNA生信分析

第1篇

发在Journal of Translational Medicine(4分)。
原文:Circular RNA regulatory network reveals cell–cell crosstalk in acute myeloid leukemia extramedullary infiltration
解读:生信SCI如何入门火爆的环状RNA领域
1、环状RNA的差异分析火山图和聚类图。根据差异分析,再加入正常人的对比信息(见韦恩图旁边的标注),找到了82个上调以及27个下调的环状RNA分子,并绘制了热图(为什么需要正常人信息?为什么不是直接的两种AML的对比)。

image.png

image.png

2、基因表达的差异分析:663个上调基因以及838个下调基因。并进行功能注释GO、KEGG(很常规)。得到的通路中,作者说有4个是之前报道过的(EMI与微环境之间关系的报道),这4个通路后续分析中会用到。
4、作者根据ceRNA机制,预测了可与筛选的差异环状RNA分子结合的潜在miRNA(用miRanda工具预测),同时作者预测了这些miRNA下游的靶基因(也就是说由此将环状RNA与基因映射起来了,用于后续分析),建立了circRNA/miRNA/mRNA调控网络。这个有点意思。
5、根据环状RNA与基因的映射关系,将环状RNA联系到通路上(4个通路),对这些通路的环状RNA取交集(所谓“kernel” circRNA),得到17个环状RNA。
image.png

6、作者开始分析这些环状RNA分子的反应元件(包括RBP,MRE以及ORF框),并绘制了相应的圈图。文章只呈现了9个圈图,因为另外8个环状RNA不在数据库中。
image.png

除此之外,作者还挑选了自己感兴趣的环状RNA分子进行了表达量验证。
image.png

7、作者预测了17个环状RNA分子的预后作用。如何实现?通过预测被这17个环状RNA分子靶向的基因在急性白血病患者中的预后作用。自己下载TCGA的数据做预后分析(这里也可以用数据库替代,例如GEPIA和UALCAN等)。
8、作者还用CMAP工具(https://portals.broadinstitute.org)预测可能在白血病中具有抗肿瘤作用的3种生物活性物质:LY-294002,trichostatin A(TSA)和SB-202190(预测是基于之前构建的circRNA/miRNA/mRNA实现)。

第2篇

“假基因”的研究,发在 Epigenomics (5分)。
假基因,也称伪基因,是基因进化过程中的不具有编码功能的残留物。它是最早在研究非洲爪蟾过程中发现的。它与正常基因非常相似,但不具有正常基因的功能。近年来研究发现,假基因的异常调节会导致多种疾病的发生和进展,这其中就包括了恶性肿瘤。假基因转录形成的RNA也是非编码RNA(miRNA, lncRNA, circRNA)中的一种。
原文:Integrated analysis of pseudogene RP11-564D11.3 expression and its potential roles in hepatocellular carcinoma
解读:基因还有“假”的!然后5分的SCI就这么到手啦
这里不再赘述了,直接读读上述解读链接的内容吧。
其中,比较套路的是:
1、作者如何筛选到那个要研究的假基因RP11-564D11.3:3种癌症中差异分析初筛、多种癌症验证筛选、生存分析筛选,然后就只剩一个共同的了。
2、假基因-miRNA-mRNA调控网络的构建,这是非编码RNA的基本套路,Cytoscape分析。
3、功能富集分析:此处不是常规的分析方法,用到了Cytoscape的插件ClueGo。但我更关心的是,这里的富集分析是基于什么?直接用假基因RP11-564D11.3?还是用上述网络得到的潜在靶向基因?还是用上述建立的网络?不太明白,文中也没详述。个人对富集分析的理解还是要有一堆基因才能做。
4、PPI分析:根据node degree筛选其中的hub基因(STRING和Cytoscape分析)。之后可以从hub基因中筛选与预后相关的基因。
5、如何得到假基因下游的关键靶点基因VEGFA:先选定最有可能分析出结果的癌种,然后再这个癌种里进行基因的预后分析,只有VEGFA提示预后不良且具有统计学意义。
文章的结论是:VEGFA是假基因RP11-564D11.3下游的一个靶点。

你可能感兴趣的:(非编码RNA生信分析)