文献阅读-基因富集分析

拿到一串感兴趣的基因,它们究竟参与那些生物学功能,是否与预期相符?最简单的解释办法是通路富集分析(pathway enrichment anlysis)。通路富集分析的基本步骤有哪些?有哪些可以简单、优秀、免费的工具?怎样对富集结果进行可视化并给出基本解释?有哪些需要注意的因素?这些问题都在下面一篇文章中详细给出了讲解。

文章基本信息

题为Pathway enrichment analysis and visualization of omics data using g:Profiler, GSEA, Cytoscape and EnrichmentMap,于2019年1月发布在Nature Protocol杂志。 https://www.nature.com/articles/s41596-018-0103-9

主要内容
正如标题所言,文章详细介绍了集g:Profiler,GSEA,Cytoscape, EnrichmentMap 为一体的通路富集分析及可视化的整套流程。由用户给定感兴趣的基因列表,根据基因信息选择g:Profiler或者GSEA做通路富集分析,前者适用于根据富集分析得分筛选过后的显著基因,后者则建议应用所有差异分析后的基因。富集后的结果可视化,用Cytoscape生成的EnrichmentMap来展示,并根据展示结果做后续深入分析。

简而言之,通路富集分析也就以上三个步骤:

  • 感兴趣的基因列表,或者为以某种指标排序后的基因列表
  • g:Profiler或GSEA通路富集分析。重要的是通路、基因集相关的数据库,及选择的背景基因集。文章给出了常见的通路数据库介绍及链接,包括GO,MSigDB,Reactome,KEGG,Panther等。
  • 可视化及结果解释。g:Profiler只给出了富集的通路名,GSEA虽然以图表形式展示了通路富集结果中是否存在明显上调或下调的基因集,但也未曾给出通路之间的网络关系。EnrichmentMap,节点表示通路,边表示两个通路间共有基因的比例,以线条粗细表示通路间的连接强度。同时,其将具有相似生物学主题的通路聚在一起,以不同主题颜色予以区分。

对于EnrichmentMap富集结果可视化的解释,文章给出了一下建议:

  • 某一主题应当与富集结果一致
  • 网络调控图中出现了富集结果中未曾体现的主题,应根据ES 得分高低优先分析
  • 对一些感兴趣的主题以严格的细节予以验证
  • 可以对某一主题的基因表达值导入通路流程图中(pathway diagram)进一步比较,如KEGG。
  • 此外,还能结合调控因子展开研究,如miRNA
  • 最后,富集的主题可作为已有结论的验证予以发表,或作为发现新基因的证据支持
workflow

小结

文章一方面给出了详细的通路富集分析综述,设计术语解释,相关资源介绍及整理,及分析的各步骤及细节。展示了集中工具的操作界面的参数介绍,提供案例数据集共用户实践,并提供GitHub附加资源。

你可能感兴趣的:(文献阅读-基因富集分析)