如何用基因组绘制代谢通路?

只有基因组,想画一个代谢图,折腾了好几天,最后发现仔细看官网文档是最快的,网页搜到的很少有详细讲解的,大多都是只讲一个部分,所以老老实实看官网是最快的。当然若是能检索到中文的全面的介绍文字或者是有人带那样会更快,但是我想大多数人还是自己默默前行,因此将最近的一点学习共享。

首先链接一篇文献,是讲kegg mapper的,这是在kegg官网上给出的一篇如何绘制代谢图 的文献,若是在没有合适的流程的情况下,这篇文献是非常合适的。

KEGG Mapper for inferring cellular functions from protein sequences

https://onlinelibrary.wiley.com/doi/10.1002/pro.3711

看了很多帖子,只有酸菜博主的这篇写的非常详细,可以作为流程走下来,对初学者帮助很大,因此在此转载。

当我们通过高通量实验(芯片、测序、IP-质谱)或公开数据库(GEO、TCGA、Oncomine)下载分析获得的差异表达分子列表后,在后续的功能注释过程中,几乎都会涉及到KEGG注释及富集分析。

那么当我们找到某些感兴趣的基因或通路后,能不能仅用我们感兴趣的基因绘制漂亮的KEGG代谢通路图呢?就像下面这样的!

答案是肯定的,今天小编给大家分享两种自主绘制高逼格KEGG通路图的方法,让大家通过点点点就能追上那些女神般的Pathway。

方法一

登录http://www.uniprot.org网站,点击 Retrieve/ID mapping按钮,跳转新界面。

将Excel表里面GeneSymbol基因拷贝至Provide your identifiers下面的输入框中。

接着分别设置select options下面三个为Gene name、UniProtKB、Homo sapiens (Human)[9606],然后点击submit按钮,可跳转新页面显示转换的结果。

左方导航栏里点击Reviewed的按钮,右方表格上方有Download按钮,将格式改为Excel,点击Go下载表格。

将压缩包解压后,打开Excel表,将转换后的网页第二列即Entry这一列拷贝到原来的excel表里面。

然后打开KEGG官网http://www.kegg.jp ,在 KEGG 首页,点击 KEGG Mapper。

在 KEGG Mapper页面点击Search & Color Pathway。

将转换好的基因以及标记的颜色从Excel中黏贴至输入框中。一般设定用红色标记上调的分子,蓝色标记下调的分子,有特殊需要可以特殊标记。

然后设置其他参数, Organism-specific默认为hsa、Optional use of outside ID选择uniprot、Include aliases勾上不变,最后点击下方Exec按钮。

在跳转的页面里,显示检索的结果,可以看到一共有138条通路被富集到了,这些检索的结果就是后续柱状图的素材来源。

点击信号通路,可进入通路图谱页面,这里可以打开参与通路分子最多的信号图谱看一下;

点击最末尾的数字,下方展开分子列表,如点击这里的“10”,显示参与这条通路的10个分子。

先将KEGG Mapper Search Result中的数据结果按分子数量整理一个表格,收集5-10个分子这个区间,一共有26个通路。

然后,在excel表里面进行数据转置,由竖行排列转置为横行排列。

打开prism8软件,选择column,然后点击Create按钮,

将横置后的数据拷贝至data1中,点击Graphs中的Data1,在跳出窗口中选择第4个选项,点击OK。

通过调节柱子颜色、X轴和Y轴长度和名称等个性化设置后,就可以获得好看的横向柱状图。

方法二

Pathview本是一个通路可视化友好的R包,支持多组学数据映射(基因/蛋白-代谢)。现阶段更是开发出了一个界面友好的在线工具界面Pathview网页版,成为了一个能在相关通路图上绘制、整合和呈现各种生物学数据的数据库。

该网站不仅可以提供简单的交互式访问,还能生成高质量的超链接图形。而在正式分析前,我们需要将感兴趣的通路和基因整理成以下表格,第一列为基因名称(各种Id,symbol都可),后面几列为相对表达值。

而后,将预准备好的基因和表达水平从excel拷贝到txt文本,保存。

接下来,进入Pathview官网https://pathview.uncc.edu/ ,右上角注册后登录,如果有账号可以直接登录,没有账号的也可以直接点击Quick Start。

在新的页面中点击New Analysis,再点击Gene Data右边的选择文件按钮,选择刚才保存的txt文件。

在新跳出窗口的左边选择前3个作为对照组,右边选择后3个作为实验组,点击close,如果点错了还能回去继续修改。

接下来Gene ID Type格式选择uniprot,Pathway Selection选择Auto,点击Submit按钮;

等进度条走完,再点击Analysis Result and logs按钮,可以看到结果汇总有3条通路。

点击链接即可出现相应的通路图:PI3K-AKT通路、Apotosis通路、Focal Adhesion通路。

至于为什么KEGG Mapper检索出来有136条,而Pathview最终却只有3条通路,而且这3条归属于136条之内:这是由于数据库收录来源和算法不同等客观原因造成。

本文首发于“ 酸谈”微信公众号

转载请注明:解螺旋·临床医生科研成长平台。

https://zhuanlan.zhihu.com/p/163655082

你可能感兴趣的:(如何用基因组绘制代谢通路?)