KEGG pathway 数据库

pathway 建立在ko 数据库的基础上,基于我们对生命活动中的分子相互作用和化学物质的反应的认识,构建了复杂的调控网络,采用通路图的形式,进行展示。

通路图中融合了ko, module, compound, reaction,disease, drug 等 数据库中的信息,所以必须先理解了上面的几个数据库,才能对pathway 有一个更直观的认识。

在pathway 数据库中,每条pathway 的标识符由2-4个字母的前缀加上5个数字构成,共有5种不同的前缀:

  1. map

  2. ko

  3. ec

  4. rn

  5. org

5种前缀其实都是同一张通路图,只不过高亮显示的内容不同。
比如00020, 代表TCA 循环的通路

map 代表reference pathway,map00020 如下

KEGG pathway 数据库_第1张图片
image

ko 是在reference pathway 的基础上,将所有的ko用蓝色高亮显示
ec 是在reference pathway 的基础上,将酶编号高亮显示
rn 是在reference pathway 的基础上,将reaction 高亮显示
在kegg 中,ko/ec/rn 是相互关联的概念,所有3者都采用了同样的高亮方式,用蓝色进行高亮

KEGG pathway 数据库_第2张图片
image

org 代表的是organisam 数据库中物种的代码,比如human 对应的是hsa , hsa00020 对应的通路图如下

KEGG pathway 数据库_第3张图片
image

由于KO是跨物种的概念,所以每个pathway 会对应有多个物种。

从human的通路图中,我们也可以看出来,只有部分方框用绿色高亮显示。这部分绿色高亮像是的其实就是在该物种的基因对应的ko;

其实在每条记录的页面有下拉菜单,可以方面的查看同一张通路在map , ko, ec, rn , org 的不同版本

http://www.kegg.jp/kegg-bin/show_pathway?org_name=obr&mapno=00020&mapscale=&show_description=show

KEGG pathway 数据库_第4张图片
image

pathway 通路图包含了非常多的信息,我们想要看懂一张通路图,必须理解图中的元素都代表什么东西。在通路图中,官方提供的图例如下:

KEGG pathway 数据库_第5张图片
image

结合hsa00020 来理解一下,在一张通路图中,有三种基本对象:

  1. 矩形代表KO

  2. 圆角矩形代表的是另外的通路图

  3. 圆形代表的是化学物质

箭头代表他们之间的相互作用关系,对于蛋白互作,基因表达模式的关联,酶的相互作用,在箭头上又有不同的修饰符来表示不同的类型。

通路图中主要包含了以下两种关系:

  1. 基因之间的相互作用关系,现在有一种分析叫做通路图重构,其实就是从中提取出基因的相互作用网络,会重构通路图,然后基于该互作网络进一步挖掘信息;

  2. 通路之间的相互关系,对应的有分析通路间的相互关系网络,从而筛选出核心的通路;

pathway的分类信息在brite 数据库种的链接为

http://www.kegg.jp/kegg-bin/get_htext?br08901.keg

KEGG pathway 数据库_第6张图片
image

从图中可以看到,pathway 数据库种包含了7大类别,我们常说的代谢通路只是我们用的最多,最大的一类。

总结

  1. pathway 数据库中的每条记录有 map, ko, ec, rn, org 5种前缀,map 是reference pathway , ko/ec/rn 分别将 ko , ec, rn 在 reference pathway 中用蓝色高亮显示;org 代表不同的物种,在reference pathway 中,将该物种的基因对应的ko 进行了绿色的高亮显示。
  2. 在一张通路图中,矩形代表ko,圆角矩形代表两外一张通路;我们可以从pathway 中,挖掘出基因的相互作用网络和pathway的相互作用网络。

你可能感兴趣的:(KEGG pathway 数据库)