KEGG是一个整合了基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其关注的代谢途径有直观全面的了解。
ko:表示通路,这个通路是不分物种的,相当于所有物种某一通路的并集。
KO(KEGG Orthology):是KEGG中一个“专有名词”,表征一个基因。KO作为ko通路中的基本单位,它是蛋白质(酶)的一个分类体系。通常序列高度相似且在同一通路中具有相似功能的蛋白质被归为一组,即一个KO。
输入网址 https://www.kegg.jp/kegg/kegg2.html:
KEGG - Table of Contents功能简介:
打开另一网址 https://www.genome.jp/linkdb/,将看见这个界面:
LinkDB: database of link information功能简介:
LinkDB解析了KEGG数据库内部数据的流通以及和其它数据库的联系。若是需要了解具体某个数据库(如 :Pathway)的来源,直接点击上图下方的Pathway即可高亮显示该数据库数据来源相关的各类数据库名称。此外,还可以直接下载数据库与数据库间的编号对应关系!
问题:做类似下面文献中的两张图?
思考:从上图来看的话,首要任务就是收集氮代谢(Nitrogen metabolism)相关的数据信息啊,那怎么搜呢?
步骤如下(查找方式多种,此处以上面介绍的“KEGG最优打开方式”为例进行演示):
打开KEGG数据库时,可以发现KEGG数据库还提供多种其它在线分析工具:
先给大家介绍上图中2种比较炫酷的工具,其它工具可根据个人需求自行学习!
KEGG Mapper - Search & Color Pathway工具
利用Search & Color Pathway在线工具可DIY通路图中的基因(KO)或其它信息(如文字)的背景填充色,具体操作界面、输入参数设置和步骤可参考下图:
修改:上图中的Examples所处的状态应为:
这里,输入的KO编号如下:
K00002
K00016
K00114
K00121 yellow
K00128 yellow
K00134 green
K00138 .blue
K00150 .blue
K00169 cyan,red
K00844 cyan,red
点击“Exec”之后,结果如下:
KEGG会根据输入的KO编号从Reference Pathway库中找出与之相关的代谢通路,并将其列出。这里,我们点击“ko00010”,将得到如下代谢通路图:
可以看出,我们设置的颜色在代谢通路图中已经显现出来了
BlastKOALA工具
一种在线KEGG注释方法,具体操作界面、输入参数设置和步骤可参考下图:
基因注释
1.提交序列文件,为Fasta格式的蛋白质序列文件(The maximum number of sequences allowed ranges from 5000 to 10000 depending on the KEGG GENES dataset selected);
2.Enter taxonomy group of your genome(选择物种类型:区分原核与真核);
3.Enter KEGG GENES database file to be search(默认即可)
4.Enter your email address(填写你的邮件地址,提交任务后,需要从邮箱确认,结果也将会发送到邮箱);
5.提交任务,并从个人邮箱确认(数据只会保留一个星期)
输入个人邮箱地址(确认任务提交是否成功),点击“Request for email confirmation”按钮后,呈现的结果如下(网上找的图):
okay,KEGG的内容实在是太多了,短时间是没法讲完的,所以,有机会以后再继续分享吧!