生物数据库之专项数据库

一、京都基因与基因组百科全书KEGG

KEGG,全称京都基因与基因组百科全书(http://www.genome.jp/kegg)。它是关于基因、 蛋白质、生化反应以及通路的综合生物信息数据库。

由多个子库构成( 图 1. KEGG 子库列表 )。

image-20200425145016396

以上都是 KEGG 的子数据库,可以说包罗万象,不愧是百科全书。这些子库中,KEGG PATHWAY 数据库包含了大量物种的代谢与生物信号传导通路信息。

Pathway 数据库下又分 为 7 个部分:

1)Metabolism,

  • 其中 Metabolism 代谢通路这部分,又具体分为几个专题:

    • 1)Global/overview,

    • 2)Carbohydrate,

    • 3)Energy,

    • 4)Lipid,

    • 5)Nucleotide,

    • 6)Amino acid,

    • 7)Other amino,

    • 8)Glycan,

    • 9)Cofactor/vitamin,

    • 10)Terpenoid/PK,

    • 11)Other secondary metabolite,

    • 12)Xenobiotics,

    • 13)Chemical structure。

2)Genetic Information Processing,

3)Environmental Information Processing,

4)Cellular Processes,

5)Organismal Systems,

6)Human Diseases,

7)Drug Development。

我们选择 Global/overview 总图这个专题点击查看。这时就会出现一张线路板一样的图 (图 2)。

image-20200425145723051

图中有一个圆圈。我们把显示比例调成 100%。放大这个圆圈看一下(图 3)。

image-20200425145412982

我们看到这个圈的名字是 TCA 循环,也就是三羧酸循环。这个图上的每一个圆点儿代表一个化合物,把鼠标放在某一个点上,会出现化合物的分子式,点击可进入相应数据库查看详细。 图上的每一条线代表一个生化反应。把鼠标放到三羧酸循环的名字上,可以看到一个更加详细的通路图,我们点击这个名字。得到三羧酸循环详细的通路图(图 4)。

image-20200425145947998

其中圆圈是化合物,箭头代表反应及反映方向。方块中的是酶。虚箭头指向其他途径,中间过程省略没有列 出。当点击某一个酶的时候会直接进入 KO 数据库。KO 是 KEGG 中的一个“专有名词”, 表示蛋白质或者说酶的一个分类体系。序列高度相似,并且在同一条通路上有相似功能的蛋 白质被归为一组,然后打上一个 KO 标签。从对应的 KO 数据库记录中可以查看当前这个酶的定义,酶学命名,参与途径,功能,结构等信息。KO 数据库记录的下面是这个酶在 KEGG 酶库里的信息。以及该酶所参与的化学反应在反应库里的信息。

接下来我们看一下 Toll 样受体的信号传导通路。它位于 KEGG Pathway 数据库里的 Organismal Systems 部分的 Immune system 专题里。图 4 是人的各种 Toll 样受体信号传导通路 图。可以看到在细胞膜和内质网上,有很多种 Toll 样受体。它们识别了不同的入侵物后, 激活下游蛋白,一个接一个的传递信号,直至产生各种细胞因子,激发炎性反应。如果点击其中的 Toll 样受体 4,可以看到这个蛋白质的详细信息,包括它参与的各种 Pathway。此外, 还有该蛋白可引发的疾病信息,并且可以链接到 KEGG 人类疾病数据库。此外,数据库记 录里还提供了两个相关的 Drug,其中一个 Drug 叫 Eritoran(图 5)。

image-20200425150102038

它是 Toll 样受体 4 的拮 抗剂。因为它长得和 Toll 样受体 4 的激动剂 LPS 脂多糖很像,所以可以被 Toll 样受体 4 捕 获。但是因为它又比激动剂 LPS 少了两条链,所以 Toll 样受体 4 捕获它之后不能激活下游 的信号传导,从而使 Toll 样受体 4 丧失免疫功能。这种药可以用于 Toll 样受体 4 引发的自 身免疫疾病的治疗。

二、人类孟德尔遗传在线 OMIM

最后我们来看一个有关人类遗传病的数据库,人类孟德尔遗传。它是一个将遗传病分类,并链接到相关人类基因组中的数据库。它的在线版本是人类孟德尔遗传在线 OMIM。OMIM 为临床医生和科研人员提供了权威可信的关于遗传疾病及相关疾病基因位点的详细信息。

从 NCBI 的 OMIM 子库页面点击 Getting Started 进入数据库, 或者直接从 OMIM 主页进入。

以阿尔茨海默症(AD)为例,在搜索条中输入:alzheimer disease。搜索结果里排在第 一位的就是我们想要的。点击进入后数据库给出了与 AD 相关的致病基因。

image-20200425213034396

包括他 们在染色体中的位置,所引发表型的数据库编号,以及基因的数据库编号等。

此外,页面上 还提供大量的文字信息。如果我们点击某一个染色体定位的话。会出现这个位置附近基因的 列表,以及引发的各种疾病。点击某一基因的数据库编号,可以查看这个基因的详细信息。

你可能感兴趣的:(生物数据库之专项数据库)