解惑基因的命名

NCBI (National Center for Biotechnology Information)`是指美国国立生物技术信息中心

第一步进入NCBI 进行搜索:https://www.ncbi.nlm.nih.gov/gene/672

解惑基因的命名_第1张图片
image

Official Full NameSee related 列出的都是BRCA1的其他名字,最常用的就是Official Full Name ,后面的“DNA repair associated”说明该基因和DNA的修复有关.

HGNC 全称为HUGO Gene Nomenclature Committee,叫做 HUGO基因命名委员会。并且不是所有的基因都有official symbol的,如果缺少HGNC提供的symbol,那么就在Entrez ID前加上LOC前缀,比如LOC109761693 ,前面的标题也变成了Gene Symbol

因此,NCBI的基因都具有Entrez ID和symbol,但是不一定有官方的HGNC symbol

Organism 物种的来源, Homo sapiens 表示人类

最上方的 Gene ID:672, 表示这个基因在NCBI Entrez gene 数据库中的代号

什么是Entrez?

Entrez是一个综合性在线资源检索器,包含核酸、蛋白质、基因、基因组、GEO、pubMed等很多常用的数据库,把序列和相关文献都汇集到一起,用起来就像谷歌百度一样包罗万象。相信你不少听到别人说去NCBI 查一下,其实准确来说是去Entrez查一下,因为NCBI只是一个组织,Entrez才是干活的。

什么是Entrez ID?

NCBI的Gene数据库包含了不同物种的基因信息,其中每一个基因都被编制一个唯一的识别号ID(因此不同生物或者同属不同种的生物间的同源基因编号也不相同), 这个ID就叫做Entrez ID,就是基因身份证啦。它对应于染色体上一个gene location。

解惑基因的命名_第2张图片
image

如何检索Entrez?

选择Gene数据库,然后输入基因名(symbol)或者编号(ID),比如上面检索BRCA1的过程就是这样

进入官网:https://www.ncbi.nlm.nih.gov/geo/

解惑基因的命名_第3张图片
image

选择Gene数据库,输入待查询的 Symbol 或者 Gene ID.

解惑基因的命名_第4张图片
image

See related 相关的其他数据库名称:

  • Ensembl:ENSG00000012048很明显是Ensembl数据库中的ID号。Emsembl是英国Snager研究所和欧洲分子生物学实验室(EMBI-EBI)共同运作的一个数据库,目的是对真核生物的基因组进行自动化的注释,其中脊椎动物最多,包括爬行类、鸟类、鱼类、哺乳类和两栖类。

    命名规则ENSxxxG/T/Exxx表示物种(除了人类不需要)。其中ENS表示Ensembl,最后的G表示基因ID;T表示转录本ID;E表示外显子ID。

    需要注意的是有的基因名称后面有小数点,后面的数字代表版本,实际分析的时候需要去掉

  • MIM:113705 这个是OMIM数据库中的代号,OMIM是0nline Mendelian Inheritance in Man 即在线版的人类孟德尔遗传,提供人类基因和遗传紊乱的数据,专注于遗传病。其中会对这个基因进行详细的描述,并且有相关的参考文献作指导

  • Vega:OTTHUMG00000157426 来自Vega数据库Vertebrate Genome Annotation 即脊椎动物基因组注释

大部分基因都有自己的5种类型ID,特定的基因如miRNA在miRBase中有自己的ID;LncRNA虽然没有标准的命名,但是相关的数据库IncRNAdb、LNCipedia都有自己的一套命名方式

5种类型:NCBI的entrez ID及gene symbol,Ensembl的gene ID,UCSC的gene ID,KEGG的gene ID,大部分的ID都可以在HGNC中查找

前三种上面有所了解了,那么UCSC的ID以uc开头,BRCA1对应的就是uc002ict.4

KEGG的gene数据库的命名方式是:三个小写字母表示物种,后面再加ID号,例如BRCA1对应hsa:672

https://www.kegg.jp/dbget-bin/www_bget?hsa:672

解惑基因的命名_第5张图片
image

REF:https://www.jianshu.com/p/8ad714617fca

你可能感兴趣的:(解惑基因的命名)