GEO数据库

GEO数据库是什么?

1.GEO,全称Gene Expression Omnibus,中文名叫基因表达综合数据库,网址(https://www.ncbi.nlm.nih.gov/geo/),是由美国国立生物技术信息中心于2000年创建并维护至今的高通量量基因表达数据库
2.GEO是一个国际公共数据库,收录并整理了全球范围内研究工作者上传的微阵列芯片、二代测序及其他形式的高通量基因组数据,并提供免费下载。

数据组织结构

1.GEO数据库有GEO DataSets和GEO Profiles两个子数据库构成。两者的区别是前者以数据集为单位,存储同一实验数据;后者以基因为单位,存储基因在数据集中的表达谱。
2.GEO的数据类型有5种:platform(平台)、samples(样本)、series(系列)、dataset(数据集)、profile(基因表达谱),前四种数据都有GEO专门分配的编号,指向唯一的数据,编号均以GEO缩写“G”+平台缩写+流水号构成:

  • platform:平台编号以“GPL”开头,如GPL16783;
  • samples:样本编号以“GSM”开头,如GSM4567;
  • series:是将构成某个实验的相关样本集中到一个有意义的数据集,包括实验设计、描述、组别、样本等信息以及检测数据文件,以“GSE”开头;
  • dataset、profile:serises数据进一步分析处理成 dataset和profile, dataset即被分析好的series,编号以“GDS”开头; profile则存储一个个基因在DataSet个分组中的表达谱,分配的是流水号,不冠以特定的开头。

GEO数据库的使用

1.点击网址进入NCBI数据库(可直接搜索NCBI)
2.GEO数据库检索页面

image.png

注释: 1.下拉菜单栏选择GEO数据库(GEO DataSets 、GEO Profiles) 2.检索栏,可直接输入关键词或运用布尔逻辑运算符检索 3.高级检索 4.输入检索词后点击search

检索结果解读

image.png

image.png

数据下载

下载页面

下载结果是TXT文件,建议用EXCEL打开。如下图:


image.png

你可能感兴趣的:(GEO数据库)