GEO数据库的使用(一)

1、GEO数据库介绍
GEO全称GENE EXPRESSION OMNIBUS,由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。创建于2000年,收录世界各国研究机构提交的高通量基因表达数据。
GEO上有四类数据GSM, GSE, GDS, GPL
1.GSM是单个样本的实验数据
2.GDS是人工整理好的关于某个话题的GSM的集合,一个GDS中的GSM的平台是一样的
3.GSE是一个实验项目中的多个芯片实验,可能使用多个平台
4.GPL是芯片的平台,如Affymetrix, Aglent等

网址入口:http://www.ncbi.nlm.nih.gov/geo

2、GEO数据下载
例如:我想找胃癌相关的疾病资料、研究文献,那么可以直接搜索gastric carcinoma
GEO数据库的使用(一)_第1张图片
若只想关注人相关的研究,在右方选择——如图:
GEO数据库的使用(一)_第2张图片
GEO2R是自带在线分析工具:
GEO数据库的使用(一)_第3张图片
定义分组:下拉分别创建两个分组:T(肿瘤组)、C(对照组)
GEO数据库的使用(一)_第4张图片
GEO数据库的使用(一)_第5张图片
对样本进行分组:选择后点击T或C即可
GEO数据库的使用(一)_第6张图片
这里我们只保存了前250个基因
GEO数据库的使用(一)_第7张图片
前250个基因如下,点击保存
GEO数据库的使用(一)_第8张图片
GEO数据库的使用(一)_第9张图片
将以上结果粘贴保存在TXT中,然后用EXCEL打开,如下
这样我们就可以根据自己需求对其进行分析处理
GEO数据库的使用(一)_第10张图片

此外,这里还提供了芯片质量控制的线箱图如下所示
GEO数据库的使用(一)_第11张图片
还提供了R代码,这些代码修改后还可以供以后分析时使用
GEO数据库的使用(一)_第12张图片

你可能感兴趣的:(GEO数据库的使用(一))