数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用

系列文章目录

数据挖掘—GEO,TCGA,Oncomine联合数据(一)挖掘概述

前言

GEO在线工具:GEO2R


提示:以下是本篇文章正文内容,下面案例可供参考

一、GEO2R是什么?

是GEO在线分析工具,基于此工具可以对部分GEO样品数据进行基因差异表达分析。该工具主要针对芯片数据,借助R 及Limma包完成分析过程,用户只需要在网业上进行简单的点击等手动操作即可获得分析结果

二、使用步骤

1.对样本数据的搜索,这一过程在单细胞中已经讲过,我们就跳过了

如果有不知道的,可以去单细胞的数据下载中去查看

2.使用GEO2R

代开你所需要的GSE侯是这样的,数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第1张图片

 

滑到最下面则是这样的

数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第2张图片

看到下面的那个蓝色的按钮了吗?就点他就好

 数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第3张图片

点开之后这是对每个样本的一些介绍,并且明确分开了两个组的内容,要做差异分析必须要分组,所以按 一下上方的DEfine groups 数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第4张图片

就会出现这样的一个小框,大家输入normal然后点回车在输入tumor,然后按住ctrl键将对应的样本放入分组中,然后往下拉有一个按钮,按下去就会将前250个最有显著意义的基因筛选出来,

数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第5张图片排列顺序是按照p值排序的,为什么按照p值排序大家可以去看我之前的文章。 

 

然后大家看左边每个ID旁边都有一个小三角,按一下之后就会出现这个

 数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第6张图片

 看一看到每个样本每个组之间的表达情况,logFC的值就是表达高的一方与表达低的一方的比值,以2为底。

大家再点这个按钮

 就可以得出样本之间的数据数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第7张图片

 

数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第8张图片

是这样的 ,但是这样的数据我们没法用在后续的分析,所以我们需要处理,选择你要使用的数据,打开excel将数据复制进一个表格中,是这样的

 数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第9张图片

 

然后选中第一列 ,然后在数据一栏中选择分列数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第10张图片

 

 然后选择固定宽度,根据实际需求选择分组

数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第11张图片

  

分开之后,但是发现数据有一堆分号,所以我们是用替换功能将分号替换为空格就好了,然后自己手动修改表头列名就好

然后大家做可视化的时候可以在这完成,大家看下图各种各样的可视化的图都有,数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第12张图片

可以根据自己的实际需要使用可视化图 

 适用范围:

点击这个Full instructions就会出现适用范围

数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用_第13张图片

 

大致范围是:GEO2R是一种交互式网络工具,允许用户比较 GEO 系列中的两组或更多组样本,以识别在不同实验条件下差异表达的基因。结果显示为按显着性排序的基因表和图形集合,以帮助可视化差异表达的基因并评估数据集质量。与 GEO 的其他数据集分析工具不同,GEO2R 不依赖于策划的数据集,而是直接查询原始系列矩阵数据文件。这允许及时分析更大比例的 GEO 数据。然而,重要的是要意识到该工具几乎可以访问和分析任何 GEO 系列,无论数据类型和质量如何,因此用户必须了解 GEO2R限制和注意事项。


总结

本章主要是讲解了GEO的在线工具,如果只是自己用于实验的话,这个在线工具能解决很多需求,它的可视化方便了很多非生信的使用者。

下一章我会讲解(三)GEO数据的下载和数据质量分析

最后我所做的所有分析与教程的代码都会在我的个人公众号中,请打开微信搜索“生信学徒”进行关注,欢迎生信的研究人员和同学前来讨论分析。
ps:公众号刚刚建立比较简陋,但是该有的内容都不会少。图片有的很模糊,主要是因为我用的qq截图然后想直接放到文章里来,结果他不让,我只能放到桌面,在从桌面拖进来,像素就越来越低,生气!

你可能感兴趣的:(生物信息学,数据挖掘)