GEO数据挖掘学习笔记二

学习教程来源于《手把手教你GEO数据库差异基因分析》

本次学习笔记内容为通过GEO2R在线工具进行差异基因分析

通过了解,个人觉得这个方法相比R语言的优势是更普适性,以及更加“傻瓜”,方便学不明白R语言的同学。

第一步:同R语言,找到相关的数据集

第二步:点进页面详情,进行GEO2R在线分析

第三步:选择分组信息,点击分析

第四步:下载数据,得到差异基因数据集,如果仅得到差异基因即可,可不进行后续操作。

第五步:下载基因表达矩阵,查看矩阵信息,打开文档,将多余信息删除,留下geneid和各样本表达量

第六步:通过excel可以筛选logFC>1或者<-1得基因,并可以筛选P<0.05得基因,本步可将无名字得基因数据筛出后删除,清除无效信息即重复信息

第七步:重点 用excel打开数据,将差异基因得geneid和genesymbol复制粘贴于表达矩阵得excel中,通过=vlookup(“geneid那列”2,$A$2:$$表达量得最后一列$样本量,2,FALSE)#这个命令就是通过将表达矩阵中得geneid与差异基因中得geneid匹配,进而将genesymbol与样本表达量匹配起来,得到数值后下拉全部框自动充填,同一方法重复全部样本。就此得到与genesymbol匹配得表达矩阵。#这个方法相比R语言更加好懂,更普适,但麻烦得多,适合刚开始接触得同学,有追求得同学可以去尝试R语言,更加方便。

你可能感兴趣的:(GEO数据挖掘学习笔记二)