GSEA使用(初级)

首先我们先了解一下什么叫做基因富集分析 
基因富集分析是分析基因表达信息的一种方法,富集是指将基因按照先验知识,也就是基因组注释信息进行分类。
2005年提出了基于基因集(gene set)定义的基因富集分析方法。  首先要定义基因集,也就是基于我们的先验知识(基因组注释信息),将基因富集,可以想象成,用一堆代表基因功能的箱子(bin)把具有相同或相似功能的基因装起来,起到了降维的作用,当然,每个基因可能同时参与好几种功能。
这样,得到这两组数据后,我们所分析的不是单个基因表达的差异,而是箱子与箱子之间的差异。由此,我们得到的数据更容易解释。 
 
GSEA基本思想  
使用预定义的基因集,将基因按照在两类样本中的差异表达程序排序,检验预先设定的基因集合是否在这个排序表的顶端或者底端富集。
 
GASEA原理
PNAS文章Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles.Proc Natl Acad Sci U S A. 2005 Oct 25;102(43):15545-50. Epub 2005 Sep 30. 
 
GSEA如何使用
我们只需要一个表达矩阵,并做出分组说明的cls文件
说明书的测试数据http://software.broadinstitute.org/gsea/datasets.jsp
数据要求格式:http://www.broadinstitute.org/cancer/software/gsea/wiki/index.php/Data_formats

GSEA使用(初级)_第1张图片
加载数据
GSEA使用(初级)_第2张图片GSEA使用(初级)_第3张图片GSEA使用(初级)_第4张图片GSEA使用(初级)_第5张图片

官网 http://software.broadinstitute.org/gsea/index.jsp
官网下载 http://software.broadinstitute.org/gsea/downloads.jsp
安装前需要安装好java环境
官网说明书 http://software.broadinstitute.org/gsea/doc/desktop_tutorial.jsp 

你可能感兴趣的:(生物信息学)