GSEA分析

  1. 数据准备
    如果使用在线的Gene sets database,则只需要准备Expression dataset文件(.txt),Expression dataset annotation文件(.cls),如果使用本地的Gene sets database,则需要提前将database文件(.gmt)下载到本地。
    Expression dataset文件:即基因表达矩阵,主要包括基因名,样本名,表达值

    Expression dataset annotation文件:即用于标注Expression dataset的样本数量,分组信息等注释信息的文件,主要包含3行,第一行为三列,第一列表示样本数量,第二列为分成多少个组,第三列为一个固定的数值1,第二行为分组标识,以#开头,然后是各个分组的组名,第三列为每个样本所属的组,顺序与Expression dataset文件中的样本的顺序相同

    Gene sets database文件:即用于进行富集的注释数据库文件,一般是在http://www.gsea-msigdb.org/gsea/downloads.jsp网站下载文件,网站对每个数据库文件都有相应的简单解释介绍,用户可以根据自己的需求进行下载

    用户也可以根据自己的需求自己准备database 文件,该文件主要包含两个信息,第一列为通路的名称,第二列为任意字符,第三列至结束列为该通路所包含的基因(至少为1列,也就是说至少包含一个基因)
  2. 加载数据
    打开GSEA –> 点击Load data –> 选择需要加载的文件(使用在线的Gene sets database则只需要加载Gene expression文件和注释的cls文件,如果使用本地的database文件,则需要加载本地的gmt文件) –> 打开文件没有错误则加载完成





  3. Run GSEA



    在线选择Gene sets database:



    使用本地Gene sets database:

    Run:



    等待计算完成:


    输出目录设置:此处可以自行设置结果输出的工作目录

    设置输出多少张图:
  4. 查看结果
    打开保存结果的目录,找到index.html文件,打开文件就可以查看自己的GSEA所有结果:






    点击Details可以查看每条通路的具体信息,并选择合适自己研究目的条目进行展示:


你可能感兴趣的:(GSEA分析)