R实战 | 用R也可以完成的RNA-Seq分析-1

学习最好的方式就是分享。

最近看到一个在R上进行的RNA-seq 分析流程,恰好自己也有过RNA-seq分析的经验,所以就想结合以前的经验分享这个流程出来。
P.S. RNA-seq 分析有多种流程,本文仅是举出其中一个例子,抛砖引玉。

本文将要介绍的是由Combine Australia所提供的一个针对有参基因组的基因差异表达分析流程。

分析流程的基本信息

  • 目标物种 : mouse(小鼠)
  • 组织 : mammary gland(乳腺)
  • 生理状态:
    • virgin(未怀孕)
    • pregnant(怀孕)
    • lactating (产后哺乳期)
  • 细胞类型:
    • basal stem-cell enriched cells (B)
    • committed luminal cells (L)
  • Six groups (3 conditions x 2 cell types) with 2 biological replicates per group
  • 该文章已经发表在Nature cell biology:
    • ‘EGF-mediated induction of Mcl-1 at the switch to lactation is essential for alveolar cell survival’ (Fu et al. 2015)published in Nature Cell Biology, with both sequence and counts available from Gene Expression Omnibus database (GEO) under accession number GSE60450

流程

  • : Alignment and Counting(该部分需要在linux环境或mac os系统中完成)

  • : RNA-seq Pre-processing

  • : Differential Expression for RNA-seq

  • : Annotation and Visualisation of RNA-seq results

  • : Gene-set testing

本次文章也将以系列的形式呈现,想翻看特定文章的朋友,点该流程目录的相应部分即可。

数据

感兴趣的朋友也可以下载本次分析所需要的数据集,跟着动手尝试:https://figshare.com/s/1d788fd384d33e913a2a

配置

  • 安装了R语言(3.5.0以上)及R studio(可选)

  • 需要的R包: limma, edgeR, gplots, org.Mm.eg.db, EDASeq, RColorBrewer, GO.db, BiasedUrn, DESeq2, Glimma, Rsubread.


这里我们推荐使用Bioconductor安装以上这些包,要注意的是Bioconductor更新后,将R包安装的功能转移到BiocManager::install,见下:

> source("http://bioconductor.org/biocLite.R")

 Error: With R version 3.5 or greater, install Bioconductor packages
 using BiocManager; see https://bioconductor.org/install 

这里要注意Glimma包需要通过在Bioconductor中下载其源文件来安装

源文件的安装方法之一

源文件可以在R studio中安装,在上方工具栏中选择"Tools --> Install packages"

然后,在弹出的窗口中点击"Install from"下拉菜单中选择Package Archive File

最后,选择下载的源文件包即可安装。

待续。

你可能感兴趣的:(R实战 | 用R也可以完成的RNA-Seq分析-1)