使用monocle包进行pseudotime分析

欢迎关注”生信修炼手册”!

monocle是一个专门用于分析单细胞转录组数据的R包,提供了聚类,pseudotime, 差异分析等多种功能,该项目的网址如下

https://cole-trapnell-lab.github.io/monocle-release/

本文主要介绍使用该R包进行pseudotime分析的步骤,可以分为以下5步

1. 读取数据

monocle包有很多种读取数据的方式,这里只展示了读取Seurat中的对象的方法,代码如下

# 加载需要的R包
library(Seurat)
library(monocle)
# 设置cell ranger输出结果目录
input_dir <- "/scRNA/outs/filtered_gene_bc_matrices/GRCh38/"
# 读取数据
pbmc.data <- Read10X(data.dir = input_dir)
# 创建Seurat中的对象
pbmc <- CreateSeuratObject(raw.data = pbmc.data, project = "10X")
# 将Seurat中的对象转换为monocle识别的对象
cds <- importCDS(pbmc)

monocle中,用CellDataSet这种class来存储数据,示意如下

使用monocle包进行pseudotime分析_第1张图片

2. 预处理

代码如下

cds <- estimateSizeFactors(cds)
cds <- estimateDispersions(cds)

第一行代码用于评估每个细胞的sizefactor, 用于后续归一化;第二行代码计算基因的方差。

通过pDatafData两个函数,可以查看基因和细胞的相关信息,示意如下

使用monocle包进行pseudotime分析_第2张图片

3. 筛选基因

筛选基因没有一个固定标准,可以根据自己的需要灵活选择,这里只展示其中一种

disp_table <- dispersionTable(cds)
unsup_clustering_genes <- subset(disp_table, mean_expression >= 0.1)
cds <- setOrderingFilter(cds, unsup_clustering_genes$gene_id)

4. 降维分析

使用DDRTree的方法进行降维分析,代码如下

cds <- reduceDimension(
  cds,
  max_components = 2,
  method = 'DDRTree')

5. psudotime分析

代码如下

cds <- orderCells(cds)

运行之后,对于每个细胞,会给出一个pseudotime值,示意如下

使用monocle包进行pseudotime分析_第3张图片

可视化的代码如下

plot_cell_trajectory(cds)

使用monocle包进行pseudotime分析_第4张图片

降维之后,在二维空间展示细胞pseudotime的分布,可以看到是一个树状结构,除了上述方法外,还可以根据pseudotime的值给细胞赋颜色,代码如下

plot_cell_trajectory(cds, color_by = "Pseudotime")

使用monocle包进行pseudotime分析_第5张图片

其实就是将fData中对应的列设置为颜色,如果想要观察不同细胞亚型的分布,可以在fData中新增一列细胞对应的cluster ID, 然后用这一类来设置颜色。

对于pseudotime分析,我们需要明白它的基本输入就是一张基因在细胞中表达量的表格,与细胞的聚类结果无关,只不过在可视化的时候根据聚类的结果填充了颜色而已。

·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

使用monocle包进行pseudotime分析_第6张图片

你可能感兴趣的:(使用monocle包进行pseudotime分析)