Scillus——提高scRNA-seq数据的处理和可视化(一)

通过对Seurat 包的装饰,提高 scRNA-seq 数据的处理和可视化能力

Scillus有两种使用方式:

  • 从原始数据开始,您应该浏览以下所有部分。
  • 数据整合好的Seurat对象,提高绘图功能,安装好Scillus后可以直接进入Plotting。

接下来我们将分四个步骤进行解读:

  • 1.Scillus安装
  • 2.配置文件准备
  • 3.原始数据的处理
  • 4.绘图(可视化)

1.Scillus安装

请使用以下代码安装:

if (!require(devtools)) {
  install.packages("devtools")
}

devtools::install_github("xmc811/Scillus", ref = "development")

2.配置文件准备

样本数据

示例使用的数据集来自Gaydosik AM等人的研究。它可以从此处下载数据。下载后的文件解压tar xvzf GSE128531.tar.gz。单个.csv.gz文件不需要进行解压缩。为了减少计算时间,数据集仅包含 6 个样本和每个样本 300 个细胞。完整的原始数据可通过GEO 获取。

样本数据格式为:.csv.gz,但 Scillus 也适用于 10x Genomics cellranger 输出格式,如下所示:

$ tree filtered_feature_bc_matrix
filtered_feature_bc_matrix
├── barcodes.tsv.gz
├── features.tsv.gz
└── matrix.mtx.gz

metadata数据

由于每个 scRNA-seq 对象的样本通常不止一个,Scillus 的加载和过滤函数将生成和处理 Seurat 对象列表。应向加载函数提供metadata数据。metadata数据应至少有两列:一列名为sample,另一列名为filefolder,具体取决于输入数据格式。对于示例数据,metadata数据可以通过以下方式构建:

library(tidyverse)

a <- list.files("your/path/to/sample/data/GSE128531_RAW", full.names = TRUE)
m <- tibble(file = a, 
            sample = stringr::str_remove(basename(a), ".csv.gz"),
            group = rep(c("CTCL", "Normal"), each = 3))
file sample group
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-5.csv.gz CTCL-5 CTCL
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-6.csv.gz CTCL-6 CTCL
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-8.csv.gz CTCL-8 CTCL
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-1.csv.gz HC-1 Normal
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-2.csv.gz HC-2 Normal
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-3.csv.gz HC-3 Normal

metada数据中的其他相关信息(例如组、性别、年龄、治疗)都可以加到数据表中,并且它们包含在 Seurat 对象中。此处添加group列是为了演示目的。

对于 10x Genomics cellranger 输出,metadata数据应该有一个列命名folder(如下表)而不是file,并且每个文件夹中应该有 3 个文件,如上所示的树结构。

folder sample group
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-5 CTCL-5 CTCL
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-6 CTCL-6 CTCL
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-8 CTCL-8 CTCL
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-1 HC-1 Normal
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-2 HC-2 Normal
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-3 HC-3 Normal

对调色板的设置

Scillus 的绘图功能将结合调色板(Palette)设置,以确保不同类型绘图中每个变量的着色方案一致。

pal <- tibble(var = c("sample", "group","seurat_clusters"),
              pal = c("Set2","Set1","Paired"))
var pal
sample Set2
group Set1
seurat_clusters Paired

参考文献:
https://github.com/xmc811/Scillus

你可能感兴趣的:(Scillus——提高scRNA-seq数据的处理和可视化(一))