不可错过的单细胞转录组研究新维度:空间转录组

作者:路子
审稿:童蒙
编辑:amethyst

引言

把病理切片裂解制备成单细胞悬液,得到了“是什么”,却丢失了“在哪里”。如何兼得类型和位置信息呢?follow me! 跟小编一起解开空间转录组技术的面纱吧。


在生命科学研究的道路上,历经了多组学联合覆盖“面”的,单细胞技术涉及“点”的研究历程,为了更加深入地对生命机制,疾病机理等研究,科学家不断发明新的技术,丰富新的维度,空间转录组技术也由此得到了很大的提升,操作上由繁至简,技术上由少至多。今天跟大家分享的便是10X Genomics Visium 系统。

初识 10X Genomics Visium

该系统可以划分为5个部分,样本制备、显微镜成像、文库构建、上机测序和数据分析。其中样本制备芯片是承载空间转录组信息捕获的核心技术,capture Area 为6.5 x 6.5 mm捕获点阵组成,每个点阵上包含有直径55μm、间距100μm的携带空间Barcodes和UMI、Poly(dT)的探针群组成。结构如下图所示:

01 样本制备

在样本制备之前,建议先进行组织优化,如下所示对待研究的组织进行透化时间摸索,一般根据研究的样本设置30分钟以内的时间梯度段,该示例为小鼠脑组织,透化时间根据显影选择18min。

选择好透化的时间,就可以进行样本的制备了。注意组织切片不能覆盖芯片红色边框区域。

02 文库构建

10X Genomics Visium 空间转录组文库结构如图所示:

03 上机测序

10X Genomics Visium 系统对接大部分illumina测序平台,下机测序数据为fastq格式。由上述文库结构也可以得知,最后将获得包含空间barcode和UMI信息的28bp的Read1和捕获到的120bp的RNA目标序列Read2。

04 数据分析

10X Genomics visium 提供了两款软件用以空间转录组数据的分析。一个是基于命令行进行图片和测序数据处理的软件SpaceRanger;一个是基于交互操作的可视化分析软件Loupe Browser。这两款软件都可以在其官网上获得,并且操作也比较简单。除此之外,也可以用seurat 单细胞分析的R软件包进行。

1 Space Ranger 分析

整体分析流程如图所示:

Space Ranger Pipeline 分步如下:

Step1:下载软件和参考数据库,自行在10X官网上下载;

Step2:解压软件和参考数据库文件;

tar -xzvf spaceranger-1.0.0.tar.gz
tar -xzvf refdata-cellranger-mm10-3.0.0.tar.gz

Step3:准备数据,执行命令行操作;

这里下载官网demo数据进行。

Space Ranger 包含以下功能,依次为fastq 文件转化、数据分析、文件格式转化、建库gtf文件转化、参考数据库构建、流程测试、上传日志和计算节点检查。mkfastq、mkref 和count 是常用的命令功能。

spaceranger mkfastq
spaceranger count
spaceranger mat2csv

spaceranger mkgtf
spaceranger mkref

spaceranger testrun
spaceranger upload
spaceranger sitecheck
spaceranger-1.0.0/bin/spaceranger count --id=分析的样本名称 --fastqs=待分析的fastq路径 --transcriptome=refdata-cellranger-mm10-3.0.0 --image=组织H&E图片(.jpg or .tiff格式 ) --unknown-slide(--slide=SLIDE 芯片的编号 --area=AREA组织所在的芯片区域) --sample=fastq文件前缀 --localcores=20 --localmem=128
  • Tips :
    虽然空间芯片一共仅5000个Spots,但是程序需要位置信息的匹配等一系列操作,所以需要相当大的内存和线程。一般仅400M reads 数据,按照20个线程,128G内存,运行时间在4-6小时之间。

Step4:数据结果解读。

其中,

  • analysis/文件夹包含了二次分析的结果文件,Spots 聚类信息;

  • *.cloupe文件可以导入Loupe Browser进行可视化分析的;

  • filtered_feature_bc_matrix 为空间Spots基因表达矩阵文件;

  • Spatial/文件夹包含图像文件和图像位置信息文件;

  • web summary.html 是空间转录组分析样本的基本信息文件,可以作为项目的质控文件(后期文章我们将会对空间转录组质控进行专一详细的介绍,敬请期待哦)。

2 Loupe Browser

Loupe Browser 可视化软件,操作个性化较强,也比较简单,这里就不做赘述了(后期文章我们将会对该软件进行专一详细的介绍,敬请期待哦)。这里需要了解的是它可以做组织H&E图片的矫正处理即可。

3 Seurat 分析

Seurat 是一款特别出色的单细胞分析R包,曾经推出了很多优秀的单细胞分析解决方案,在2019年年底推出了空间转录组分析的Seurat3.2版本。今天就和大家一起目睹下它的风采吧~

Step1:Seurat3.2安装;

在安装新版的seurat 之前,需要先安装R3.6版本

devtools::install_github("satijalab/seurat", ref = "spatial")
##也可以先行下载到本地进行安装install.packages("satijalab-seurat-v3.1.1-302-g1cb8a3d.tar.gz", repos = NULL, type = "source")

Step2:读取数据

##先导入需要的R包
library(Seurat)
library(ggplot2)
library(cowplot)
library(dplyr)
##官网直接导入的SeuratData,library(SeuratData)当然我们可以用前面Space Ranger运行的结果数据进行分析
brain<-Seurat::Load10X_Spatial("/path/out/") #读取数据的路径下应包含两个文件,表达矩阵文件和组织图片文件夹,即filtered_feature_bc_matrix.h5 和spatial/

Step3:数据展示

数据预处理,空间Spots表达水平

plot1 <- VlnPlot(brain, features = "nCount_Spatial", pt.size = 0.1) + NoLegend()
plot2 <- SpatialFeaturePlot(brain, features = "nCount_Spatial") + theme(legend.position = "right")
plot_grid(plot1, plot2)

降维聚类分析

brain <- SCTransform(brain, assay = "Spatial", return.only.var.genes = FALSE, verbose = FALSE)##用SCT进行归一化
brain <- GroupCorrelation(brain, group.assay = "Spatial", assay = "SCT", slot = "scale.data", do.plot = FALSE)## 计算SCT noraml与表达水平的相关性
##降维,聚类
brain <- RunPCA(brain, assay = "SCT", verbose = FALSE)
brain <- FindNeighbors(brain, reduction = "pca", dims = 1:20)
brain <- FindClusters(brain, verbose = FALSE)
brain <- RunUMAP(brain, reduction = "pca", dims = 1:20
p1 <- DimPlot(brain, reduction = "umap", label = TRUE)
p2 <- SpatialDimPlot(brain, label = TRUE, label.size = 3)plot_grid(p1, p2)

寻找marker基因

object.markers <- FindAllMarkers(object = brain, only.pos = FALSE, min.pct = 0.20, logfc.threshold = 0.25)
top <- object.markers %>% group_by(cluster) %>% top_n(1, avg_logFC) ##取每个cluster差异最显著的一个marker基因
VlnPlot(object = brain, features = top$gene, ncol = 2, pt.size = 0,idents=top$cluster)##对选取的marker基因进行小提琴图型展示
SpatialFeaturePlot(brain, features = top$gene, ncol = 3, pt.size.factor = 10)#marker基因高亮展示

介绍到这里相信大家对空间转录组10X Genomics visium 分析流程和Seurat 包数据分析都有了一定的了解,那么这项技术主要应用在哪些方面呢?跟自己正研究或者待研究的课题有什么辅助指导意义呢?那就敬请关注我们下一讲吧,空间转录组应用研究思路。我们先预告一下应用领域,如下:

参考文献

https://support.10xgenomics.com/spatial-gene-expression
https://satijalab.org/seurat/vignettes.html

你可能感兴趣的:(不可错过的单细胞转录组研究新维度:空间转录组)