现在最炙手可热的单细胞分析包,Seurat
重磅跟新啦!~
Seurat
最初是由纽约大学的Rafael A. Irizarry
和Satija
等人于2015
年开发。
该工具基于R语言
编写,使用了许多先进的统计学和机器学习算法,可以对scRNA-seq
数据进行细胞聚类、细胞亚群鉴定、基因差异表达分析等。
自推出以来,Seurat
不断更新和改进,增加了许多新功能,包括对空间转录组数据的分析和可视化,以及对多组学数据的整合。
每次发文都是顶刊,也是让人着实羡慕啊!~(左右滑动哦,亲)
本次更新至V5
也是做了很多新的升级:
空间转录组分析和多组学分析;
分析流程进一步简化和集成;
处理超大数据;
数据结构优化;
Seurat V5
暂时还不能通过CRAN
安装,通过下面这段代码安装吧。
remotes::install_github("satijalab/seurat", "seurat5", quiet = T)
library(Seurat)
还有一些包会在后面的教程中会用到。
remotes::install_github("satijalab/seurat-data", "seurat5", quiet = T)
remotes::install_github("satijalab/azimuth", "seurat5", quiet = T)
remotes::install_github("satijalab/seurat-wrappers", "seurat5", quiet = T)
remotes::install_github("stuart-lab/signac", "seurat5", quiet = T)
remotes::install_github("bnprks/BPCells", quiet = T)
基于测序(即Visium
、SLIDE-seq
等)和基于成像(MERFISH/Vizgen
、Xenium
、CosMX
等)的空间数据集分析技术都具有独特的优势,需要根据实际情况选择分析方法。
本次更新,Seurat v5
支持空间数据格式,并支持scRNA-seq
整合、反卷积和生态位识别的分析技术。
Seurat v5
提供一行代码解决整合数据问题:
obj <- IntegrateLayers(
object = obj, method = CCAIntegration,
orig.reduction = "pca", new.reduction = "integrated.cca",
verbose = FALSE
)
obj <- FindNeighbors(obj, reduction = "integrated.cca", dims = 1:30)
obj <- FindClusters(obj, resolution = 2, cluster.name = "cca_clusters")
obj <- RunUMAP(obj, reduction = "integrated.cca", dims = 1:30, reduction.name = "umap.cca")
p1 <- DimPlot(
obj,
reduction = "umap.cca",
group.by = c("Method", "predicted.celltype.l2", "cca_clusters"),
combine = FALSE
)
obj <- FindNeighbors(obj, reduction = "integrated.scvi", dims = 1:10)
obj <- FindClusters(obj, resolution = 2, cluster.name = "scvi_clusters")
obj <- RunUMAP(obj, reduction = "integrated.scvi", dims = 1:10, reduction.name = "umap.scvi")
p2 <- DimPlot(
obj,
reduction = "umap.scvi",
group.by = c("Method", "predicted.celltype.l2", "scvi_clusters"),
combine = FALSE
)
wrap_plots(c(p1, p2), ncol = 2)
Seurat v5
提供了一个新的技术,叫bridge integration
,用于整合不同组学
的实验结果,例如单独的scRNA-seq
和scATAC-seq
数据集。
这种方法利用了单独的多组学数据集作为分子“桥梁”,在低维空间中进行整合,并返回一个目标降维(例如integrated.rpca
),旨在将不同批次中的共享细胞类型共嵌入。
整理一下目前提供的整合算法:
- CCA:基于规范相关性分析的整合,适用于具有
相似
细胞类型组成的数据集。- RPCA:基于稀疏主成分分析的整合,适用于具有
不同
细胞类型组成的数据集。- MNN:基于互近邻的整合,适用于具有
相似
细胞类型组成的数据集。- LIGER:基于因子分析的整合,适用于具有
不同
细胞类型组成的数据集。- Bridge:基于字典学习的整合,适用于
不同组学
的数据集。
scRNA-seq
数据集的大小和规模正在迅速增加,甚至超过了摩尔定律。
Seurat v5
更新后,作者引入了新方法来分析、解释和探索跨越数百万个细胞的数据集,即使它们无法完全加载到内存中。
具体而言,可以理解为一种抽样
的分析方法,将大型数据集的代表性子样本存储在内存中以实现快速和迭代分析,而完整数据集仍可通过磁盘存储访问。
此外,基于Ben Parks
在Greenleaf
实验室开发的BPCells
包实现了更高性能的分析。
在原文中,作者对高达130 万个
脑细胞数据集和来自多项研究的150 万个
细胞数据集都进行了测试。
看来以后我们就可以用笔记本电脑
分析数据了。
Seurat v5
更新比较大,有人可能会担心兼容该问题,怕与低版本的Seurat
不兼容,作者也在原文中解释了这个问题,不用担心,完美兼容。
点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰
WGCNA | 值得你深入学习的生信分析方法!~
ComplexHeatmap | 颜狗写的高颜值热图代码!
ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?
Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
scRNA-seq | 吐血整理的单细胞入门教程
NetworkD3 | 让我们一起画个动态的桑基图吧~
RColorBrewer | 再多的配色也能轻松搞定!~
rms | 批量完成你的线性回归
CMplot | 完美复刻Nature上的曼哈顿图
Network | 高颜值动态网络可视化工具
boxjitter | 完美复刻Nature上的高颜值统计图
linkET | 完美解决ggcor安装失败方案(附教程)
......
本文由 mdnice 多平台发布