技术前沿 | CellTrek:结合空间和单细胞转录组数据分析空间结构

2022年3月,德克萨斯大学的Nicholas E. Nasvin团队在Nature Biotechonology上发表题为“Spatial charting of single-cell transcriptomes in tissues”的研究论文,开发了一种名为CellTrek的计算方法,结合了空间转录组以及单细胞转录组数据集,通过共嵌入和度量学习方法来实现单细胞空间映射。使用模拟和原位杂交数据集对CellTrek的基准测试证明了其准确性和稳定性。对小鼠肾脏及大脑等数据集的测试证明了CellTrek可以精确地映射不同组织类型的单个细胞,以解析它们的空间结构。



研究背景


近年来,单细胞转录组测序技术(scRNA-seq)和空间转录组(ST)技术的出现加深了人们对细胞异质性、不同细胞类型的基因表达程序的理解。但scRNA-seq、ST技术在使用时都存在局限性,scRNA-seq可以分析单细胞的转录组,但在组织分离过程中会丢失细胞空间信息,而空间信息对于理解细胞微环境和细胞间的相互作用至关重要;ST技术可以跨组织切片对基因表达进行空间分析,但由于不具备单细胞分辨率,仅限于测量小区域的混合细胞群体。

CellTrek可以根据scRNA-seq和ST数据直接将单个细胞映射到组织切片的空间坐标。这种方法不同于反卷积,可以更灵活、更直接地研究具有空间结构的单细胞数据。CellTrek工具包还提供了两个下游分析模块,用于空间共定位分析的SColoc和用于空间共表达分析的SCoexp。



主要结果

CellTrek工具概述

CellTrek首先将ST和scRNA-seq数据集成到共享的特征空间中。CellTrek使用ST数据训练多元随机森林(RF)模型,使用共享降维特征预测空间坐标。为了提高空间分辨率,在ST数据上引入了空间非线性插值方法。然后将训练的模型应用于共嵌入的数据,推导出一个RF距离矩阵,该矩阵测量ST点和空间坐标监督的单个细胞之间的表达相似度。

CellTrek基于RF距离矩阵,使用阈值化后的相互最近邻(MNN)生成稀疏点小区图。最后,CellTrek从相邻点传输细胞的空间坐标。为了提高兼容性,CellTrek可以接受从其他方法(例如,novoSpaRc20)计算出的任何细胞位置概率/距离矩阵,作为细胞空间图的输入。


图1.  CellTrek工作流程图



小鼠脑细胞的拓扑结构


为了比较CellTrek的性能,该研究在后续测试中比较了CellTrek、NVSP-CellTrek(先用novoSpaRc方法计算的细胞空间概率矩阵,随后用CellTrek进行空间映射)、SrtCT(Seurat坐标转换)三种方法的结果。首先利用了3个空间数据集模拟生成的ST数据来测试CellTrek的性能,与其他方法相比,CellTrek在多种条件下有更好的表现,在空间上映射出了更多的细胞,并且有最小的相对熵。这些结果表明CellTrek是在不同实验条件下进行单细胞空间映射的稳健方法。

随后,将这三种方法应用于公开的小鼠大脑scRNA-seq(Smart-seq2)和ST数据集(Visium, 10x Genomics)。结果显示CellTrek重建了清晰的层状兴奋性神经元亚型的层状结构。NVSP-CellTrek显示了类似的空间层趋势,从而展示了CellTrek方法的灵活性和一致性,但是NVSP-CellTrek在某些区域存在稀疏的细胞映射。而SrtCT则未能将细胞位置准确投影到组织学图像上。使用CellTrek中用于空间共表达分析的下游模块Scoexp分析L5端脑内侧束(IT)细胞的基因共表达情况,识别出中两个在不同生物学功能中富集的共表达模块。该结果表明SCoexp能够识别同一细胞类型内细微的转录差异,并推断其拓扑异质性。


图2. CellTrek,NVSP-CellTrek和SrtCT生成的小鼠脑组织中单细胞空间图的比较


利用SCoexp(CellTrek下游分析模块),该研究探索了基因在脑内L5区域细胞中进行空间共表达的过程,鉴定出有两个共表达式模块(K1,K2)富集了不同的生物学功能。具体而言,K1模块在细胞状态Hsd11b1-Endou、Whrn-Tox2中高度活跃,空间定位于外层;K2模块在Col27a1、Col6a1-Fezf2和Batf3中高度活跃,主要位于内层。上述结果表明,SCoexp能够识别同一细胞类型内细微的转录差异,并推断其拓扑异质性。


图3. 空间共表达模块的识别



乳腺导管原位癌的空间亚克隆异质性

使用CellTrek对来自乳腺导管原位癌的scRNA-seq和ST(Visium, 10x Genomics)数据进行了分析。研究团队首先通过细胞聚类和差异基因表达分析鉴定出scRNA-seq数据中五种主要的细胞类型,包括上皮细胞、内皮细胞、成纤维细胞、骨髓细胞和自然杀伤细胞。使用CopyKAT在scRNA-seq数据中推断细胞的拷贝数改变(CNAs),并结合CNAs信息对这些细胞进行聚类,得到3个主要的肿瘤亚克隆(Clone1-3)。


图4. 基于scRNA-seq的肿瘤亚克隆鉴定


为了解三个肿瘤亚克隆体的空间分布,该研究将CellTrek应用于scRNA-seq和ST数据中进行分析。结果显示,大多数肿瘤细胞均可映射到乳腺导管原位癌区域。此外,不同的肿瘤亚克隆映射到不同的导管区域,反映出肿瘤内广泛的空间异质性。


根据各导管的亚克隆组成,对其进行聚类分析并计算了Shannon指数,共得到4个亚克隆组成和空间格局不同的导管分类。综上所述,CellTrek可以绘制出乳腺导管原位癌组织中不同肿瘤亚克隆体及其表达程序的拓扑结构图。


图5. 乳腺导管原位癌空间亚克隆的异质性



乳腺导管原位癌组织的空间肿瘤免疫微环境

此外,该研究使用CopyKAT分析了乳腺导管原位癌样本中3,748个单细胞和2,063个ST位点,并发现了一个非整倍体上皮细胞亚群。为研究肿瘤免疫微环境,该研究集中分析了非整倍体细胞和来自scRNA-seq数据的免疫细胞,使用CellTrek将大部分非整倍体细胞映射到组织学定义的乳腺导管原位癌区域中,而免疫细胞则映射到了周围的导管和间质区域。分析显示,免疫细胞(包括T细胞、B细胞、髓系细胞和pDC细胞等)都富集在导管以外的区域。


结合CellTrek和组织染色结果,进一步对ST位点进行了三级淋巴样结构 (TLS)评分。结果显示,TLS评分高的ST位点通常对应混合免疫细胞富集的区域,ST-TLS评分与免疫细胞计数也呈显著正相关。上述结果表明,CellTrek能够基于scRNA-seq和ST数据重建空间肿瘤免疫微环境。


图6. 乳腺导管原位癌组织的空间肿瘤免疫微环境




研究结论

综上,CellTrek采取了与之前反卷积不同的方法,直接将单个细胞投射到组织切片的空间坐标上,使其可以充分利用scRNA-seq数据。CellTrek可被用于从空间方面研究单个细胞的任何特征如细胞类型和伪时间等,是一种准确且稳健的方法。同时,它将任何细胞位置概率/相似性矩阵作为输入来重构细胞映射,如文章中用到的NVSP-CellTrek,也得到了优于先前方法的结果,体现其良好的兼容性。


参考文献

Wei R, He S, Bai S, et al. Spatial charting of single-cell transcriptomes in tissues.Nat Biotechnol. 2022; 10.1038/s41587-022-01233-1.


李超  | 文案


你可能感兴趣的:(技术前沿 | CellTrek:结合空间和单细胞转录组数据分析空间结构)