干货 | 空间转录组和单细胞转录组整合分析方法

空间转录组和单细胞转录组联合分析方法,有基于差异基因映射的多模式相交分析(Multimodal Intersection Analysis, MIA)[1],基于marker基因打分的方法(可通过 seurat 包的 AddModuleScore 函数实现)[2],还有基于“锚点”的整合分析(Integrated)的方法[3],可以将单细胞转录组的细胞类型注释通过一个概率模型迁移到空间转录组的数据上。下面给大家详细介绍这三种联合分析的方法及其应用案例,方便大家根据科研情况选择合适的整合方法,获得最佳的整合结果!

应用 MIA 分析方法解析各细胞亚群在胰腺导管腺癌不同区域的富集

Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas

期刊:Nature Biotechnology 发表时间:2020年1月

多模式相交分析(MIA)的方法计算了空间转录组的区域差异基因与单细胞转录组鉴定的细胞类型的marker基因之间的重叠关系,使用超几何分布推断特定组织区域中特定细胞类型的富集程度,以所有基因为背景计算P值来表示。

文章选取2例新鲜胰腺导管腺癌(PDAC-A和PDAC-B)肿瘤组织同时进行单细胞转录组和空间转录组测序。作者通过单细胞转录组的数据,鉴定出各自组织样本的导管细胞、内皮细胞、免疫细胞和肿瘤细胞等细胞类型;通过空间转录组的组织切片染色,获得了癌变区域、导管上皮组织、正常胰腺组织和间隙组织的空间分布(图1a和图1b),结合空间转录组的分群,绘制了不同区域在组织空间上分布(图1e和图1f)。使用多模式相交分析整合这两种数据,发现特定的组织区域富集特定的细胞类型(图1h和图1i),比如癌变区域富集癌细胞、导管上皮组织富集导管细胞,而PDAC-A样本的癌变区域富集成纤维细胞,表明单细胞转录组鉴定的成纤维细胞处于活化状态。

作者将单细胞转录组与空间转录组数据进行MIA整合分析,实现不同类型、亚群和状态的细胞在组织中高分辨定位,揭示了PDAC组织中不同癌细胞和微环境的相互作用的差异性,将癌细胞状态和细胞亚群的空间分布进行关联,能够在原有转录组测序数据基础上更深一步的探索和挖掘细胞的生物学功能和特征,对癌组织进行全面的解析,将有助于理解疾病发生的机理。

图1 胰腺导管癌的研究

应用AddModuleScore发现皮肤鳞状细胞癌特异的角质细胞在空间上的分布规律

Multimodal analysis of composition and spatial architecture in Human squamous cell carcinoma

期刊:Cell 发表时间:2020年7月

Seurat软件包的AddModuleScore是基于基因集进行打分,首先需要鉴定单细胞转录组数据的某一细胞类型的特异表达基因,对于空间转录组的每个spot,用该基因集的平均表达量减去基因的背景表达水平,基因的背景表达水平是,通过将所有基因按照表达水平分成20组,用每组中100个背景基因的平均表达量的平均值来表示的。

文章将scRNA-seq和ST数据进行整合以表征边缘处的肿瘤细胞与相邻TME细胞之间的相互作用。选取10个病例(每个病例取肿瘤组织和正常组织)进行单细胞转录组的测序,鉴定出上皮、内皮和成纤维细胞及各种免疫细胞类型,发现一类肿瘤组织特有的上皮胶质细胞(tumor-specific keratinocytes,TSK),特异表达MMP10和PTHLH等基因,通过AddModuleScore计算sc-TSK-score,发现TSK富集在癌变区域的边缘位置(图2a-c),同样对TSK临近基质细胞类型(基因集来自病人2的c4和病人10的c2的差异基因的交集)进行打分,发现这些TSK的邻近区域富集癌症相关的成纤维细胞和内皮细胞(图2d-i)。

基于配体-受体对数据库分析,发现TSK参与了广泛的自分泌和旁分泌相互作用,包括与肿瘤相关成纤维细胞(CAF),内皮细胞,巨噬细胞和髓系抑制性细胞(MDSC)等的相互作用。作者将单细胞和空间数据映射的配体-受体网络与特定细胞类型整合,揭示TSK是细胞间通讯的枢纽,cSCC的空间异质性以及控制相关细胞类型定位及状态的潜在细胞间信号,对皮肤鳞状细胞癌进行了多角度高分辨率的整合分析,为进一步的临床研究、免疫疗法的改善提供了依据。

图2 皮肤鳞状细胞癌的研究

Seurat V3整合分析实现大脑皮层不同细胞类型的精细定位

Seurat版本3引入了单细胞数据整合分析的方法,可以鉴定出不同来源的单细胞转录组数据相同或相似的细胞状态(基因表达水平)。该方法基于的“锚点”将两个单细胞数据进行连接,可以用一个已知的参考数据集注释未知的单细胞数据,实现标签迁移(Label Transfer),也可以用于分析空间转录组中每个spot的单细胞类型。

下面我们通过10X官方小鼠前脑切片的空间转录组数据(anterior2)展示这个方法的应用。对空间转录组的数据分群发现,前额叶皮层(frontal cortex)区域分成了4个亚群,用成年鼠的外皮层单细胞转录组数据(数据来源于Allen Institute)进行迁移学习(transfer learning),可以精细地将不同皮层位置的单细胞转数据的细胞类型定位到空间转录组数据上(图3)。

图3 小鼠前脑皮层空间转录组和单细胞转录组整合分析

你可能感兴趣的:(干货 | 空间转录组和单细胞转录组整合分析方法)