Nature Biotechnology| 胰腺癌空间转录组+单细胞测序分析

整合空间转录组和单细胞测序揭示PDAC组织结构


单细胞RNA测序(scRNA-seq)能够系统地识别组织中的细胞群,但描述其空间组织仍然具有挑战性。2020年发表在Nature Biotechnology(IF=54.901)上的文章Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas,结合了基于微阵列的空间转录组(ST)方法,利用一系列spots揭示基因表达的空间模式。开发了Multimodal intersection analysis (MIA)多模式交叉分析,对原发性胰腺肿瘤应用发现导管细胞、巨噬细胞、树突状细胞和癌细胞的亚群具有空间限制。此外,还识别出表达应激反应基因模块的炎症性成纤维细胞和癌细胞的共定位。

结果一:用 scRNA-seq 识别 PDAC 中的细胞群

首先收集了两个未经治疗的PDAC患者的新鲜原发肿瘤,用于平行scRNA-seq和ST分析。scRNA-seq 数据每个细胞具有大约 2500 到 3300 个UMI 和大约 1400 到 1700 个唯一表达的基因。分别确定了PDAC-A和PDAC-B肿瘤中的15种和11种不同的种群,共享的细胞类型的基因表达特征显示患者样本之间具有很强的相关性,验证了对样本群集的注释。基于scRNA-seq的拷贝数变异(CNV)分析区分PDAC癌细胞和非恶性导管细胞。对于每个已识别的细胞类型推断染色体扩增和缺失,并检测到 PDAC-A 中的两个cluster和 PDAC-B 中的一个cluster显示异常 CNV。两个PDAC-A癌症cluster-1和cluster-2表现出TM4SF1(cluster-1)或S100A4(cluster-2)的高表达,而PDAC-B癌症集群在TM4SF1表达中高,表明PDAC-A cluster-1和PDAC-B癌症群的相似性。为了进一步验证 scRNA-seq 数据中识别的TM4SF1和S100A4表达种群是否代表癌细胞群,在源自同一患者的组织石蜡切片上对 TM4SF1 和 S100A4 进行了双重免疫荧光染色进一步验证了这一现象。

图1 两个PDAC肿瘤的scRNA-seq分析


结果二:PDAC 组织空间转录组

组织切片及H&E染色揭示了PDAC的四个主要区域:癌细胞粘连区、非恶性导管上皮区、基质区域和胰腺腺泡区,其中PDAC-B的患者组织不包含正常的胰腺腺泡区。然后对样本进行空间转录组测序,使用芯片特定位置的barcode对序列进行解码,识别每个转录本在组织内的空间定位。使用 H&E 染色图像估计每个 ST spot捕获了大约 20-70 个细胞、约2400个UMI和大约1000个唯一基因。对所有ST spot中表达变异程度最高的基因进行主成分分析(PCA),根据主成分对每个ST阵列的spot进行聚类后,发现所生成的cluster与独立的组织学注释一致,支撑了仅根据ST基因表达在一个切片内识别不同空间区域的能力。

结果三:多模式交叉分析 (MIA)

为了集成 scRNA-seq 和 ST 数据集,作者开发了 多模式交叉分析Multimodal intersection analysis (MIA)。首先划定细胞类型特定和组织区域特定基因集,然后确定它们的重叠程度,相比于随机数值判断其重叠程度是否显著富集。在 scRNA-seq 数据中识别每个细胞类型来定义基因集,相比于其他细胞类型这些基因的表达该细胞类型中具有较高的统计学水平,随后识别出每个空间区域的表达率明显高于其他区域的基因。通过超几何检验,评估在 scRNA-seq 和 ST 模式中提取的基因集是否显著重叠,进而将空间信息与转录组信息联合起来进行其他分析。

图2 PDAC的ST和细胞类型的映射


结果四:识别和映射跨组织区域细胞亚群

scRNA-seq 最有用的方面之一是它能够揭示细胞类型中不同的亚群。因此,作者试图通过识别细胞类型中的亚群,然后应用 MIA 来查询整个组织空间的映射来描述细胞群体内部的异质性。基于scRNA-seq发现两个肿瘤样本中大多数细胞由KRT19+导管细胞组成,这是胰腺外分泌系统的两种主要成分细胞类型之一。作者总共确定了四个导管细胞亚群:(1)表达APOL1和缺氧相关基因的导管细胞亚群;(2)表达TFF1、TFF2和TFF3的终端导管亚群;(3)表达CRISP3和CFTR的中心亚群;(4)表达MHC-II类分子和补体通路成分的抗原呈递导管细胞。虽然MHC-II类分子主要表现在抗原呈递细胞(B细胞、巨噬细胞、树突状细胞)的表面,但肝脏、胃肠道和呼吸道的上皮细胞表达MHC-II类分子。由于它们存在于肿瘤中,这些抗原呈递导管细胞很可能通过促进T细胞活化,在调节肿瘤微环境内的炎症反应方面发挥作用。这四种亚群中,第1类和第4类是先前的单细胞测序没有报道过的,作者通双重免疫荧光实验验证了亚群的存在。

与细胞类型分析一样,作者使用每个导管亚群特有的标记基因,使用 MIA 确定这些导管亚群在组织切片中的富集情况。作者发现PDAC-A患者中的所有导管亚群都富集在组织的导管区域。相比之下,只有缺氧和晚期导管细胞群在癌症区域显著丰富。这些导管细胞所展示的转录表型可能反映来自周围组织的环境信号,例如由于含氧量低,癌区导管细胞可能表达缺氧反应相关基因。相比之下,PDAC-B 中的导管亚群都完全富集于导管上皮区域。

图3 跨组织区域的导管细胞亚群的MIA映射


结果五:整合分析不同癌症人群PDAC组织

在PDAC-A scRNA-seq数据中发现了两个癌细胞群,这些数据在基因和转录上似乎都截然不同。虽然作者发现这两种癌症种群在相应的ST癌症区域中都富含,但它们是否与该地区内不同的细胞类型同位?为了探索PDAC-A患者两个癌症种群是否在相同切片区域共定位的问题,作者对该患者进行了额外的组织切片,确保 scRNA-seq 数据代表所有 ST 部分:肿瘤切片先分为三个部分,然后每个部分被分在 ST 和 scRNA-seq 之间。通过比较PDAC-A新增的区域,作者确定了各自PDAC-A样本区域特有的基因列表之间的重叠,发现整个ST数据集的癌症和基质区域之间有显著重叠。对于每个组织部分中癌症丰富的区域,使用分层聚类进一步将癌症丰富的区域划分为转录组相关的分区。在定义了每个子区域特有的基因集后,再次应用 MIA 映射方法来研究与子区域相关的基因集、每个细胞类型定义的基因集和 scRNA-seq 数据中的子群之间的重叠,进一步定义了细胞类型/亚群与组织空间之间的关联性。

图4 细胞亚群的空间分布情况


结果六:解析肿瘤微环境下的细胞状态关系

最近对癌细胞scRNA-seq数据的研究表明,在胶质母细胞瘤、黑色素瘤、头颈癌等多种癌症类型中,细胞状态是独一无二的。由于ST提供空间信息,是否可以绘制癌细胞状态到不同的空间组织区域,并描述它们与其他细胞类型的相互作用。为此,作者生成了第三个PDAC scRNA-seq数据集并定义PDAC癌细胞中的三个基因表达模块。根据每个模块的基因,注释这些作为缺氧反应,氧化磷酸化和应激响应模块。作者发现单核细胞和T/NK细胞在应激反应模块区域大量富集。综合分析TCGA PDAC数据,结果表明涉及炎症性成纤维细胞和表达应激基因模块的癌细胞之间的关系,并验证了MIA方法对于生成细胞群与空间受限结构的关系的效能。

图5 使用MIA绘制癌细胞状态与细胞亚型之间的关系图


小结:

作者对于单细胞测序和空间转录组信息进行了整合分析,开发了MIA分析方法,系统揭示了胰腺导管腺癌的空间组织结构,为我们提供了良好的整合分析思路。

更多生信文章解读文章 - 生信人 (biosxr.cn)

你可能感兴趣的:(Nature Biotechnology| 胰腺癌空间转录组+单细胞测序分析)