10X单细胞空间联合分析之CARD(即使单细胞数据不匹配)

作者,追风少年i

周四了,很不错,温度26℃,天气多云,非常适合躺平的一天,难得的休息时光,你们好好努力,我负责躺平,大家各得其所,

单细胞空间的分析技术无疑是目前科服最火热的研究手段,时至今日已经形成了“百家争鸣”的态势。2016年,10Xgenomics率先推出商业化单细胞分析系统Chromium以来,激发了单细胞市场的巨大潜力,国内外各大公司也先后进入到了单细胞领域以寻求突破,2017年BD推出了单细胞系统Rhapsody,同一年人类细胞图谱计划启动;2018年单细胞被Science评为十大科学突破技术;2019年单细胞技术被Nature评为生命科学领域年度技术,而同一年,华大制造推出了口袋单细胞分析系统DNBelab C4;此后,国内公司纷纷加入了这场“盛宴”,新格元、寻因、达普、万乘、墨卓、百迈客等公司纷纷推出了各自的单细胞平台及分析系统,以寻求打破10X的垄断。而与此同时,技术也在不断推进,10Xgenomics在2019年率先推出了空间平台技术,引发了另一个分析热点,为了在这场竞争中获得优势,华大、百迈客以及德运康瑞也积极推出了自身的空间平台,以寻求占领空间转录组的制高点,这场紫禁之巅,不知谁能胜出(有创造力的公司,值得大家投身效力)。

5f256946012ef0cbc8052c3d894aa1df.jpg

空间转录组技术(spatial transcriptomics technologies)使我们能够利用空间定位信息对许多组织位置进行基因表达谱分析,从而能够表征空间组织结构。然而,大多数技术(如基于测序 (sequencing-based)的技术)的空间分辨率有限,它们收集组织位置的基因表达测量值可能含属于同质(homogeneous)或异质(heterogeneous)细胞类型群体的细胞混合物因此,通过细胞类型反卷积分析来获得每个空间位置的细胞类型组成可以进一步对细胞类型进行空间定位 (localization)或共定位 (colocalization),以助于创建不同组织的细胞图谱。此外,构建和增强现有空间分辨率的细胞类型组成和基因表达的高分辨率图谱对于揭示细胞类型的精确空间分布和基因的精确空间表达模式也至关重要。

目前而言,单细胞的市场已经得到了很大程度的释放,但是空间转录组仍然是一片“处女地”,由于空间转录组价格、认知、技术特点等一些限制,目前仍需要更大的努力推动空间转录组的发展,其中最为关键的就是空间转录组的精度问题,许多空间转录组技术不具有单细胞分辨率,而是测量来自潜在异质细胞类型的细胞混合物中每个点的平均基因表达,即使像华大、百迈客等空间技术达到了亚细胞级精度,但是在空间注释的时候还是需要将spot合并形成super spot进行下游分析,所以单细胞空间强强联合的交叉领域,成为了研究的关键点

单细胞空间联合分析的方法流派

关于用单细胞数据解析空间位置的细胞类型,主要分为两大流派:

流派1:映射分析的第一步是基于scRNA-seq数据建立细胞类型的表达特征。然后,映射的主要挑战是将基于scRNA-seq的细胞类型是把空间数据分配到每个细胞上。其中典型的代表就是前面提到的Seurat。

流派2:去卷积,去卷积有两种主要方法:推断一个特定spot的细胞亚型比例和对一个特定的空间转录组spot进行评分以确定它与单个细胞亚型的对应程度。基于此来推断空间每个spot的细胞比例。这种形式的去卷积的方法之一是采用基于统计回归的模型,各种线性回归模型已被应用于解卷bulk RNA-seq混合物。估计每个细胞类型在给定捕获点中的确切比例的补充方法是通过贝叶斯统计框架,将概率分布与scRNA-seq数据的基因计数分布相适应。这个流派的经典方法就是cell2location、Spotlight。

单细胞空间联合分析策略
这一篇我们要讨论一个问题,那就是在单细胞空间联合最为头疼的问题,单细胞数据不匹配怎么办,之前的一篇文章我讨论过一个方法,大家可以参考文章10X单细胞空间联合分析之单细胞数据不匹配的处理情况,今天我们来讨论另外一个方法,conditional autoregressive-based deconvolution(CARD),文章在Spatially informed cell-type deconvolution for spatial transcriptomics,2022年5月发表于Nature Biotechnology,文中介绍了一种反卷积方法,即基于条件自回归的反卷积,它可将来自单细胞 RNA 测序 (scRNA-seq) 的细胞类型特异性表达信息与跨组织位置的细胞类型组成对应。虽然是中国人发表的,但是实验室在美国,科研的精神以及数学方面的造诣,国内还是需要多多学习。
现存单细胞空间联合的分析方法大多数都是借鉴于解卷积bulk 数据(RCTD, stereoscope,SPOTlight, cell2location and spatialDWLS),均没有利用空间数据丰富的位置信息。

空间转录组学中的空间定位信息测量组织位置之间的相对距离,并包含用于反卷积的潜在宝贵信息。 具体来说,组织由多种细胞类型组成,这些细胞类型以空间相关的方式分离成组织域,其特征在于细胞类型的域特异性组成,相似的细胞类型在空间上共定位,空间转录组的分析也突出了细胞类型的空间分离和相邻细胞类型组成的相似性。

在单细胞分辨率空间转录组学中,还观察到相似的细胞类型倾向于共定位,共定位模式随距离衰减

图片.png
因此,组织上的相邻位置可能比远处的位置包含更多相似的细胞类型组成。 因此,对细胞类型组成中的邻域相似性进行建模并适应它们的空间相关性将能够在整个组织切片的多个位置之间借用组成信息,从而能够对每个单独位置的空间转录组学进行准确的反卷积。
CARD 是一种基于条件自回归(conditional autoregressive;CAR),并结合单细胞测序(single cell RNA-seq;scRNA-seq)数据中细胞类型特异性表达的信息进行反卷积分析的方法。下图显示了CARD的主要步骤。如图所示, CARD 将空间转录组数据和从scRNA-seq构建的细胞类型特异性参考基矩阵(reference basis matrix)通过非负矩阵分解(non-negative matrix factorization)模型结合, 同时依赖于相近位置的细胞类型组成的空间结构相似性的CAR假设。基于细胞类型组成中的邻域相似性,CARD可以进一步用于构建细胞类型组成和基因表达水平的精细空间图(即使单细胞数据不是十分匹配)。此外,因为相应数据缺失,当reference basis matrix无法从scRNA-seq构建而只有标记基因(marker genes)存在时,CARD 的扩展版本还可以进行无细胞类型特异性参考基矩阵(reference-free)的反卷积分析。这些特性使 CARD 成为一种独特的方法,有助于解开细胞类型的空间定位并促进组织结构的全面映射。
图片.png

overview

图片.png
文章通过大量的仿真实验(simulations)和广泛的空间转录组实例数据对CARD进行了评估。其中实例数据包含了生成于不同的物种, 组织结构,空间分辨率和不同的测序技术的空间转录组数据:小鼠嗅球, 人类胰腺癌,小鼠海马和小鼠大脑切片。以人类胰腺癌为例,CARD利用样本匹配的单细胞数据,对人类胰腺癌组织空间转录数据进行反卷积来分解细胞混合物,从而构建细胞类型空间分布图谱, 并确定了两个不同的癌症区域。计算出来每个癌症区域的特征细胞的空间分布也和测出来的标记基因的空间分布相一致。同时,CARD也能精准定位不同细胞类型在不同组织区域的分布, 比如该课题组发现,成纤维细胞(fibroblast cells)和胰腺癌克隆细胞A型(cancer clone A cells)共定位在癌症区域的上部区域, 这可能和成纤维细胞在肿瘤微环境的重要作用有关。而由S100A 基因标记的胰腺癌克隆细胞B型(cancer clone B cells)主要集中分布在癌症区域的底部区域。同时,由CARD构建的细胞类型组成和基因表达的高分辨率图谱使得不同癌症区域之间的区别更加明显。该图谱有助于识别具有不同空间定位的多种细胞类型和分子标记,这些标记定义了进展、异质性和胰腺癌的区室化。此外,CARD基于其他非样本匹配的单细胞数据以及无细胞类型特异性参考基矩阵(reference-free)的反卷积分析得到的细胞类型空间分布图谱也和以上高度一致。
文中将CARD与MuSiC、RCTD、SPOTlight、Cell2location、SpatialDWLS和 Stereoscope 六种反卷积方法进行了比较,发现CARD都具有优势。首先是小鼠嗅球(MOB)的数据, MOB 数据由四个主要的解剖层组成,这些解剖层以基于 H&E 染色的由内而外的方式进行注释:颗粒细胞层 (GCL)、二尖瓣细胞层 (MCL)、肾小球层 (GL)和神经层 (ONL)。如图2所示, CARD 推断的细胞类型组成准确地描绘了这种预期的分层结构,且通过可视化估计的细胞类型组成矩阵的第一优势细胞类型(PC1)很明显,相比之下MuSiC、SPOTlight、SpatialDWLS 和Stereoscope 无法区分三个外层。
图片.png

文章的代码示例在www.xzlab.org/software.html,方法我个人很喜欢

生活很好,有你更好,百度文库出现了大量抄袭我的文章,对此我深表无奈,我写的文章,别人挂上去赚钱,抄袭可耻,挂到百度文库的人更可耻

你可能感兴趣的:(10X单细胞空间联合分析之CARD(即使单细胞数据不匹配))