hello,大家好,今天给大家分享一个很重要的空间转录组的分析内容,空间临近通讯网络,参考文献在Learning directed acyclic graphs for ligands and receptors based on spatially resolved transcriptomic analysis of ovarian cancer,非常好的方法,有助于建立通讯的空间结构网络,我们来看看如何做的。
Abstract
了解肿瘤样本中免疫激活和抑制机制的关键瓶颈步骤是识别肿瘤微环境 (TME) 中肿瘤细胞与免疫/基质细胞之间细胞间通讯的转录信号。细胞间通讯广泛依赖于分泌配体和细胞表面受体之间的相互作用,它们通过许多配体-受体路径创建高度连接的信号网络。原位组学分析的最新进展,如空间转录组学 (ST) 分析,为直接表征支持细胞间通讯的配体 - 受体信号网络提供了独特的机会,这在基于bulk或单细胞组学的基础上是不可行的数据。在本文中,分析专注于高级别浆液性卵巢癌 (HGSC),并提出了一种新的统计方法 DAGBagST,基于空间转录组数据来表征卵巢肿瘤中相邻肿瘤和基质细胞之间的配体-受体相互作用网络。 DAGBagST 利用directed acyclic graph (DAG) 模型和一种新颖的方法来处理在 ST 数据中观察到的零膨胀分布(关于零膨胀分布,大家可以参考我之前的分享零膨胀负二项模型(ZINB,10X单细胞和10X空间转录组的基础知识))。它还利用现有的配体-受体调节数据库作为先验信息,并采用引导聚合策略来实现稳健的网络估计。将 DAGBagST 应用于来自四名 HGSC 患者的肿瘤样本的 ST 数据集,并确定了相邻肿瘤和跨多个肿瘤的基质网格之间常见和不同的配体-受体调节。这些结果揭示了与这些卵巢肿瘤中肿瘤和 TME 细胞之间的通讯相关的生物学过程。
Introduction
高级别浆液性卵巢癌 (HGSC) 是最致命的妇科恶性肿瘤,几十年来其令人生畏的总生存率没有显著变化。尽管通过大规模下一代测序分析对 HGSC 基因组landscope的可重复描绘做出了巨大努力,但对于具有化学抗性的 HGSC 患者,仍然缺乏治疗上可行的预测生物标志物或治疗靶点。充分理解 HGSC 的肿瘤进展机制和化学耐药性的一个主要挑战是其高度的肿瘤内异质性,包括肿瘤克隆异质性和组织结构异质性。后者反映在卵巢肿瘤微环境 (TME) 中的异质基质和免疫细胞群。原位组学分析的最新进展表明,TME 中肿瘤/免疫/基质细胞之间的细胞间相互作用与肿瘤进展以及治疗耐药性之间存在重要联系。然而,在 HGSC 中形成这些细胞-细胞相互作用的分子机制在很大程度上仍未得到探索。
一种主要类型的细胞-细胞信号传导是通过一个细胞的配体与相邻细胞的同源受体之间的相互作用来驱动的。 空间转录组学 (ST) 分析技术的最新发展为全面表征相邻细胞(例如 ST 载玻片上相邻网格的细胞)之间的配体 - 受体相互作用提供了前所未有的机会,这在基于bulk细胞或单细胞的情况下都是不可行的 RNA profiles。 在本文中,旨在基于使用 ST 平台从四个 HGSC 卵巢样本收集的空间转录组数据来表征 HGSC 中的配体-受体调节网络。
使用基于网络的系统学习方法检测基因或通路中疾病相关调节模式的能力已在许多疾病研究中得到证实,包括癌症、COPD 等。具体而言,基于组学数据构建的directed acyclic graph (DAG) 最近已被用于推断重要的基因-基因相互作用。然而,由于存在多重挑战,现有的 DAG 方法不能直接应用于 ST 数据来构建配体-受体网络。首先,需要在配体-受体网络学习中同时结合空间信息和组学特征,而现有的 DAG 方法/软件并不容易支持这一点。其次,在 ST 实验中一个组织点的测序输出中,由于生物学因素(例如该基因未在该网格的细胞群中表达)和技术因素(例如读取实验深度有限)。由此产生的表达测量值的零膨胀分布给有效的网络推理和机械解释带来了统计和计算挑战。第三,一个组织样本不同点的 UMI 计数水平受技术变化(例如不同的文库大小)和生物学变化(例如细胞类型组成)的影响。因此,在下游分析之前,需要正确实施标准化。
为了应对这些挑战,作者开发了 DagBagST,这是一种基于 ST 数据构建配体-受体网络的新工具。在 DagBagST pipeline中,我们引入了Neighbor Integrated Matrix (NIM) 来整合 ST 数据中的空间信息和分子信息。 DagBagST 然后使用二元变量以及节点空间中每个配体/受体的连续变量,这样(i)二元指示符代表配体/受体的开/关状态,即是否有活性/表达或沉默/不表达,while (ii)给定配体/受体表达,连续变量代表配体/受体表达的丰度。这种编码策略不仅可以模拟 ST 数据中的零膨胀,而且还可以更好地检测那些主要通过配体/受体的活动/非活动状态发出信号的相互作用。为了解决在一次 ST 实验中跨网格spot大小的变化,DagBagST 采用了一种聚合框架,该框架将 DAG 学习的引导(bagging)过程与基于下采样的归一化相结合,以更好地控制假边缘检测。这种聚合框架还使 DAGBagST 能够灵活地获取边缘方向的先验信息,例如来自现有配体-受体数据库的信息。
DagBagST 分析pipeline应用于 4 个 HGSC 样本的 ST 数据集。 利用来自相关数据库的已知配体-受体调控信息作为先验信息来限制构建 DAG 时的搜索空间。 推断的配体-受体网络揭示了一个共同的枢纽节点 LRP1:LRP1 在富含肿瘤细胞的网格中的表达水平(显着)与在富含基质细胞的相邻网格中 PSAP、A2M、CALR 和 LRPAP1 的表达相关 四个肿瘤中至少有三个。 这些结果表明 LRP1 及其相互作用配体在 HGSC 中可能具有重要的免疫功能。
Method
Background of Directed Acyclic Graph
directed acyclic graph 由节点集 V 和边集 E 组成,边集 E 具有从父节点到子节点的有向边。在 DAG 模型中,节点集对应一组随机变量,边集编码这些随机变量之间的条件依赖关系。 DAG 结构学习相当于识别图中每个节点的父集(也称为邻域)。尽管不同的 DAG 可以编码相同的一组条件依赖(形成 DAG 的等效类),但表明,当且仅当两个 DAG 具有相同的骨架边和 -结构集时,它们才是等价的。骨架边是通过从有向边中移除方向而获得的,并且 -结构是节点 (x1; x3; x2) 的三元组,使得 x1 → x3 ∈ ; x2→ x3 ∈ 和 x1, x2 不相邻。 DAG结构学习的方法主要分为三类,分别是基于分数的方法、基于约束的方法,例如PC算法(PC-alg)和混合方法,例如Max-Min Hill Climbing(MMHC).
DAGBagST
DAGBagST - 用于学习基于空间解析转录组数据的配体-受体相互作用网络。 如前所述,这项任务涉及一些新的挑战。 首先,需要在 ST 数据中整合空间信息和分子概况,以表征来自相邻网格(点)的配体和受体之间的相互作用。 其次,由于捕获或放大失败,ST数据具有很高的丢失(丢失)率,这给下游网络分析带来了统计和计算方面的挑战。 此外,不同 ST 点的 UMI 计数水平通常差异很大。 因此,需要正确地跨 ST 点执行归一化以解释不同的变化来源。
为了应对这些挑战,DAGBagST 首先创建了 Neighbor Integrated Matrices 来整合 ST 数据中的空间信息和分子信息。 然后它使用一个二元变量和一个连续变量对每个基因进行编码,这样二元变量代表基因的活动/非活动状态,而连续变量代表基因表达/丰度,假设基因是活动/表达的。 DAGBagST 还包含一个聚合框架,可以方便地将基于下采样的归一化与基于引导程序的网络推理过程结合起来。 下图说明了 DAGBagST pipiline。
Introduce Neighbor Integrated Matrices
在 DAGBagST pipeline中,从整合了空间和分子信息的给定基因表达数据构建了一个 (NIM)。具体来说,对于给定的肿瘤样本,ST数据中的网格点首先分为两类:富集或不富集的肿瘤细胞。然后确定位于肿瘤区域边界上的富含肿瘤细胞的网格点。将这些点称为索引点,并将它们最近的非富集点称为相邻点。最后,我们通过将索引点的原始基因表达矩阵与相邻点的基因表达矩阵进行叠加,从 ST 数据中导出 NIM。由此产生的 NIM 具有扩展的特征空间,其中来自索引点及其相邻点的基因的表达水平/活动状态分别被视为两个特征。 NIM 背后的基本原理是我们有兴趣表征微环境中非肿瘤细胞(相邻点)中的受体是否/如何受到来自相邻肿瘤细胞(索引点)的配体的影响,反之亦然
Account for zero inflated distributions
为了解决 ST 点中的高缺失率,DAGBagST 使用两个nodes,一个用于二元变量,另一个用于连续变量,来表示网络中的每个基因。 仅当相应的二元变量取值为 1(表示活动)时才评估连续变量的似然性。 这使得二元变量成为相应连续变量的自然父代。 这种建模策略不仅处理数据中的零膨胀,而且在检测主要通过基因的活动/非活动状态发出信号的那些相互作用方面获得了更好的能力。
在分析最近的一项工作中,实现了 DAGBagM,用于在节点空间包含连续变量和二进制变量时进行 DAG 学习。 DAGBagM 采用基于分数的方法,我们对连续节点和二进制节点使用单独的分布,因此允许二进制节点成为连续节点的父节点或子节点。 在基于分数的方法中,DAG 空间往往随着节点数量的增加而呈超指数增长,这使得对最优模型的详尽搜索几乎不可行。 为了应对这一挑战,在 DAGBagM 中,实现了 hill climbing search algorithm的非常有效的实现,该算法使用来自先前步骤的信息来促进当前步骤中的分数计算和非循环状态检查,从而能够学习具有大量节点的图 . 在 DAGBagM 中,基于分数的方法还与引导程序聚合相结合,通过搜索稳定结构来帮助减少误报。
Downsampling Based Normalization and Boostrap Based Model Aggregation
Result
将 DAGbagST 分别应用于每个 ST 载玻片以构建肿瘤特异性配体 - 受体网络。首先,基于高分辨率 HE 图像中的组织和细胞形态,手动注释具有富集肿瘤细胞或基质细胞的 ST 网格(点)。然后,专注于富含肿瘤细胞(肿瘤和肿瘤/基质)的点(网格),并在 2 个网格细胞内确定它们富含基质细胞的相邻点(网格),以构建 DAGBagST 中的相邻整合矩阵。只考虑了配体-受体相互作用数据库中记录的基因,并进一步过滤掉了在一个样本中不到 50% 的点(网格)中检测到的基因。每个样本中每个点网格的总 UMI 的中位数用于 DAGBagST 中的下采样归一化。下表给出了每个样本中肿瘤和基质斑点(网格)的详细编号,以及相邻肿瘤基质斑点(网格)对的数量。该表还列出了具有足够 UMI 数据点的配体/受体基因的数量,以在每个样本中构建网络。
使用 DAGBagST,构建了四个肿瘤特异性配体-受体网络,四个 HGSC 样本中的每一个都有一个。 如方法中所述,DAGBagST 为每个基因引入二元变量以指示配体/受体的开/关状态,这有助于解释 ST 数据中的零膨胀。 此外,DAGBagST 可以灵活地考虑边缘的先验信息,这使我们能够将搜索空间限制在配体 - 受体相互作用数据库中记录的配体 - 受体相互作用边缘,以有效降低维度。
样品 4、5、10 和 12 的配体-受体网络分别包含 55、54、134 和 102 个配体-受体调节边缘。 在四个肿瘤样本中观察到共同和独特的相互作用模式。 具体而言,LRP1 似乎是所有四个网络中的中心节点,对于样本 4、5、10 和 12,其度数分别为 5、7、4 和 8。 LRP1Tumor(肿瘤斑点网格中的 LRP1 水平)和 PSAPStroma(基质斑点网格中的 PSAP 水平)之间的相互作用是在所有四个肿瘤样本中检测到的唯一边缘。 除了 PSAP,LRP1 肿瘤的多种其他相互作用也在肿瘤之间共享。 例如,在四个肿瘤中的三个肿瘤中,LRP1Tumor 被推断为与相邻的基质点网格中的 A2M、CALR 和 LRPAP1 相互作用。 另一方面,也存在肿瘤特异性相互作用,例如样本 4 中的 LRP1Tumor -C1QBStroma 和样本 12 中的 LRP1Tumor - APOEStroma。
Discussion
为了深入了解肿瘤微环境中细胞-细胞相互作用的分子基础,在本文中,引入了一种新的统计方法——DAGBagST,以基于空间转录组数据推断相邻细胞之间的配体-受体相互作用网络。 DAGBagST 基于有向无环图贝叶斯图形模型的最新发展,采用新颖的处理方法来正确处理 ST 数据的空间结构和高丢失率。 它还利用现有的配体-受体调节数据库作为先验信息,并使用引导聚合策略来实现稳健的网络边缘估计。
将 DAGBagST 应用于四个高级别浆液性卵巢癌样本的 ST 数据集,并构建了患者特异性配体-受体网络。 结果揭示了在不同患者中分别富含肿瘤和基质细胞的相邻网格点网格之间的共同和不同的配体-受体调节。
LRP1 已被确定为所有四个配体 - 受体网络中的枢纽节点。 LRP1(低密度脂蛋白受体相关蛋白 1)最初被确定为肿瘤抑制因子,因为它对肿瘤细胞的可塑性和迁移能力发挥了显着控制,据信它参与控制乳腺癌肿瘤细胞的侵袭潜力。有趣的是,在所有四个样本中都检测到 LRP1Tumor 和 PSAPStroma 之间的相互作用。 pSAP (prosaposin) 是四种 saposins A-D 的常见前体,是鞘脂降解和膜消化的重要参与者。 PSAP 在细胞内靶向溶酶体,也可以被 LRP1 分泌和再内吞。人类蛋白质图谱中 Cell Type Atlas 的单细胞 RNAseq 研究表明,PSAP 在巨噬细胞(包括 Hofbauer,一种胎盘巨噬细胞和 Kupffer,一种肝脏巨噬细胞)和单核细胞中的表达明显高于其他细胞类型。 Saposins 及其前体 pSAP 已被建议在脂质抗原呈递中发挥重要作用,这是一种激活脂质特异性 T 细胞的机制。例如,表达 CD1b 的人类 pSAP 缺陷成纤维细胞未能呈递分枝杆菌酸、GMM 和 LAM,以激活抗原特异性 CD1b 限制性 T 细胞克隆。还假设 pSAP 依赖的凋亡小泡加工有助于 DC 中的抗原传递和随后的 CD8+ T 细胞反应。我们的发现进一步表明 pSAP 以及 LRP1 在 HGSC 中可能具有重要的免疫功能。
推断与 LRP1 相互作用的另一个有趣的配体是 C1QB。 然而,LRP1Tumor 和 C1QBStroma 之间的相互作用仅在来自化学敏感患者(PFS > 6 个月)的#4 肿瘤中检测到。 C1QB 是先天免疫的模式识别分子,可由巨噬细胞和树突细胞局部合成(引用)。 这里检测到的 LRP1 和 C1QB 之间的联系表明 LRP1-C1QB 串扰网络在调节免疫反应中的潜在作用,这可能会导致 HGSC 患者的生存期提高。
In summary, spatial transcriptomic data provide an unprecedented opportunity to pull back the curtain of the molecular mechanism underlying the cell-cell interaction in the tumor microenvironment. The proposed method is a useful tool to construct the global ligand-receptor interaction networks based on ST data. Results from this type of analyses help to reveal important players driving cell-cell interactions, and potentially can lead to identification of new predictive biomarkers or therapeutic targets
生活很好,有你更好