hello,大家好,又是周一,新一周的开始,今天我们要继续分析我们的空间转录组的个性化分析,文章在Spatial Transcriptomics to define transcriptional patterns of zonation and structural components in the liver,其中的一些方法很值得我们借鉴,关于寻找空间转录组的转录模式的方法我分享了很多了,总结在这里,供大家借鉴和学习交流。
10X空间转录组 & 蛋白组联合分析之空间分区模式
10X单细胞(10X空间转录组)分析之寻找目标bases基因集(factors)(PNMF)
10X单细胞(10X空间转录组)基因调控网络分析之DeepSEM
10X空间转录组数据分析之Pattern recognition and clustering
10X单细胞(10X空间转录组)层次聚类分析intra-tumor variability programs
10X单细胞(10X空间转录组)数据分析之NMF寻找转录programs
10X单细胞(10X空间转录组)数据分析之主成分分析(PCA)与因子分析(NMF)
好了,开始我们今天的内容分享
其中最重要的分析有两点
(1)区域A中富含的基因与区域B中富含的基因之间的 Pearson 相关性显示出负趋势,解释为空间分离。 区域A与区域B中存在的所有其他标记基因呈正相关,解释为空间相关(从基因的角度来解释空间隔离)
(2)空间上的距离分析,这是也空间转录组研究的重点。
ABSTRACT
近年来,通过单细胞转录谱重建异质性极大地促进了我们对空间肝脏转录组的理解。然而,小叶单位之间的全局转录差异在物理空间中仍然难以捉摸。在这里,运用空间转录组学来对切片的肝组织进行转录组学分析。分析确认这种复杂组织的异质性主要由小叶分区决定。通过引入新的计算方法(这是我们关注的重点),实现了组织结构之间的转录梯度测量,包括各种方向的几个小叶。此外,数据表明肝脏组织中存在先前转录未表征的结构,有助于器官的整体空间异质性。这项研究展示了综合空间转录组学技术如何用于描绘肝脏中广泛的空间基因表达模式,表明其对肝功能、发育和再生研究的未来影响以及其在临床前和临床病理学中的潜力。
INTRODUCTION
哺乳动物肝脏是基本代谢稳态和解毒的关键器官。 它被认为在重要生物分子(如铵、脂肪酸、氨基酸和葡萄糖)的生成、交换和降解以及各种异生物质化合物和毒素的转化和根除方面发挥着核心作用。 根据物种的不同,肝脏被分成特定数量的叶。 在小鼠中,肝脏可分为四个叶:内侧、左侧(最大)、右侧(一分为二)和尾状核。 成熟的肝脏结构以重复单位排列,称为肝小叶。 简而言之,小叶通常以六边形表示,在与相邻小叶的每个连接处都有一个门静脉 (PV),富含营养的血液从肠道进入肝脏。 最终,耗尽营养和氧气的血液最终在中央静脉 (CV) 中排出。 按区域划分,大多数肝脏常驻细胞 (80%) 是实质细胞,即肝细胞。 其余 20% 的组织由肝脏非实质细胞 (NPC) 组成,包括: 肝内皮细胞 (LEC)、肝脏驻留巨噬细胞 (库普弗细胞) 和其他免疫细胞、肝星状细胞 (HSC) 和其他基质细胞、胆管上皮细胞 (胆管细胞) 和平滑肌细胞,共同构成异质功能性小叶肝环境。肝细胞根据它们与 CV 或 PV 的接近程度沿小叶轴执行不同的功能。 在小鼠中,这种代谢功能的空间划分,称为分区,主要基于肝细胞沿小叶轴的差异表达谱,经典地分为三个区域,区域 1 位于门静脉,中间区域 2 和区域 3 位于 中央静脉。 单细胞空间重建方法的最新发现表明,较小和较少的 NPC 也根据它们沿小叶轴的位置遵循不同的空间表达谱。 这些重建方法 (1) 提供了肝小叶微环境内代谢分工的复杂图像,(2) 基于沿小叶轴的 DGE 确定分区的定义因素,以及 (3) 代表了广泛的基础资源研究了肝分区的概念。 然而,之前的所有研究都进行了激光捕获显微切割 (LCM) 或灌注技术,最终需要在测序前进行组织分离,众所周知,这会改变生理转录图谱。
此外,以前的研究侧重于确定仅在肝小叶微环境中分区的潜在因素。 对单个肝脏切片的研究表明,由于完整器官的 3 维组织和整体复杂性,重复肝小叶的理论组织具有挑战性。 跨组织的小叶以高度不规则的方式组织,并且在组织内的大小和轴向方向差异很大。 此外,小叶与主要血液供应源(即肝动脉和门静脉)的接近程度各不相同。
研究肝组织的另一层复杂性是由它们组织成几个叶而产生的。 这种划分的原因尚不完全清楚,但是,已经提出了某些功能差异。 基因表达谱也可能因区域与其他叶的距离而异。 因此,在单个小叶和扩展组织环境中肝细胞组织之外的 DGE 模式研究很少,对于我们充分了解体内平衡和疾病中的肝功能至关重要。
空间转录组学 (ST) 能够对跨组织切片的空间基因表达进行高分辨率评估,克服与组织解离相关的局限性。 肝脏分区可以对肝脏微环境(小叶)和肝脏宏观环境(组织切片)中的结构进行空间注释。 此外,在肝脏组织切片上执行 ST 有能力揭示新的结构,当使用不允许在空间背景结构中进行分析的方案时,这些结构可能会丢失,这些结构可能对肝脏的整体结构起着至关重要的作用。 (其实空间结构对生物学的任何组织都很重要)。
在这里,对小鼠肝脏组织切片进行 ST,评估在转录水平上导致空间肝脏异质性的空间因素。通过设计和实施各种计算方法,本研究旨在解析参与肝脏分区的血管成分的空间关系(空间细胞的分布特征),并根据其转录谱和原始组织背景探索新的、以前未表征的结构。分析的结果支持分区是导致空间异质性的最突出因素的概念。计算追踪与沿小叶轴分区相关的遗传标记的表达水平使我们能够研究物理空间中的分区梯度,并根据其表达谱推断血管结构的身份。预计,分析的结果,结合先前对构成肝组织整体转录图谱的不同细胞类型的发现,可以增强我们目前对肝组织组织的理解。
RESULTS
Unsupervised clustering defines spatial distribution of expression across liver tissues(看来空间转录组的聚类还是很有必要的)
总共使用了 8 个来自尾状核或右肝叶的野生型成年小鼠肝脏进行组织学染色、文库制备和测序。 在映射、过滤、注释和归一化之后,我们获得了由 19,017 个基因组成的表达数据,这些数据由 ST 阵列上 4,863 个单独捕获位置(spot)的 19,017 个基因组成,并将数据用于下游计算分析。 组织切片下的spot被考虑用于分析和可视化。
- 注:Spatial transcriptomics was performed on a total of 8 murine liver tissue sections. The tissue sections were placed in one of six, 6.2 x 6.4 mm frames on the glass slide ST array. Each frame contains 1932 spots, with >200M uniquely barcoded, mRNA capture probes. The distance between centers of each neighboring spot is 150 μm. Initially, each tissue section was fixed, stained with hematoxylin and eosin (H&E), followed by imaging. Tissue sections were permeabilized, followed by mRNA capture, tissue removal and sequencing. Thereafter, the count data was subjected to cluster- and differential gene expression analysis (DGEA). The results of the clustering and DGEA were further analyzed and spatially annotated at the global tissue context and down to the lobular level. For new spatial annotations, pathway analysis was performed. Liver lobules are classically described by a central vein (CV, red) surrounded by 6 portal nodes (PV, blue) with neighboring bile-ducts (BD, green). For lobular spatial annotations, clusters have been computationally annotated by comparing expression levels in a set of genetic markers linked to metabolic zonation along the lobular axis.
每个spot都被少量的肝细胞混合物覆盖(空间转录组目前还不能做到单细胞精度)。 从苏木精染色的细胞核中,我们估计每个spot包含 5-10 个肝细胞,每个spot最多包含 30 个细胞。 随后,我们通过非负矩阵分解(关于非负矩阵分解,大家可以参考文章10X单细胞(10X空间转录组)数据分析之NMF(非负矩阵分解))将数据嵌入到低维空间中,并使用基于图的方法以无监督的方式对其进行聚类,确定了 6 个cluster。
- 注:Canonical correlation analysis (CCA,这个方法主要是Seurat做整合的方法) was performed to integrate data of eight liver tissue sections, the data was subsequently normalized and subjected to graph-based clustering in which 6 clusters were identified (see methods). The integrated data was embedded in UMAP space (top) and depicted as an overlay of the spot cluster annotation across the tissue (bottom) (scale bar indicates 500 μm).
为了将cluster置于背景中并评估它们的空间组织,将spot投影在苏木精和伊红 (H&E) 染色组织的明场图像上。
投影显示属于某些cluster的点之间存在明显的空间隔离。 乍一看,cluster 5 位于组织切片的专有区域,而属于cluster 1 和cluster 2 的spot在视觉上似乎与肝组织中的血管结构对齐(空间聚类和空间形态结构很匹配)。为了进一步描述已识别的cluster,我们在它们之间进行了 DGE 分析。 事实上,cluster 1 中的差异表达基因 (DEG) 支持先前研究中的门静脉周围基因表达,而先前与中心周基因表达相关的基因在cluster 2 中富集,表明cluster 1 和cluster 2 分别表示门静脉和中央静脉周围的区域。 cluster 3 显示了与血红蛋白相关的基因的富集,而cluster 4 显示了参与免疫相关过程的基因的富集表达。 cluster 5显示间充质基因的富集。
- 注:Heatmap depicting expression values of the five most variable genes for each cluster after subjecting the six clusters to DGEA, with the exception of cluster 3, which resulted in only four significantly differentially expressed genes.
cluster3、cluster4和cluster5的点主要被不同cluster的点所包围,而cluster0、1和2则形成了更具凝聚力的spot群。 有趣的是,cluster 0、3 和 4 的spot似乎以descending order与cluster 0、1 和 2 的点相邻,这意味着大多数cluster的转录谱通常被门静脉周围而不是中心区域包围。 cluster 3 跨切片的分散空间分布很可能是因为组织在冷冻和切片之前没有灌注,这使我们能够检测整个肝脏的血细胞群。 为了近似检测每个点肝细胞预期转录组的方法的可重复性和敏感性,我们检查了基因的表达,据报道,这些基因是组织下各点肝脏中常见细胞类型的标记。
与组织的组织学评估一致,肝细胞标志物 Alb(表达值 > 1)在所有 4863 个点(100%)中的表达表明所有点都包含肝细胞。 对于 LEC,1972 个点显示 Cdh5 28,29 (~8%) 的表达。 淋巴肝内皮细胞标志物 Lyve1 仅在 80 个点中的一小部分(0.02%)中表达。 Kupffer 细胞标记 Clecf4 在 526 个点(~11%)中表达,而星状细胞标记 Reln 在 568 个点(12%)中表达。 Spp1 是胆管细胞的标志物,预计仅存在于胆管中,靠近门静脉,并以点状表达 (~9%) 。
- 注:Visualization of spatial distribution of reported expression markers of Hepatocytes (Alb), liver endothelial cells (Cdh5), Kupffer cells (Clec4f), Cholangiocytes (Spp1), hepatic stellate cells (Reln) and lymphatic liver endothelial cells (Lyve1) by spots under the tissue. Pie-charts indicate the respective proportion of cell type markers present in spots under the tissue (scale bar indicates 500 μm).
这些结果表明,肝脏中体积更大、丰度更高的细胞在数据中是这样表示的,而正如预期的那样,更小和更稀有的细胞类型更分散在整个组织中(细胞类型的空间分布是非常重要的)。
虽然特征标记基因表达是推断某些细胞类型存在的常用方法,但我们希望包括更大的一组基因,这些基因构成特定细胞类型的表达特征,并将其与我们的空间数据进行比较。 Stereoscope,由安德森等人(Single-cell and spatial transcriptomics enables probabilistic inference of cell type topography)开发, 通过使用概率负二项式模型,使来自单细胞 RNA 测序 (scRNA-seq) 数据的细胞类型能够在空间上映射到组织上。 使用这种方法,我们能够在肝组织切片上绘制由小鼠细胞图谱 (MCA) 注释的 20 种细胞类型。值得注意的是,估计 MCA 中门静脉周围和中心周围肝细胞的比例值很高。各点细胞类型比例之间的 Pearson 相关评分显示正相关,可解释为非实质细胞(如 LEC、上皮细胞和大多数免疫细胞以及基质细胞)的空间共定位。
- 注:Visualization of cell type co-localization by Pearson correlations (left). Positive correlation values indicate spatial co-localization of cell types while negative values represent spatial segregation. UMAP embedding of single-cell data of the Mouse Cell Atlas (MCA)41 grouped by annotated cell types (bottom right). Numeration behind the cell types represent annotation of MCA data (B cell-1 = Fcmr high, -2 = Jchain high, Dendritic cell-1 = Cst3 high, -2 = Siglech high, Epithelial cell-1 = Spp1 high, -2 = /, Eryhroblast-1 = Hbb-bs high, -2 = Hbb-bt high, Hepatocyte-1 = Fabp1 high, -2 = mt-Nd4 high, T cell-1 = Gzma high, -2: Trbcs2 high). Encircled clusters in the plot refer to pericentral or periportal hepatocytes of MCA data. Quantile scales of cell-proportions annotated as pericentral and periportal hepatocytes (see methods) are mapped on spatial transcriptomics spot data (top right).
对于与免疫相关的细胞类型,只有中性粒细胞与门静脉周围肝细胞和富含 Fabp1 的肝细胞呈轻微正相关,同时与中央肝细胞呈负相关,表明空间隔离。 有趣的是,门静脉周围和中心周围肝细胞不仅相互之间呈负相关,而且与大多数其他细胞类型也呈负相关。 大部分spot被分配到cluster 1 和cluster 2,并且 100% 的spot包含肝细胞标记,表明 - 在空间上 - 肝脏主要由分区肝细胞构成,而这些细胞仅代表 MCA 的一小部分数据。 这种差异说明了用空间基因表达数据补充单细胞转录组数据以彻底描绘肝脏结构和肝脏组织转录景观的能力,同时证明了 scRNA-seq 数据集成的局限性。 重要的是,门静脉周围和中心周围肝细胞与门静脉和中央集群之间的相关性显示出与空间数据观察到的相似趋势,提倡可靠整合来自 scRNA-seq 数据和我们的 ST 数据的细胞类型注释。
Heterogeneous spatial gene expression linked to pericentral and periportal zonation
来自单细胞整合的门静脉周围或中心周围分区的常见标记基因以及门静脉周围和中心周围肝细胞的空间定位意味着cluster 1 和cluster 2 分别与门静脉和中央静脉共定位。 为了支持这一观察,静脉结构根据胆管和门静脉间充质 (PV) 的存在或缺乏 (CV) 被注释为门静脉、中央静脉或未知类型的静脉(不明确)。 组织学注释和相应cluster的比较支持观察,即cluster 1 表示门静脉周围区域,cluster 2 表示组织切片中的中心周围区域。
- 注:Visualization of spots representing gene expression profiles of cluster 1 (portal vein, blue) and cluster 2 (central vein, red) on H&E stained tissue (right), compared with visual histology annotations of central- (red circles) and portal- (blue circles) veins (left) (scale bar indicates 500 μm).
门静脉周围cluster 1 (PPC) 中富含的基因与中心周围cluster 2 (PCC) 中富含的基因之间的 Pearson 相关性显示出负趋势,解释为空间分离。 PCC基因与PCC中存在的所有其他标记基因呈正相关,PPC标记基因与其他PPC标记呈正相关,解释为空间相关
- 注:Pearson correlations of genes expressed in cluster 1 and 2 ordered by their first principal component (see methods). Genes with high expression in the pericentral cluster (cluster 2) show negative correlation with genes highly expressed in the periportal cluster (cluster 1) and vice versa. Genes present within cluster 1 or cluster 2 exhibit positive correlation with genes in the same cluster.
在 PPC 或 PCC 标记基因与其余 4 个cluster(cluster 0、cluster 3、cluster 4 和cluster 5)之间可以观察到无相关性或相关性较低。 观察到的基于门静脉或中央静脉同一性的肝组织切片空间基因表达的异质性得到了标记基因空间自相关的进一步支持,其中高于 0.2 的值被认为表现出自相关。 较高的值表明基因表达和组织定位的正相关性更强,而较低的值 (<0.2) 表明基因表达和空间的独立性。在 UMAP 嵌入中具有代表性的 pericentral (Glul) 和 periportal (Sds) 标记表达的spot的可视化进一步证明了 Glul 或 Sds 在 pericentral 或 perportal cluster中的最高表达值。 此后,表达值降低,表现出代表相反静脉类型的cluster中spot的最低值。 当在其空间环境中的spot上显示 Glul 和 Sds 的表达时,这些基因在标注为中央或门静脉的区域中表现出最高的表达。 此外,在高 Glul 表达的区域没有发现 Sds 的表达,反之亦然,表明存在于中央cluster1 和门静脉cluster 2 中的基因表达在空间上是不同的,并且彼此呈负相关。
- 注:Projection of selected markers for central venous expression (Glul, top) and periportal expression (Sds, bottom) in UMAP space and spots under the tissue (scale bar indicates 500μm).
Transcriptional profiling of pericentral and periportal marker genes across tissue spaceenable computational annotation of liver veins
为了进一步研究物理空间中的分区,我们首先在组织学注释的静脉上叠加显示中心静脉(Glul,Cyp2e1)和门静脉(Sds,Cyp2f2)的两个代表性标志物表达的组织下的spot。
Glul 负责谷氨酰胺合成酶的表达,谷氨酰胺合成酶是谷氨酰胺合成的主要酶,而丝氨酸脱水酶 (Sds) 是糖异生的关键因素。 Cyp2e1 和 Cypf2 都属于参与异生物质代谢的细胞色素 p450 家族。 Glul 的中心周表达仅限于非常靠近带注释的中央静脉的点,而 Cyp2e1 更均匀地分布在各点上,在附近带注释的门静脉周围无法检测到这两种基因。 对门静脉周围 Sds 和 Cyp2f2 的表达进行了类似的观察。 包括 PCC 和 PPC 的所有标记基因,并创建组织下斑点中各个cluster的所有 DEG 表达的模块分数,我们将沿小叶轴的共同表达梯度可视化。
接下来,我们想评估基因表达是否受与不同静脉类型的空间接近度的影响,正如基于 Halpern 等人的研究所预期的那样(Single-cell spatial reconstruction reveals global division of labour in the mammalian liver),描述了沿小叶轴总共 9 层的表达梯度。 为此,我们生成了所谓的距离图表达式; 将标准化的基因表达描述为与相应静脉类型的距离的函数。为了构建这些图,对于每个点和基因,我们将观察到的表达值与从点中心到最近的静脉边界的距离配对。 最后,为了更好地捕捉距离和expression之间的关系,我们使用 loess 方法平滑我们的观察。 对一组选择的五个门静脉周围和中心周围标记基因的距离图进行表达,这些基因在 PPC 和 PCC 中具有最高的阳性 logFC.在检查图后,距离和表达之间的明显依赖变得明显。 门静脉标志物随着与门静脉的距离增加而逐渐下降。 对于中央静脉,某些基因(例如 Glul、Slc1a2 和 Oat)的表达随着距中央静脉距离的增加而急剧下降,而其他基因(例如 Cyp2e1 和 Cyp2a5)则表现出更缓慢的下降。
- 注:Visualization of the average expression by distance to vein-type measured within 50 μm from the vein. The top row shows expression by distance of portal markers Sds, Cyp2f2, Hal, Hsd17b13 and Aldh1b1 to portal veins in blue and central veins in red, while the bottom row shows distances of central vein markers Glul, Oat, Slc1a2, Cyp2e1 and Cyp2a5 to portal veins in blue and central veins in red (top panel). Visualization of relative proximity of portal vein markers in the top row and central vein markers in the bottom row to both vein types. The gene expression as a function of the logged relative distances (see methods for details), negative values on the x-axis indicate points with closer proximity to central veins in red compared to portal veins in blue and vice versa for positive values, as indicated by the schematic (below graphs).
这些结果与 Halpern 等人(Single-cell spatial reconstruction reveals global division of labour in the mammalian liver)在空间重建层中观察到的表达梯度一致。 此外,我们将 MCA 单细胞数据中带注释的门静脉周围和中心周围肝细胞的映射比例值沿小叶轴对齐,并观察到与标记基因观察到的与其相关静脉类型的距离相同的反比关系 .
虽然距离图的表达揭示了一种静脉类型对物理距离中基因表达的影响,但我们希望同时解释两种静脉类型的最终接近度。 因此,我们开发了距离比图的表达,其中使用了两种静脉类型距离之间的对数比。 使用距离图表达的物理距离的这些比例值,我们可以解释两种静脉类型的存在,研究它们对空间表达presence的影响。 我们观察到沿小叶轴的门静脉基因几乎呈线性关系,表现出最接近中央静脉的最低值和最接近门静脉的最高标记基因表达。 同时,中央标记的表达在非常靠近中央静脉的地方表现出陡峭的负斜率,而向门静脉附近的下降幅度较小。观察到的不同中央和门静脉标志物沿小叶轴表达的差异与早期概念“梯度”型基因沿小叶轴“动态”表达的基因和“室”型基因的“稳定”基因表达一致 直接在中央或门静脉边界处。室类型基因的空间稳定表达以Glu1和谷氨酸转运蛋白Slc1a2为例,对中央静脉的谷氨酰胺转运很重要。 参与铵生产的 Sds 和组氨酸解氨酶 (Hal) 的表达对于门静脉的稳定基因表达而言是独特的。 Cyp2e1 (pericentral) 和 Cyp2f2 (periportal) 说明了梯度型基因的动态表达。
鉴于 PPC 和 PCC 中 DEG 之间的强关联,以及与组织学注释的中央和门静脉共定位的令人信服的证明,我们旨在探索仅基于基因表达以计算方式注释中央和门静脉的潜力。
- 注:Visual histological annotations (left) of central (red) and portal (blue) veins, including ambiguous visual annotations (green), compared with computational prediction, using the 10 marker genes from 3b (right). The classification of vein types is based on a weighted (by distance) average expression of the genes expression profiles in the neighborhood of each vein. In addition, the spatial expression data of spots neighboring uncertain morphological vascular annotations (green) can be used to deduce periportal or pericentral vein-types in the cases where visual annotations are ambiguous.
由于多种原因,静脉的计算注释作为手动注释的补充具有相关性。首先,当只有质量欠佳或没有免疫组织学染色的组织学图像可用时,有时证明视觉注释很困难。其次,这是一个劳动密集型过程,需要彻底的组织学培训,但并不总是可用。因此,计算模型不仅提供了支持视觉静脉注释的可能性,而且还提供了基于其周围基因表达谱预测未注释静脉的类型的可能性。本研究中构建的模型令人信服地对应于视觉注释的中央静脉和门静脉,其基于来自不同生物起源(尾状核和右肝叶)的所有切片的各自邻域的表达谱。基于重叠的视觉和计算静脉注释的可信证明,我们继续对身份不确定的静脉进行计算注释。我们的结果显示了估计的 72 条不明确的静脉分配到中央静脉或门静脉,这是从每个静脉附近的 5 个中央或门静脉标记的子集的距离的表达推断出来的
- 注:Expression by distance of portal - (top panel) and central - (bottom panel) markers. Probabilities for each class (central and portal) can be extracted from the logistic regression model, here given as P(central) or P(portal) (scale bar indicates 500μm).
根据周围spot的空间表达谱推断静脉类型证明了将空间基因表达数据用于各种基于注释的应用的潜力。
Exploration of components contributing to spatial heterogeneity across liver tissues
在染色图像上投影分配给cluster 5的点坐标显示整个组织的一个或两个不同区域中的专属空间组织.
- 注:Projection of spots including transcriptional patterns of cluster 5 in the UMAP (from Fig 1b), on a selected part of a histological section of the caudate lobe (left) and spot location in the entire tissue section (right).
因此,我们询问该cluster如何根据其表达谱适应空间肝脏组织。 此外,我们想评估该cluster的空间组织是否可以指示该组织区域中潜在不同形态结构的功能,其特征在于类似于潜在组织分区的形态。
DGEA 将 Gsn、Col1a2、Col1a3 和 Vim 鉴定为cluster5的高度上调标记基因。第 5 类身份之外的spot,显示未观察到这些基因的表达或低表达
- 注:Visualization of Vim, Col3a1, Col1a2 and Gsn expression in spots of the same tissue section as in 4a。
在四个基因中,Col1a2 和 Col3a1 表示目视检查时的最高表达。 事实上,cluster5标记基因的通路分析表明,属于“胶原和纤维组织”基因本体的基因富集最强.
除了 Col1a2 和 Col3a1 之外,cluster 5 中还有四个标记基因属于这个生物过程(Dpt、Col1a1、Lum 和 Col14a1)。 据报道,胶原原纤维是构成包括啮齿动物在内的几种动物的 Glisson 囊的不规则结缔组织的主要成分,首次表明了cluster5的结构功能。此外,有助于结构形成和发育的过程,例如 作为“细胞外基质组织”和“细胞外结构组织”以及与先天免疫相关的途径,即“对细胞因子的反应”、“通过 MHC II 类肽或多糖抗原的抗原加工和呈递”显示在cluster 5 内富集.
参与“胶原蛋白和原纤维组织”的标志物的表达分数在cluster5点中的点以及它们在组织中的直接接近处最高,而其余组织的分数较低。 相比之下,参与细胞因子反应的标记基因(H2-Eb1、Timp2、Timp3、H2-Aa、Cd74、H2Ab1、Spp1、Gsn、Col3a1、Vim)的表达评分更均匀地分布在整个组织中.
- 注:Module scores of genes (see methods) in cluster 5 belonging to the two biological processes with the highest enrichment scores: “collagen fibril organization” and “response to cytokine” are visualized on spots across the tissue.
这一结果支持了cluster5及其周围组织区域的结构形成和发育过程的更高重要性。
此外,所有cluster的标记基因之间的 Pearson 相关性表明,大多数cluster 5 标记显示cluster 1 或cluster 2 的基因之间没有相关性,并且大多数cluster 5 标记显示显着的空间自相关。 综上所述,cluster 5 标记物的相关性分析和各自组织区域的组织学形态主张cluster 5 的空间组织,独立于肝分区。
DISCUSSION
在哺乳动物肝脏上应用空间转录组学是探索其转录和功能异质性的一个新的、引人注目的场所,同时也补充了以前的数据。 最近的 scRNA-seq 研究包括通过重建进行空间整合,提供了单细胞转录组的高分辨率信息,但由于组织解离,这些细胞在组织内的空间组成丢失,这额外增加了不良转录变化的风险。 相比之下,ST 在其真实的组织环境中保留了基因表达的空间信息,从而绝对补充了单细胞转录组学方法。 将空间转录组数据与同一组织的从头和现有单细胞和其他组学数据相结合的新兴可能性提供了对组织生物学的前所未有的洞察力。
在这里,我们以两种不同的方式将细胞类型信息合并到空间数据中。首先,我们在广泛的表达水平范围内评估了特征标记基因的表达。预计稀少存在的基因的一个例子是淋巴管内皮透明质酸受体 (Lyve1)。与这些罕见的细胞类型相反,据报道,肝组织按面积由多达 80% 的肝细胞组成。因此,在组织下的所有点中都以高频率检测到 Alb 转录物。最近的一项研究表明,库普弗细胞主要定位于肝小叶的门静脉周围区域,细菌感染时会募集中性粒细胞。然而,我们的数据并未表明库普弗细胞标志物在我们数据的门静脉周围cluster中显着富集,中性粒细胞和门静脉周围肝细胞的共定位表明中性粒细胞的门静脉周围定位已经处于未受干扰的条件下,支持提议的免疫分区的含义。肝脏不断暴露于来自门静脉周围血液的有毒和微生物威胁,需要在免疫低反应性和有效清除病原体之间取得有效平衡。因此,进行空间转录组学以研究感染和炎症对提议的免疫分区的影响将是非常有意义的。
其次,使用立体镜对混合细胞表达谱进行解卷积显示,中心周围和门静脉周围肝细胞的比例值高于所有其他细胞类型,这可能解释了我们数据中中心周围和门静脉周围肝细胞与大多数其他细胞类型之间的主要空间分离。在我们的和 MCA 数据中观察到的肝细胞数量之间的差异可能是由于 scRNA-seq 以及空间数据生成面临的不同技术限制造成的,强调了 scRNA-seq 数据集成的当前限制。来自转录高度活跃或物理大细胞的转录物可能会掩盖具有中低转录水平的细胞类型。因此,提高分辨率的技术和计算进步可能有利于组织内稀有细胞类型的转录分析。尽管如此,与 scRNA-seq 数据的比较证实了在我们的 ST 数据中观察到的一般趋势,突出了将空间转录组学与 scRNA-seq 数据相结合的重要性我们用反相关空间分布和特征标记基因表达注释了两个clusterH&E 图像中的门静脉或中央静脉作为门静脉周围 (PPC) 和中心周围 (PCC) cluster。总体而言,本研究中生成的空间数据支持以下假设:肝组织空间异质性的主要来源是门静脉和中央静脉之间沿小叶轴的区域之间的转录差异。
此外,“隔室”型分区中心标记 Glul 和 Slc1a2 以及门户标记 Sds 和 Hal 的示例性表达说明,执行相反任务(如谷氨酰胺和铵合成)的基因表达的区室化对于防止无效循环是必要的,并说明了 沿波尔图-中轴的生化分区的相关性,已进行彻底审查。 我们的数据引入了“隔室”和“动态”标记的距离阈值,并跟踪来自外静脉边界和跨物理空间的表达梯度。
此外,我们同时调查了门静脉和中央静脉的标记基因表达之间的关系。 标注为组织中心的静脉描绘了表达和与门静脉类型的距离之间令人信服的反比关系。 组织中所有视觉注释静脉的标记基因表达不足以确认被六个门静脉节点包围的一个中央静脉的肝叶的拟议示意图组织。 然而,结果表明中央和门静脉之间的分区标记的整体关系在整个组织的门-中轴之间是可比的,独立于物理空间中小叶的示意性组织。
基于整个组织中中央静脉和门静脉的稳健表达谱的令人信服的证据,我们能够生成一个计算模型,以根据相邻点的表达谱,在视觉注释不明确的情况下预测静脉类型。该计算模型证明了空间转录组学在辅助形态学注释方面的巨大潜力,通过转录分析为自然组织位置的形态结构的计算注释的确定性提供概率值。我们预计这种方法将在未来的空间转录组学研究中提供多种应用,例如。与病理或感染有关。cluster 5 由少量具有不同空间定位的点组成。因此,如果该cluster的转录谱是由一种或多种不同细胞类型的存在引起的,由于肝脏 scRNA-seq 实验的技术限制,这些细胞类型可能会丢失。cluster5 spot显示间充质细胞标记的表达,并与“胶原原纤维组织”途径相关。我们建议cluster 5 可能代表 Glisson 囊的一部分,由胶原纤维及其下方的间皮组成,代表包裹肝脏的结缔组织和具有更厚的肝门周围间充质的区域。胶囊保持了松散构造的肝脏的结构完整性,并能够分裂成叶 .
据报道,间充质细胞标志物 Vim 可维持间充质细胞结构,并作为肝细胞和 Gsn 中细胞增殖活性的指标,编码肌动蛋白结合蛋白 GELSOLIN 在肝脏中具有抗凋亡作用。 抗凋亡作用和结缔组织的富集,可能来自 Glisson 囊,在器官的脆弱位置或靠近肝叶连接位置可能是至关重要的。 涉及cluster 5 中结构完整性的另外两条途径,即“细胞外基质组织”和“细胞外结构组织”,进一步支持该cluster中细胞的结构功能。观察到与细胞因子反应相关的基因本体的富集, 但不限于,cluster 5;因此它们是贡献而不是定义cluster的表达谱和结构功能的组成部分。
关于将肝脏分成多个叶的功能原因以及维持器官结构完整性的知识仍然不完整。 考虑到本研究中使用的样本量,我们可以提供初步迹象,而不是对该提议结构功能的一般性声明。 除了捕获和支持先前观察到的哺乳动物肝脏组织异质性趋势之外,我们的研究还可以作为进一步研究上述过程中涉及的结构成分和候选基因的空间表达的宝贵资源。
总之,本研究提出了一种通过空间转录组学和创新计算方法研究肝组织转录景观的新方法。 我们设计并实施了允许物理距离测量和静脉预测的计算工具。 此外,我们提议在肝组织中存在转录上不同的结构,这可能是由于形成这些结构的细胞很少见,而以前尚未使用转录组学分析报告过这些结构。
随着空间基因组学领域未来的预期进展,分辨率的提高将促进对组织空间中稀有细胞类型的详细研究。 这项研究对空间转录组学为肝脏研究提供的好处进行了令人信服的初步探索,并将其视为肝病学领域的宝贵数据资源。 我们进一步预计 ST 将对未来涉及肝脏发育、免疫和一般病理学的研究非常有益。
Method(关注一下距离计算和相关性的方法)
差异表达分析,注意这里的阈值选择,以及空间分布的特点
空间相关性
距离分析
Expression-based classifier
生活很好,有你更好