Tangram 空间转录组教程(二)

前文提到Tangram在基于mapping的步骤,有两种方式:

  • mode = "cluster":速度快,占用内存少,适用于空转和单细胞数据来自不同样本情况下。
  • mode = "cell": 占用内存大,每个cell进行匹配,可以mapping到空转没有抓到的转录本。

由于受限于空间转录组(包括 Visium 和 Slide-seq技术)的分辨度,每个voxel(spot)通常包含多个单细胞,针对这一情况,采用去卷积的方法去推断细胞组成显得尤为重要。

去卷积是分析中亟需的技术,但很难获取到确切的结果。如果你只是想推断两种细胞的空间分布共定位关系,建议用Mapping的方法即可。如果你是想推断细胞间的通讯连接乃至机制,建议使用project_cell_annotations来在空间上可视化相应的模块(program usage)。以下是细胞去卷积的步骤:
tangram首先需要知道voxel中包含多少细胞,这可以从对应的组织学图片上通过分割得到,squidpy通过两句代码完成:squidpy.im.process进行平滑处理,squidpy.im.segment使用watershed算法进行分割。需要关注的是有些空转技术,比如Slide-seq,不能在对应的经测序的切片上进行染色。针对这些数据,我们用粗略的方式估计细胞密度,传入uniform 到density_prior。最后需要注意的是,我们很难去验证去卷积的结果,因为我们得不到真实的单细胞空间分布情况。

sq.im.process(img=img, layer="image", method="smooth")
sq.im.segment(
    img=img,
    layer="image_smooth",
    method="watershed",
    channel=0,
)

显示框选小图的细胞分割情况
比较DAPI染色和Mask的结果确认分割的质量。

inset_y = 1500
inset_x = 1700
inset_sy = 400
inset_sx = 500

fig, axs = plt.subplots(1, 3, figsize=(30, 10))
sc.pl.spatial(
    adata_st, color="cluster", alpha=0.7, frameon=False, show=False, ax=axs[0], title=""
)
axs[0].set_title("Clusters", fontdict={"fontsize": 20})
sf = adata_st.uns["spatial"]["V1_Adult_Mouse_Brain_Coronal_Section_2"]["scalefactors"][
    "tissue_hires_scalef"
]
rect = mpl.patches.Rectangle(
    (inset_y * sf, inset_x * sf),
    width=inset_sx * sf,
    height=inset_sy * sf,
    ec="yellow",
    lw=4,
    fill=False,
)
axs[0].add_patch(rect)

axs[0].axes.xaxis.label.set_visible(False)
axs[0].axes.yaxis.label.set_visible(False)

axs[1].imshow(
    img["image"][inset_y : inset_y + inset_sy, inset_x : inset_x + inset_sx, 0, 0]
    / 65536,
    interpolation="none",
)
axs[1].grid(False)
axs[1].set_xticks([])
axs[1].set_yticks([])
axs[1].set_title("DAPI", fontdict={"fontsize": 20})

crop = img["segmented_watershed"][
    inset_y : inset_y + inset_sy, inset_x : inset_x + inset_sx
].values.squeeze(-1)
crop = skimage.segmentation.relabel_sequential(crop)[0]
cmap = plt.cm.plasma
cmap.set_under(color="black")
axs[2].imshow(crop, interpolation="none", cmap=cmap, vmin=0.001)
axs[2].grid(False)
axs[2].set_xticks([])
axs[2].set_yticks([])
axs[2].set_title("Nucleous segmentation", fontdict={"fontsize": 20});

接着我们需要去提前图片中分割成的细胞核单元的特征:每个spot下的分割单元(segmentation object)以及分割单元质心对应的坐标。

# define image layer to use for segmentation
features_kwargs = {
    "segmentation": {
        "label_layer": "segmented_watershed",
        "props": ["label", "centroid"],
        "channels": [1, 2],
    }
}
# calculate segmentation features
sq.im.calculate_image_features(
    adata_st,
    img,
    layer="image",
    key_added="image_features",
    features_kwargs=features_kwargs,
    features="segmentation",
    mask_circle=True,
)

计算及显示每个spot下segmentation object的数量

adata_st.obs["cell_count"] = adata_st.obsm["image_features"]["segmentation_label"]
sc.pl.spatial(adata_st, color=["cluster", "cell_count"], frameon=False)

Deconvolution via alignment

tangram进行去卷积的核心原理是限制每个voxel中mapped单细胞表达谱的数量,这是与其他去卷积方法的不同之处。
实现方式是在map_cells_to_space函数中传入map_cells_to_space,这将在损失函数中加入过滤步骤,并进行布尔正则化处理,接着在``target_count中传入所有细胞核(segmentation object)的数量,density_prior```来传入每个voxel中的segmentation object。

ad_map = tg.map_cells_to_space(
    adata_sc,
    adata_st,
    mode="constrained",
    target_count=adata_st.obs.cell_count.sum(),
    density_prior=np.array(adata_st.obs.cell_count) / adata_st.obs.cell_count.sum(),
    num_epochs=1000,
#     device="cuda:0",
    device='cpu',
)

同前面一样,可以显示不同细胞类型的空间分布。

tg.project_cell_annotations(ad_map, adata_st, annotation="cell_subclass")
annotation_list = list(pd.unique(adata_sc.obs['cell_subclass']))
tg.plot_cell_annotation_sc(adata_st, annotation_list, perc=0.02)

同样可以通过检测test基因判断mapping的情况

ad_ge = tg.project_genes(adata_map=ad_map, adata_sc=adata_sc)
df_all_genes = tg.compare_spatial_geneexp(ad_ge, adata_st, adata_sc)
tg.plot_auc(df_all_genes);

##################################################
接着是核心部分:
在前面去卷积部分中我们的都每个spot中独特segmentation object的数目以及质心坐标。我们在数据框中显示这些关键信息,每一行代表segmentation object (a cell),表格显示每个细胞的unique centroid ID,包含spot ID和数字index。

tg.create_segment_cell_df(adata_st)
adata_st.uns["tangram_cell_segmentation"].head()

使用tangram.count_cell_annotation(),其利用去卷积的结果来对每个segmentation ID映射相应的细胞类型。

tg.count_cell_annotations(
    ad_map,
    adata_sc,
    adata_st,
    annotation="cell_subclass",
)
adata_st.obsm["tangram_ct_count"].head()

将结果提取成新的AnnData对象

adata_segment = tg.deconvolve_cell_annotations(adata_st)
adata_segment.obs.head()

该AnnData对象不包含细胞数量,只包含细胞类型的注释,即tangram映射的结果,这更方便进行可视化。在下图中你会发现,每个点并不代表spot,而是代表每个segmentation object。

fig, ax = plt.subplots(1, 1, figsize=(20, 20))
sc.pl.spatial(
    adata_segment,
    color="cluster",
    size=0.4,
    show=False,
    frameon=False,
    alpha_img=0.2,
    legend_fontsize=20,
    ax=ax,
)

你可能感兴趣的:(Tangram 空间转录组教程(二))