MIA用于单细胞和空间的联合分析

MIA,多模态数据取交集方法,是针对Spot Cluster 水平上利用单细胞注释信息来对ST-Spot聚类结果进行细胞类型注释。

图片.png

给定单细胞某个已知细胞类型和某个Spot的聚类编号,我们分别筛选各自的CellMarkers和SpotMarkers

Background定义为单细胞与ST数据共同表达的基因集,根据单细胞的CellMarkers可以将背景基因集分成两块区域,蓝色和黄色部分

然后将ST的SpotMarkers分别与这两个区域取交集

如果这个ST的SpotMarkers是随机抽取的,那么落在这两个区域的基因数应该是符合一定的比例, 如果出现过度集中与蓝色区域,则我们认为CellMarkers与SpotMarkers是显著重叠的,那么我们可以得到这个SpotCluster属于这个细胞类型的可能性越高。

图片.png

其实这个就是超几何分布模型,我们可以一个公式来计算显著性P值,由于P值是0-1之间,很小的数,我们可以取-log10,转换为得分,此得分越高,注释与这个细胞类型的可能性就越高。

很简单,我们可以在R中的基本函数phyper中实现,命令用黑色方框显示。

i表示同时属于scRNA的CellMarkers和ST的SpotMarkers

M表示scRNA的CellMarkers

大N表示scRNA和ST同时表达基因

小n表示ST的SpotMarkers

在这里我想说个题外话,这个模型简单且非常实用, 在基因功能富积分析使用的模型就是这个,所以课后不妨大家多多了解下

图片.png

最终我们得到SpotCluster的细胞类型预测结果文件,行为Cluster编号,其中括号内的数字表示ST的SpotMarker数,列为细胞类型

如果得分越高,这个SpotCluster属于这个细胞类型的可能性就越高,我们可以看到Cluster3属于Oligo的得分最高,因此属于这个细胞类型的可能性就最高。

图片.png

我们可以将上面的表格进行热图展示,行为Cluster,列为细胞类型,对细胞类型做了层级聚类

我们可以看到红色方框内是Cluster3对应的Oligo细胞类型的数值,由于此值在Cluster3对应的所有细胞类型最高,因此此Cluster被预测为Oligo细胞类型

我们也可以用桑基图展示Cluster与已知细胞类型对应关系,比如Cluster3沿着这个弧线对应到Oligo细胞类型。

你可能感兴趣的:(MIA用于单细胞和空间的联合分析)