单细胞 拟时序分析 | diffusionMap

1. 简介

DiffusionMap (扩散映射)是一款R软件,通过高斯模型和马尔科夫模型,把单细胞(scRNA)表达矩阵的非线性结构映射为连续性结构,并关联至对应细胞分组。数据计算主要包括以下几步:

  • A.由四种不同细胞类型组成的 n × G 单细胞表达矩阵。矩阵右侧的最后一列代表每个细胞的类型;

  • B.在G维基因空间中,由高斯函数表示每个细胞。由于高斯波干扰,具有相对高概率密度的连续路径在数据流形上形成扩散路径;

  • C.计算 n × n 的细胞间马尔可夫转移概率矩阵;

  • D.马尔可夫转移矩阵的前两个特征向量(DC1和DC2)数据嵌入,它们对应了数据流形的最大扩散系数。DiffusionMap显示了四种细胞类型中细胞的连续流动趋势。

此外,团队也针对单细胞数据常见的零值、缺失值和采样密度异质性情况,对软件的计算模型和高斯kenralwidth 筛选进行了优化,确保在数据的遍历扩散过程是连续型的同时细胞之间的扩散距离仍然有较高的灵敏度。

经过多种数据集的测试,DiffusionMap 在同源细胞不同的分化谱系中都有较好的表现。它可以通过扩散映射将空间距离转换为状态转移的概率,对不同分化路径中的细胞进行降维和排序,确定分化细胞的随机转移方向,进而预测细胞的发育轨迹并检测稀有种群。

2. R包

(1) diffusionMap

  • https://github.com/rcannood/diffusionMap

https://mirrors.tuna.tsinghua.edu.cn/CRAN/web/packages/diffusionMap/index.html

(2)

ref

  • [Good] https://github.com/NBISweden/excelerate-scRNAseq/blob/master/session-trajectories/session-trajectories.md
  • 效果图 https://baijiahao.baidu.com/s?id=1754509263575159606&wfr=spider&for=pc
  • 论文 Laleh Haghverdi, Florian Buettner, Fabian J. Theis, Diffusion maps for high-dimensional single-cell analysis of differentiation data. Bioinformatics(2015)https://doi.org/10.1093/bioinformatics/btv325

你可能感兴趣的:(单细胞,R,数据可视化)