学习:StatQuest-MDS和PCoA

前言

什么是MDS呢?全称为:Multidimensional Scaling。
主要分为以下两类:


image.png

那么左边红圈的又称为PCoA

我们举个例子
假设细胞分群成三类



根据每类细胞对应的基因表达情况经过PCA降维,将会分成三类


image.png

其实MDS和PCoA的作用比较类似于PCA
image.png

只不过MDS(PCoA)是基于最小线性距离进行聚类,而PCA是基于最大线性相关性进行聚类

MDS(PCoA)

假设我有一个表达矩阵


image.png

第一步,我们先计算cell1和cell2之间的距离


image.png

第二步,计算cell2和cell3之间的距离


image.png

第三步,计算cell1和cell4之间的距离


image.png

第四步,计算cell1和cell4之间的距离


image.png

那么这个距离怎么算呢?
以cell1和cell2为例子:


image.png

先看两个基因的情况:
image.png

很简单,根据欧式距离,相同基因,对应细胞做差:


image.png

那么对应于所有基因来说,我们也可以按照同样的方法计算距离:
image.png

按照距离的远近就可以进行分类:
image.png

对比于PCA,如果我们采用欧式距离计算MDS,那么极可能和PCA的图一样。

当然我们也可以计算两两细胞间相同基因的log FC值作为距离


image.png

然后对负数项取绝对值,正数项不变,将每个基因对数变化率绝对值的结果取平均值就得到了cell 1和cell 2之间的距离了,即cell 1 和cell 2 中所有基因的对数变化率绝对值的平均值表示为两细胞间的距离


这样图形就有差别了


image.png

你可能感兴趣的:(学习:StatQuest-MDS和PCoA)