统计-降维:主成分分析PCA(principal Component Analysis)

PCA:无监督的分类器

PCA的原理:

1. 拿二维数据举例,先画出一条直线,将点映射到直线上
统计-降维:主成分分析PCA(principal Component Analysis)_第1张图片
2. 计算SS,即每个点到原点距离平方和,旋转直线,让SS达到最大,此时的直线就叫PC1
统计-降维:主成分分析PCA(principal Component Analysis)_第2张图片
image.png
每增加4个基因1, 增加1个基因2,说明是基因1主导的PC1
统计-降维:主成分分析PCA(principal Component Analysis)_第3张图片
image.png
与PC1垂直的直线就是PC2
统计-降维:主成分分析PCA(principal Component Analysis)_第4张图片
3. 将PC1和PC2旋转成垂直的,计算variation以及PC1和PC2各自占的比例
统计-降维:主成分分析PCA(principal Component Analysis)_第5张图片

统计-降维:主成分分析PCA(principal Component Analysis)_第6张图片
4. 如果基因数增多,就先确定PC1,再在各个维度上画很多垂直的PC2,PC3,PC4……挑选variation最大的两个PC画图
统计-降维:主成分分析PCA(principal Component Analysis)_第7张图片
image.png

统计-降维:主成分分析PCA(principal Component Analysis)_第8张图片
image.png

你可能感兴趣的:(统计-降维:主成分分析PCA(principal Component Analysis))