降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)

一、KNN

确定训练样本,以及某种距离度量。

对于某个给定的测试样本,找到训练集中距离最近的k个样本,对于分类问题使用“投票法”获得预测结果,对于回归问题使用“平均法”获得预测结果。还可基于距离远近进行加权平均或加权投票,距离越近的样本权重越大。

当k取不同值时,分类结果会有显著不同。

若采用不同的距离计算方式,则找出的“近邻”可能有显著差别,从而也会导致分类结果有显著不同

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第1张图片

二、维数灾难

一般情况下,如果使用现有特征获得的分类器性能不佳,则会考虑添加新的特征,以提高分类器性能(以运算复杂度为代价)。

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第2张图片

三、主成分分析(PCA)

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第3张图片
降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第4张图片

正交,则新坐标系是一个正交坐标系,此时 W为正交变换。

显然,新空间中的属性是原空间中的属性的线性组合

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第5张图片

最大可分性:

样本点 在新空间中超平面上的投影是 ,若所有样本点的投影能尽可能分开,则应该使得投影后样本点的方差(已中心化)最大化。

最近重构性:

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第6张图片
降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第7张图片

求解:

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第8张图片
降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第9张图片

  • PCA算法流程

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第10张图片
降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第11张图片

KPCA:

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第12张图片
降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第13张图片

四、流形学习

用于从高维采样数据恢复低维流形结构,是一种非线性降维方法。

把数据从高维空间,保持一定几何拓扑关系,如测地距离/邻域线性重构关系,进行非线性降维,映射到低维嵌入空间。

Isomap:

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第14张图片
降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第15张图片

局部线性嵌入LLE:

局部线性嵌入试图保持邻域内的线性关系,并使得该线性关系在降维后的空间中继续保持。


五、度量学习

降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第16张图片
降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第17张图片
降维与度量学习(KNN、PCA、KPCA、流形学习、度量学习)_第18张图片

你可能感兴趣的:(人工智能,算法)