流形学习应用与展望

 一  流形学习典型应用

 1 可视化

人不能直观感知高维度的数据集的内部结构,但对三维以下的数据集的内在规律有着很强的感知能力。流形学习可以将高维数据的内在关系在低于三维的空间中展示出来,使得人们能够直观地认识高维数据的内在规律,并了解影响数据集内在结构的主要因素的变化规律。

 

2 推理与半监督学习

由于流形表达了一个事物在不同状态下的共通状态,而沿流形的运动则表达事物状态的变化,那么我们可以利用流形上某些数据已知状态参数(实质是其在隐空间中的坐标),使用流形学习算法来学习推测出状态参数未知的数据的状态参数。流形学习的这种推理机制正是半监督学习所需要的,流形学习在推理和半监督学习方面的应用有估计手旋杯的旋转度数[1]、推测视频图像中目标的位置[2]、半监督文本分类[3]等。

 

3 特征提取

流形学习方法提取的特征往往有利于后续聚类或者分类任务的进行,这是由于同一事物但不同种类的样本可能位于表征该事物的流形的不同区域。流形学习方法能够有效地逼近表征该事物的流形,从而使得流形上不同的区域的差别在特征空间中得到体现。

 

4 分类

流形学习也在分类问题与监督特征提取问题中得到应用。在分类问题中,如果每类样本均能够由一个流形很好地描述,那么我们只需要对每类样本学习一个流形,在分类时,计算样本到每个流形的距离,将其分类到与其最近的流形所在的类即可。

 

5 数据描述

对于数据描述任务,流形学习的一个重要应用在图像处理领域。图像中物体的轮廓以及骨架等均可以看做是嵌入在二维平面中的一维流形或者由一组一维流形构成。流形学习有着强大的流形逼近能力,在图像处理的轮廓描述、骨架提取等方面取得了成功的应用。

 

 

二研究展望

 

(1)       流形学习方法的参数选择问题

目前大多数流形学习算法都涉及到近邻数和本征维数等参数的选择问题。流形学习探测低维流形结构成功与否在很大程度上取决于近邻数的选择,然而近邻数的选择受数据分布密度和空间结构等的影响,至今仍缺乏一个很好的理论指导,现实中往往只能通过经验来选择。本征维数估计是流形学习的一个基本问题,它反映了隐藏在高维观测数据中的潜在低维流形的拓扑属性,本征维数估计的准确与否对低维空间的嵌入结果有重要的影响。

(2)       流形学习算法性能评估问题

对于一个给定的高维数据集,利用流形学习算法将其嵌入到低维空间后将其嵌入到低维空间后,高维非线性数据的低维嵌入质量如何,即低维嵌入在多大程度上揭示了高维非线性数据集的内在规律和拓扑结构。这实际上涉及到流形学习算法映射结果的性能评估问题。目前,人们常用的方法是将数据集映射到二维或者三维可视化空间,通过肉眼观察来评价不同流形学习算法的嵌入性能。

 

(3)       流形学习算法鲁棒性和收敛性问题

目前基于谱图理论的流形学习方法对噪声和离群值都比较敏感,也是导致流形学习方法产生显著偏差的原因,因此研究各种噪声模型对流形学习方法的影响方式和影响度是一项有意义的工作。

现在的流形学习方法依赖于要进行学习的数据本身,且其有效程度与算法本身相关,然而要使一种学习算法完备,需要考虑算法描述的几何结构能否能逼近真实的内在几何结构。因而,能够构造出一种与数据无关的流形学习,并导出流形学习对真实的内在嵌入流形逼近的收敛性,是完善流形学习研究中十分重要的一步。

(4)       多子流形学习问题

目前大部分流形学习算法都假定高维输入数据位于一个连通的流形中,然而现实中许多高维非线性数据集包含多个子流形,如不同的人脸数据和蛋白质相互作用数据等,现有的流形学习方法无法将数据集包含的所有子流形都映射到同一个低维空间中并保持各自的流形结构,这是将流形学习应用于模式识别和图像处理等任务时需要解决的一个问题,因此有必要深入研究不连通流形上的高维数据的维数约简问题。

(5)       流形学习的应用研究问题

目前流形学习的应用对象主要局限矩静态的图像数据,如人脸、手写体数据、掌纹数据等。通常数据流是一种实时、连续、有序的数据组成的序列,它广泛存在与现实世界和工程实验中,如网络监控和通信工程、Web服务产生的日志记录、传感器监控、视频流监控、金融市场上股票交易波动分析、天气或环境监督等都能产生大量的数据流。如何将流形学习方法应用于各种数据流,仍值得进一步的深入研究。

 

参考文献:

[1]  张军平, 王珏. 流形学习及应用 [D][D]. , 2003.

[2] Yang X, Fu H, Zha H, et al. Semi-supervised nonlinear dimensionality reduction[C]//Proceedings of the 23rd international conference on Machine learning. ACM, 2006: 1065-1072.

[3]  Belkin M, Niyogi P. Using manifold stucture for partially labeled classification[C]//Advances in neural information processing systems. 2002: 929-936.

[4] 黄启宏. 流形学习方法理论研究及图像中应用[J]. 学位论文. 成都: 电子科技大学, 2007.

[5] 黄鸿. 图嵌入框架下流形学习理论及应用研究[D]. 重庆: 重庆大学, 2008.

[6] 雷迎科. 流形学习算法及其应用研究[D]. 中国科学技术大学, 2011.

[7] 张兴福.基于流形学习的局部降维算法研[D].哈尔滨工程大学,2012

 

 

 

 

 

 

你可能感兴趣的:(文献阅读笔记)