模式识别等存在问题(有待完善)
1.池运算/池操作(Pooling operation)?
池运算就是一种采样策略,将低数据表示的维数。例如,矩阵数据转为向量、大矩阵采样后转换小矩阵等。
池运算是一种非线性映射。正是由于是一种采样策略,故不可避免的会损失有用信息。在行为识别中,最明显的例子就是局部运动信息,局部特征缺少详细的信息(位置),会致使邻帧运动特征捕获不到。
对于这个不足,如何用池运算?使具有判别性的特征尽量损失最少?同性特征尽量剔除?
Yangqing Jia,ChangHuang,TrevorDarrell. Beyond spatial pyramids: Receptive fieldlearning for pooled image features.CVPR2012: 3370-3377
该文献提出同步学习完备字典及完备池的方法
2.全局统计特征学习训练速度问题?
3.过完备字典真的很好吗?有利点及不足。
稀疏编码或ICA模型等学习的过完字典,需要大的存储空间,为解决这个问题,1)引入了压缩感知,同时不失原始信号特征;2).....
4.简单神经元、复杂神经元、高级复杂神经元、超高级复杂神经元感知域特点,如何有简单到复杂学习具有判别性的特征?
简单特征征,即简单几何结构特征。目前主要有稀疏编码、ICA及部分其它的单、多层网络学习的字典;
复杂特征,及具有平移不变性。目前的复杂特征主要通过Pool的方法实现。
5.在4中涉及。轮廓编组问题、神经元共同响应问题?
6.无监督特征学习学习的特征,到底什么样的特征有利于识别?利用简单特征不能很好稀疏编码目标特征,如何解决(学习具有判别性的特征,同时解决遮挡、视角问题)?
7.多视点学习,由于变型及目标多样性(大小、颜色等)问题,如何解决类内差别问题?
不同场景,不同人物特征的行为,类内变化问题。