稀疏表示

稀疏表示最重要的思想即是,在一个足够大的训练样本空间内,对于一个类别的物体,可以大致的由训练样本中同类的样本子空间线性表示,因此在当该物体有整个样本空间表示时,其表示的系数是稀疏的。这是稀疏表示思想最重要的一个假设,当然这也是之后进一步分析的基础。

通过上述对稀疏表示思想的大致描述,可以将稀疏表示抽象成一个方程式:
y=Ax,(1)
当然稀疏指的是这个方程的系数向量x是稀疏的。y是目标样本,A为训练样本空间。因此,解决上述问题就是要求解上述方程,要求是x是稀疏的。即:
x0=argmin||x||o   s.t.  y=Ax;(2)
||x||o,指的是x的0范数,即x中非零元素的个数。而求解0范数是一个NP-hard问题,但是在x是足够稀疏的条件下,可以将上述问题转化为求解x的1范数,即||x||1,
x1=argmin||x||1   s.t.  y=Ax;(3)
上述的描述都是在理想条件下,一般条件下,图像都是有噪声存在的,因此需要在y=Ax后面加一个误差项,即y = Ax+e。及转化为求解下面的1范数问题:
x2=argmin||x||1 s.t.||Ax-y||2<=e;(4)
上面是一个凸优化问题,应用已有的理论就可以解决。但是由于噪声等得影响,x的非零元素会散布于很多类间。为了通过x2分类,采用以下分类函数:
min r(y)=||y-A*di(x2)||2;(5)
此处di是与第i类相关的系数。
      下面介绍稀疏表示用来进行图像识别的基本步骤:
1.采集样本。即获得训练样本跟测试样本。
2.对训练样本跟测试样本同时进行降维处理。
3.设定误差上界,依(4)式求解x2。
4.根据(5)式进行分类,输出计算后的分类与识别率。

      上面对系数表示进行了一个比较系统的介绍,下面将其优缺点以及应用范围进行简单介绍:
优点:
1.建立的模型简单,容易理解,容易操作。
2.较以前的方法,对图像的识别是从整体的方面来把握的,但是NN,NS等方法更有局限性,像NN是一对一的进行匹配,计算欧氏距离,NS虽然利用分块的思想增加了对图像局部特征的匹配,但是仍然不能从整体上进行把握,对图像只是一个距离上的相似度。而稀疏表示的方法,是对所有的训练样本集进行抽取,获得一个相关系数,通过这个相关系数进行分类。
3.特征提取的个数相对于特征提取的方法更为重要。通过实验,用PCA、DownSample、Randomsample等方法提取特征,在低维还是不稳定的,但是较高维就显得不那么重要了,这当然与预期是相符的,获得原始图像的信息越多,对于识别越有效。

缺点:
1.这个模型是建立在一个图像空间是足够大的条件下,然后任意一幅同类的图像都可以通过此类的图像子空间进行线性表示,当然允许存在噪声误差,但是现实生活中的一类物体的图像空间不是线性的。
2.对于图像中存在的姿势的变化、没有对齐的情况,这个模型就不再准确。稀疏表示要求图像要大致中心一致对齐,这样才能尽量做到1中的线性表示。

适用于:
      对于有线性特征的模型或者近似线性的模型,都可以将稀疏表示应用其中进行物体的识别。同时对于光照的变化以及图像的遮挡、腐蚀同样适用。

你可能感兴趣的:(数据库)