Large-Scale Scene Classification Using Gist Feature

1.论文介绍

使用GIST特征对于场景图片进行分类。对于分类器的选择,作者使用了基于 L2 正则, L2 损失的SVC方法,和基于核函数的SVM两种分类器。并在GIST特征的多尺度,多方向,不同划分图像块的三个方面进行了实验,结果表明带有核函数的SVM在提取GIST特征时使用18个方向,5个尺度,并使用4*4的划分卷积图像可以达到最好的分类结果。

2.方法介绍

2.1二维的Gabor 滤波器

对于二维的Gabor滤波器,可以使用如下的函数来近似
这里写图片描述

sc(x,y) 是复数形式的正弦函数,W_r(x,y)表示的二维高斯函数,具体的表示可以参看下面的公式:
Large-Scale Scene Classification Using Gist Feature_第1张图片
其中的参数:
u0,v0 表示正弦的参数,频率的相位。
a,b 表示高斯函数的尺度。
x0,y0 表示高斯函数的中心。
r 表示高斯函数旋转角度。
作者会根据这上面的公式来设置不同的参数,从而获得不同的GIST特征。

2.2GIST特征提取

GIST特征的提取过程,使用到了上面介绍的函数,作者设置不同参数,获得不同维度的GIST特征。具体的提取流程参看下图:
Large-Scale Scene Classification Using Gist Feature_第2张图片

  1. 若干个Gabor 滤波在不同尺度,多个方向上进行卷积,得到相同数量的feature map 大小和输入图像一致。
  2. 把每个feature map 分成4*4或者8*8的区域,计算每个区域内的均值。
  3. 计算所有Gabor滤波器产生结果feature map的均值,然后把均值拼接在一起得到最后的GIST特征。

2.3分类器的介绍

作者选择了对于二分类问题效果比较好的分类器SVM和SVC.
其中SVM的公式化表示:
Large-Scale Scene Classification Using Gist Feature_第3张图片
约束条件为:
Large-Scale Scene Classification Using Gist Feature_第4张图片
上述的优化方法可以使用对偶线性规划来求解或者使用SMO方法。
对于核函数,它可以把低维的数据映射到高维空间中,使得在高维空间中数据可以线性可分。
对于 L2 正则, L2 损失的SVC,只有在目标函数和SVM不同.
Large-Scale Scene Classification Using Gist Feature_第5张图片

3.实验

数据集:SUN
数据有397个类别,总共130519张图片。
作者对于GIST Feature 分别在方向个数为8个,12个 ,18个三个不同数量上进行提取。

相同方向个数和相同尺度,分别为8个方向,5个尺度上,在不同的feature map划分上进行的对比实验:
Large-Scale Scene Classification Using Gist Feature_第6张图片

从实验的结果可以看出来:增加划分feature map块的个数不会提高分类的准确性,还有可能降低准确性。

不同方向个数,不同尺度上面(方向个数分别为8个,12个,18个,尺度分别为4个,5个),划分方式不变的实验结果:

Large-Scale Scene Classification Using Gist Feature_第7张图片
从实验结果可以看出来:
但是增加方向和尺度可以增加特征的区分性,从而在一定程度上提高分类的准确性。
作者还从实验中分析了两种方法训练的时候的速度以及内存比较:
从实验的结果来看,核SVM要比L2正则,L2损失的SVC方法要有更高的分类准确性。但是SVC的方法训练起来更快。

4.结论

4.1增加划分feature map块的个数不会提高分类的准确性,还有可能降低准确性。

4.2但是增加方向和尺度可以增加特征的区分性,从而在一定程度上提高分类的准确性。

你可能感兴趣的:(论文)