一些特征杂记

1、 GIST

SpatialEnvelope : 空间包络

 

 

Given an input image, a GISTdescriptor is computed by

Convolve the image with 32 Gaborfilters at 4 scales, 8 orientations, producing 32 feature maps of the same sizeof the input image.

Divide each feature map into 16regions (by a 4x4 grid), and then average the feature values within eachregion.

Concatenate the 16 averagedvalues of all 32 feature maps, resulting in a 16x32=512 GIST descriptor.

Intuitively,GIST summarizes the gradient information (scales and orientations) fordifferent parts of an image, which provides a rough description (the gist) ofthe scene.

 

 

 

 

2、 DenseSIFT

它与SIFT(也叫sparse SIFT)的区别就在于它的获取过程是:对于图片中的每个像素,以该像素为中心,将它周围的一个16*16的区域分为4*4的单元,然后在每个单元中,用8个bins的直方图统计梯度方向,即可对每个像素得到一个4*4*8=128维的特征描述。

 

Dense SIFT和SIFT的区别就是:Lowe提出的SIFT算法中,会构建DOG尺度空间,从而进行关键点定位,然后计算每个关键点的128维的特征描述,而Dense SIFT是直接对图片中的每个像素,以该像素为中心,将它周围的一个16*16的区域分为4*4的单元,然后在每个单元中,用8个bins的直方图统计梯度方向,计算128维的特征描述.

 

很多应用中,证明Dense SIFT在场景或物体分类中取得的效果更好,并且速度更快。

在一些场景分类中,经常会先提取Dense SIFT,但是这样提取出来的特征数量太大,于是然后进行池化(如,max pooling……,就是把特征图像的某个区域求最大值,用来代表这个区域)

 

当研究目标是对同样的物体或者场景寻找对应关系(correspondence)时,Sparse SIFT更好。而研究目标是图像表示或者场景理解时,Dense SIFT更好,因为即使密集采样的区域不能够被准确匹配,这块区域也包含了表达图像内容的信息。

 

你可能感兴趣的:(计算机视觉)