方向梯度直方图HOG:Histograms of Oriented Gradients 及matlab源码

本文内容转载自:http://hi.baidu.com/hillhaw123/item/abeffb87b2edfddad1f8cd1b

 

方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。此方法使用了图像的本身的梯度方向特征,类似于边缘方向直方图方法,SIFT描述子,和上下文形状方法,但其特征在于其在一个网格密集的大小统一的方格单元上计算,而且为了提高精确度使用了重叠的局部对比度归一化的方法。

其作者Navneet Dalal和Bill Triggs是法国国家计算机技术和控制研究所(INRIA),他们在2005年的CVPR上首先发表了描述方向梯度直方图的论文。在这篇论文里,他们着重将他们的算法放在静态图像的行人检测问题上,之后他们也将他们的实验扩展到了视频中的人的检测的和静态图像中的车辆和常见动物的检测。

方向梯度直方图特征的核心思想是一幅图像中的物体的表象和形状可以被梯度或边缘的方向密度分布很好地描述。其实现方法是先将图像分成小的叫做方格单元连通区域;然后采集方格单元中各像素点的梯度方向或边缘方向直方图;最后把这些直方图组合起来就可以构成特征描述子。为了提高精确度,还可以把这些局部直方图在图像的更大的区间(block)中进行对比度归一化,此方法通过先计算各直方图在这个区间(block)中的密度,然后根据这个密度值对区间中的各个方格单元做归一化。通过这个归一化后,能对光照变化和阴影获得更好的稳定性。

与其他的特征描述方法相比,HOG有很多优点。首先,由于HOG是在图像的局部方格单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。其次,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。因此HOG特征是特别适合于做图像中的人体检测的。

接下来将具体介绍HOG特征的提取过程,下图1给出了完整的HOG特征提取算法和过程。图1如下:方向梯度直方图HOG:Histograms of Oriented Gradients 及matlab源码_第1张图片

HOG提取过程中的核心步骤可以简单归纳如下:

(1) 计算图像横坐标和纵坐标方向的梯度,并据此计算每个像素位置的梯度方向值;

(2) 把图像按照空间位置均匀划分小块,即图2中的cell,在cell内按照既定的量化标准统计梯度方向的直方图,得到该cell对应的特征向量,然后再把图2中一个block内所有cell的特征向量串联起来便得到该block的HOG特征。

图2如下:

方向梯度直方图HOG:Histograms of Oriented Gradients 及matlab源码_第2张图片

HOG特征是由一个矩形block中的多个矩形cell的方向梯度直方图串联得到,其实block和cell都可以不是矩形,只不过矩形是较常用的一种,这种HOG特征可称之为矩形HOG,实际上还存在圆形HOG和中心环绕HOG,当然我们考虑的都是矩形的。

矩形HOG使用重复遍历的矩形cell网格,Block块是由密集重复遍历的cell组成的,每一个块内独立进行特征向量归一化,以减少光照的影响。一般每个block由m×m个cell网格组成,而cell由n×n个像素组成。并且每个cell的梯度方向分成z个方向块,使用cell中的梯度方向和幅度对z个方向进行加权投影,最后每个cell产生z维的特征向量。Dalal等用于人体检测的HOG选取z=9,即将360度分成9个方向块,继而用于对方向梯度进行投影,如下图:

方向梯度直方图HOG:Histograms of Oriented Gradients 及matlab源码_第3张图片

 

每个cell在按上图划分进行投影后,便得到一个z维的特征向量,block块中的所有cell对应的特征向量串联起来便构成了HOG特征。

举个例子:对于40*40的图像,设定每个Block有2*2=4个cell,每个cell的大小为8*8,那么就有4*4=16个Block,这样一来40*40的图像对应一个HOG特征,其维度为 16*4*9=576.

 

 

注:

Matlab源码下载:http://www.mathworks.com/matlabcentral/fileexchange/28689-hog-descriptor-for-matlab

 

 

你可能感兴趣的:(图像处理,alignment,测试,matlab,图像处理,training,image)