1、HOG特征:
方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。
主要思想:在一幅图像中,局部目标的表象和形状(appearance and shape)能够被梯度或边缘的方向密度分布很好地描述(本质:梯度的统计信息,而梯度主要存在于边缘的地方)。
实现方法:首先将图像分成小的连通区域,即细胞单元。采集细胞单元中各像素点的梯度或边缘的方向直方图。最后把这些直方图组合起来构成特征描述器。
提高性能:把这些局部直方图在图像的更大的范围内(称作区间或block)进行对比度归一化,所采用的方法是:先计算各直方图在这个区间(block)中的密度,然后根据这个密度对区间中的各个细胞单元做归一化。通过这个归一化后,能对光照变化和阴影获得更好的效果。
优点:首先,HOG是在图像的局部方格单元上操作,对图像几何的和光学的形变能保持较好的不变性,这两种形变只会出现在更大的空间领域上。其次,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。因此HOG特征是特别适合于做图像中的人体检测的。
2、HOG特征提取算法的实现过程
HOG特征提取方法就是将一个image(要检测的目标或扫描窗口):
(1)灰度化(将图像看做一个x,y,z(灰度)的三维图像);
(2)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化),目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;
(3)计算图像每个像素的梯度(包括大小和方向),主要是为了捕获轮廓信息,同时进一步弱化光照的干扰。
(4)将图像划分成小cells(例如6*6像素/cell)
(5)统计每个cell的梯度直方图(不同梯度的个数),即可形成每个cell的特征描述子;
(6)将每几个cell组成一个block(例如3*3个cell/block),一个block内所有cell的特征描述子串联起来便得到该block的HOG特征描述子;
(7)将图像image内的所有block的HOG特征描述子串联起来就可以得到该image的HOG特征描述子了,这个就是最终的可供分类使用特征向量了。
3、代码实现
python中可以利用Sobel算子计算图像梯度,梯度直方图可以利用cv2.cartToPolar和np.bincount函数计算。