Histogramsof Oriented Gradients for Human Detection 学习笔记
一、 HOG 特征
1. 简介
人脸检测问题首先要解决的是找到一种鲁棒同时又具有可识别性的特征,这种特征即使在杂乱的背景和不同的光照条件下也能很好地工作。
HOG特征 + linearSVM进行人体检测。 HOG特征即在网格上提取梯度方向直方图。
HOG特征与SIFT一样,采用的是方向梯度直方图,但是HOG特征是在一致的密集网格中进行计算,同时为了提高性能,采用重叠的block和局部的对比度归一化。
2. 方法概述
(1) 灰度归一化,对于彩色图像也可分3通道进行处理。
(2) 计算图像梯度
(3) 在每一个6*6 pixels的cell中统计梯度方向直方图。
(4) 在重叠的blocks中,对每一个cell响应进行对比度归一化。
(5) 将位于检测窗口内所有的特征向量连接起来形成HOG’s。
(6) 将检测窗口的HOG’s丢入Linear SVM进行判断。
二、HOG具体实现
1. Gamma/Colour归一化
这些归一化方法在此实验中影响不大,可能是因为接下来的步骤中有进行描述子的归一化,也能达到同样的效果。
2. 梯度计算
使用几组高斯模糊+倒数模板进行测试。当sigma=0(即不进行高斯模糊),使用1-D [1, 0 , -1] 的梯度模板,效果最好。
即对图像的每个像素点位置,计算横向[1 , 0 , -1]的梯度以及纵向[1; 0 ; -1]的梯度。
对于彩色图像,可以对每个颜色通道计算梯度,然后选取范式最大的那个分量作为像素点的梯度向量。
3. 空间方向直方图
在Cells中计算方向直方图,将0-180度划分为9个bin,然后根据cell中每个像素的梯度方向进行bin的装填,一个关于梯度幅值的函数将作为投票的权值。
一个cell对应一个直方图。
4. 归一化和描述子的Blocks
3*3个cells组成一个block,在每个block中进行归一化。这些blocks可以有重叠的。每个cell是6*6 pixels。在每个cell计算梯度方向直方图;然后将所有这些直方图连接起来组成检测窗口(detection)的特征向量。
Block归一化策略:
对每一个Block的HOG特征分别进行归一化,设v为未归一化的向量。是它的k范式,k=1, 2, ε是一个很小的常量。采用4种策略:
a) L2-norm:
b) L2-Hys: L2-norm处理完以后,将v的最大值限制为0.2,然后再归一化一次。
c) L1-norm:
d) L1-Sqrt:
L2-norm、L2-Hys、L1-Sqrt三者的效果差不多,L1-norm最差,不归一化就更差了。
5. 检测窗口和上下文
64*128的检测窗口,以及在4个方向的16 pixels的border。
6. 分类器
采用C=0.01的linear SVM (SVMLight)。