CVPR2005【行人检测】HOG+SVM用于人体检测的梯度方向直方图

目录

  • CVPR2005-用于人体检测的梯度方向直方图 Histograms of Oriented Gradients for Human Detection
    • 使用的数据集
    • 研究方法
      • 数据
      • 流程
    • 双对数坐标上的评价曲线DET
    • 结果综述
    • 算法实现和性能研究
      • 检测器参数
    • 算法实现细节
      • 1.伽马/颜色规范化
      • 2.梯度计算
      • 3.空间/方向bin统计
      • 归一化和描述子块
        • R-HOG
        • C-HOG
        • 归一化策略

CVPR2005-用于人体检测的梯度方向直方图 Histograms of Oriented Gradients for Human Detection

使用的数据集

  • MIT行人数据库
  1. 共924张行人图片(ppm格式,宽高64*128),肩到脚的距离约80像素
  2. 只有正面和背面两个视角
  3. 无负样本,未区分训练集和测试集
  • INRIA数据集
  1. 目前使用较多的静态行人检测数据库
  2. 有原始图片和相应的标注
  3. 训练集有正样本614张(包含2416个行人);负样本1218张
  4. 测试集有正样本288张(包含1126个行人);负样本453张
  5. 途中人体大部分为站立姿势且高度大于100像素。部分标注不正确
  6. 图片主要来源GRAZ-01、个人照片及Google图片

研究方法

数据

  • 正样本:1239个行人图片及左右翻转的图片,即共2478个
  • 负样本:1218个没有行人的图片中随机选取12180个检测窗口大小的子图作为负样本

流程

检测出来的是错误分类的负样本
正负样本训练分类器
初始SVM分类器在负样本原图上进行行人检测
难例
加入到初始负样本集,重新训练分类器
最终的分类器

双对数坐标上的评价曲线DET

纵坐标: 漏检率(miss rate, 1-recall rate(查全率,命中率)),FalseNeg(漏检)/(TruePos(检测到)+FalseNeg(漏检))

横坐标: 每个窗口的误报率(FPPW, False Positives Per Window ),两个值越低越好 经常使用10E-4时漏检率作为结果性能的参考点

结果综述

HOG检测器
矩形块ROH
环形极坐标块C-HOG
线性SVM
核函数SVM

算法实现和性能研究

检测器参数

检测器参数
无Gamma校正的RGB颜色空间
梯度算子-1,0,1,无平滑
梯度方向离散到0-180度之间的9个bin中
块block大小为16*16
细胞单元cell大小为8*8
高斯滤波参数theter为8
L2HYs块归一化
块移动步长8个像素
检测窗口为64*128

结论:

1.要想检测器好,需要精细尺度的微分(不需要平滑)

2.梯度方向直方图的bin尽量多尺寸适度、归一化的重叠的描述子块

算法实现细节

1.伽马/颜色规范化

结论:

1.次论文中,伽马变换对结果影响很小

2.对每个通道进行平方根Gamma压缩(gamma参数1/2),会在10-4FPPW时有1%的性能提升

伽马变换补充

s=cr γ

其中,r为输入图像像素;c为常数;γ为幂,变换的参数

说明:

1.γ>1时,伽马变换将拉低图像灰度值

2.γ<1时,伽马变换将提高图像灰度值

2.梯度计算

使用的模板:

最紧凑的中心二维微分模板
2*2
2*2
模板
一维
-1,1
-1,0,1
1,-8,0.8,-1
3*3sobel模板
2*2对角线模板
0,1,-1,0
-1,0,0,1

结论:

1.[-1 0 1]模板在theter=0(即无平滑)时表现最好

2.更大的模板或增加搞死平滑会降低性能

3.空间/方向bin统计

1.减少混叠现象,梯度投票在相邻bin的中心之间进行方向位置上的双线性差值

2.权重根据梯度幅值计算(可以根据幅值、幅值平方、幅值平方根,但幅值本身最好)

对于行人检测来说:

  • 无符号梯度方向直方图(0-180度)比较有用,符号信息降低性能
  • 无符号方向梯度直方图前提下,增加方向bin的个数能够显著提高检测器性能,大约9个bin

对于其他目标检测来说:

梯度符号信号是有用的,如汽车、摩托等

归一化和描述子块

作用:

  • 消除光照
  • 消除前景背景对比度

结论:

  • 块重叠从0增加至3/4时,10-4FPPW下有4%的性能提升

R-HOG

  • 稠密的网格空间中进行计算,无主方向
  • R-HOG有三个参数:块大小;细胞单元大小;每个细胞的bin方向个数

R-HOG结论:

  • 细胞单元为6-8个像素宽是性能最优
  • 每个块内含22或33个细胞单元时最优
  • 在统计直方图bin前用搞死加权降低块边缘像素权重,10-4FPPW下,使用theter=0.5$\times$block_width的二维高斯核提高1%

C-HOG

C-HOG参数
角度bin个数,4个
半径bin个数,2个
中心圆的半径,以像素为单位,4个像素最好
子半径的伸展因子

完整细胞单元的形式:
CVPR2005【行人检测】HOG+SVM用于人体检测的梯度方向直方图_第1张图片
中心单元被分为4个90°扇形的形式:
CVPR2005【行人检测】HOG+SVM用于人体检测的梯度方向直方图_第2张图片

归一化策略

CVPR2005【行人检测】HOG+SVM用于人体检测的梯度方向直方图_第3张图片
结论:

  • L2-Hys、L2-norm、L1-sqrt的表现差不多一样好
  • 简单的L1-norm会使性能下降5%
  • 如果完全不进行归一化会导致性能下降27%(都是指10-4FPPW时)
    CVPR2005【行人检测】HOG+SVM用于人体检测的梯度方向直方图_第4张图片

你可能感兴趣的:(行人检测)