Dlib: fhog_object_detector_ex

目标

  • 在给定数据集上,使用hog+svm方法建立一个detector做目标检测

算法流程

  • 建立训练集和测试集
  • 数据预处理
  • 提取hog特征
  • svm进行分类

数据预处理

  • pyramid down
    -- 目标:图像的多尺度表示
    -- 方法:高斯金字塔和拉普拉斯金字塔。结合降采样和平滑滤波,对图像进行多尺度表示。对于降维的方法,就是使用高斯核对图像进行卷积,然后删掉偶数列,这样就得到了原来图像1/4的图像,循环做这样的操作,就得到了图像金字塔。对于升维的方法,使用类似的方法进行卷积,然后将现有图像的每个维度扩大为原来的两倍,扩大的行和列用0填充,然后用指定的滤波器进行卷积去估计“丢失”的像素。
  • mirrored version
    -- 方法:将图像进行左右翻转,获得对称图像,以得到double数据集。

提取hog特征

  • 基本思想:在一幅图像中,局部目标的apperance和shape 可以被边缘梯度或者概率密度很好的表示出来。
  • 实现细节:
    -- 将图像进行灰度化
    -- 将图像进行gamma校正,其实就是颜色空间的归一化,这样就降低了局部空间对比度,减少光照和其他噪音的影响
    -- 将图像分成一个个小cell,对每个cell求梯度分布
    -- 将cell组合成block,将每个cell的特征向量串联起来
    -- 具体实现细节见博客:http://blog.csdn.net/zouxy09/article/details/7929348

SIFT特征

  • sift主要用来像素点之间的匹配关系,两个图片之间相应位置的检测,否则因为要对每个点进行匹配,时间复杂度太高

你可能感兴趣的:(Dlib: fhog_object_detector_ex)