Pedestrian Detection: An Evaluation of the State of the Art

Pedestrian Detection: An Evaluation of the State of the Art

  • Pedestrian Detection An Evaluation of the State of the Art
    • 前言
    • 关于数据的获取和数据分析
    • 评估方法
    • 算法综述
    • Some Websites
    • Notable Researchers


前言

本文是阅读piotr的PAMI2011文章《Pedestrian Detection: An Evaluation of the State of the Art》的摘要和感想,文章中的Caltech数据集以及代码可以在项目主页上得到。

关于数据的获取和数据分析

  • Caltech行人检测数据集数据的取得是通过车在摄像头在城市里拍摄的视频得到的,拍摄的视频通过Lucas-kanade方法去抖动(可以参考:S. Baker and etc., “Lucas-kanade 20 years on: A unifying framework,” IJCV 2004)
  • 标注数据的时候,每间隔几帧标注一次,中间的数据通过插值(cubic interpolation)得到(效果比跟踪更好)
  • 标注的包围盒(bound box)的高度呈现lognormal分布(求对数之后呈正太分布)
  • 很多标注的行人都有遮挡的情况,遮挡的部位往往不是随机的,而且遮挡的模式也就是固定的几种
  • 由于采用车载设备拍摄,行人在图像中的位置一般都集中在某些区域(可以通过添加这个限制来加速行人检测)
  • selection bias:用照片或是监控视频作为数据集的时候,由于照片一般是人摆放好姿势拍摄的,而监控视频中背景是不动的,从而会添加额外的限制,而用车载设备拍摄则不会这样。

评估方法

  1. Full Image Evaluation:
    BBdt :detected bound box
    BBgt :ground truth bound box
    当重叠的面积大于0.5时,即 area(BBdtBBgt)area(BBdtBBgt)>0.5 ,就可以作为一次成功的检测,阈值设定在0.6以下时影响都不大。
    对于每一张图片有一个 BBdt 的list和 BBgt 的list, 需要对两者进行匹配,置信值高的 BBdt 先匹配,当一个 BBdt 匹配到多个ground truth的时候,将重叠面积大的作为一个匹配。没有匹配的 BBdt 为false positive,没有匹配的 BBgt 为false negative。
    性能评估方法:log-average miss rate vs FPPI(false positive per image)
  2. Filtering Ground Truth
    标注中的一些标注可以忽略(比如BB高度太低、标注不清等),但是和这些标注匹配也不能视为匹配错误。
  3. Filtering Detections
    Strict filtering:先把检测结果筛选然后匹配(under-report)
    Post filtering:先匹配然后再剩下的中过滤(over-report)

算法综述

  • Papageorgiou:multiscale Haar wavelets + slide window + SVM
  • Viola and Jones: 积分图 + Adaboost for feature selection
  • Dalal and Triggs: HOG
  • combined feature: Haar like, shapelet, shape context, HOG, color, LBP, implicit segmentation
  • part and pose: DPM and poselet

Some Websites

  1. Caltech Data
  2. Pedestrian Detection(Edgar Seemann)
  3. Piotr Toolbox
  4. DPM
  5. poselet

Notable Researchers

  • piotr dollár: http://vision.ucsd.edu/~pdollar/
  • Rodrigo Benenson: http://rodrigob.github.io/

你可能感兴趣的:(computer,vision)