Ten Years of Pedestrian Detection,What Have We Learned? 知识笔记

本文作者:Rodrigo Benenson     Mohamed Omran    Jan Hosang     Bernt Schiele


以Caltech行人检测为基准分析了近十年广泛流通的具有标志性的40多种检测方法。

进行了对多种已经被广泛认可的研究方法的补充性的研究。

这种决策林达到了目前已知的最好的效果。(在具有挑战性的Caltech-USA dataset上)


简介:

行人检测是图像检测的一种特例。

“Viola&Jones variants(V-J变形)”

“HOG+SVM rigid templates(HOG+SVM精确模板)”

“deformable part detectors(DPM)(部分可变性探测器)”

“convolutional neural networks(ConvNets)(卷积神经网络)”都进行过行人检测。

本文的目的就是回顾近十年的40多种行人检测方法,量化出那些因素对于最终的检测结果具有最大的影响。


已知数据集的回顾:

INRIA:1、老 2、图片较少 3、有利于对于不同环境下的行人的高质量的注释(这也是为什么这个数据集通常作为训练集来使用的原因)。

图片是从视频里获得的,因此光照的变化也能作为一种额外的行人检测信息。


ETH & TUD-Brussels :中等大小的视频集(video dataset)

Daimler :缺少颜色通道,所以有的方法在此数据集上不能用。   

ETH & TUD-Brussels 和 Daimler 提供了立体的信息。


Caltech-USA和KITTI是当前行人检测方面的主要基准。


检测方法年表
2003 V-J检测器被提出
2005 HOG检测器被提出
2008 DPM检测器被提出
2009 Caltech行人检测基准开始被使用了,对比了七种不同的检测器的性能,同一时间,FPPI开始被使用(原来是FPPW)
2013 有三分之一的检测方法被提出

结论:

这40多种检测方法其实能被分成三类:1.、DPM的变体(DPM) 2、深度网络(Deep Networks)(DN)  3、决策森林(Decision forests)(DF)


基于行的boosted决策森林(DF)在行人检测方面效果最好,最好的检测效果是执行在(1、INRIA数据集训练,Caltech数据集测试   2、Caltech数据集训练,Caltech数据集测试)


结论
DPM、DN、DF
目前,这三种方法在行人检测方面都有优异的表现。
classifier
没有证据能表明是否存在哪种类型的分类器更适合行人检测。
也没有证据能表明非线性核心比线性核心更有意义。
HikSvm被认为近似于非线性核心(kernel),这种方法在FPPW评价方法上表现很好,而在FPPI上表现不好。
MultiFtrs,在给出足够多的特征值的情况下,Adaboost和线性SVN(linear SVM)在行人检测方面的表现粗略相同。
additional data
    额外信息
 (e.g.光照)
有的探测器通过增加对其他额外数据(光照变化、图片立体信息、轨迹及其他来自其他传感器的信息)来提升探测器的表现。
在单通道图像上,使用额外数据会得到表现提升。
   
   
   
   
   

昨天半夜两点才睡觉,今天六点就得起来去学院顶着冷风给人大代表投票,现在头晕晕的,胃轻微犯恶心...

下午还有外教课,实在写不动了,周六来实验室继续整理吧...

上午被导师批评了,说我基础的东西都搞不懂...有点难过,是不是我太玻璃心了...

唔,算了不想了,遇到问题就解决问题呗,难过有什么用,不过真的好想哭啊。

学计算机好累啊,尽管还挺喜欢写代码的,但是还是觉得有点累...

不行,要坚持!!!加油!!!

2017/11/10

你可能感兴趣的:(图像检测,LBP,HOG)