Dollar toolbox工具包是dollar写的关于行人检测的MATLAB工具包,工具包是对他经典论文的实现。
可在https://pdollar.github.io/toolbox/中查看详情。
一、工具包框架
工具包分为六大部分,分别是:
1.channels:
这部分主要是计算feature的函数,介绍了计算HOG,FHOG,gradientHist等特征的函数,还有几个平滑函数。关于特征理论部分的内容,主要参考的论文有
[1] P. Doll�r, Z. Tu, P. Perona and S. Belongie
"Integral Channel Features", BMVC 2009.
[2] P. Doll�r, S. Belongie and P. Perona
"The Fastest Pedestrian Detector in the West," BMVC 2010.
[3] P. Doll�r, R. Appel and W. Kienzle
"Crosstalk Cascades for Frame-Rate Pedestrian Detection," ECCV 2012.
[4] P. Doll�r, R. Appel, S. Belongie and P. Perona
"Fast Feature Pyramids for Object Detection", PAMI 2014.
2.Classify:
这部分主要是用于行人检测的常用分类器算法的实现,包括聚类、PCA、随机森林、决策树、回归树、adaboost等。
3.Detector:
该部分是检测器的实现,作者用的是Aggregate Channel Features(ACF)检测器,ACF是对经典的VJ检测器的改进,速度和检测精度都有大幅提升,作者在论文 "Fast Feature Pyramids for Object Detection," 中提出ACF算法。该部分代码理论知识主要来源于以下论文:
[1] P. Doll�r, Z. Tu, P. Perona and S. Belongie
"Integral Channel Features", BMVC 2009.
[2] P. Doll�r, S. Belongie and P. Perona
"The Fastest Pedestrian Detector in the West," BMVC 2010.
[3] P. Doll�r, R. Appel and W. Kienzle
"Crosstalk Cascades for Frame-Rate Pedestrian Detection," ECCV 2012.
[4] P. Doll�r, R. Appel, S. Belongie and P. Perona
"Fast Feature Pyramids for Object Detection," PAMI 2014.
[5] W. Nam, P. Doll�r, and J.H. Han
"Local Decorrelation For Improved Pedestrian Detection,"
4.Filter:
该部分是常用滤波器的实现代码,有线性和非线性的,如DoG,Gabor,Gaussian等。
5.Images:
该部分是对图像的一般操作,主要是图像的显示等处理,在读以上几部分代码时,会涉及到本部分的内容,当用到时候来查找就好。
6.matlab:
是一些对MATLAB功能的扩展函数,包含显示图片、画图等功能。建议用到时来查找就好。
7.Videos:
对视频的一些操作函数。
打开连接:https://pdollar.github.io/toolbox/,可以看到如下界面,有各个部分的简单说明,每个部分又包含很多函数,其中一部分有使用例子。由于也是刚开始学习,准备每个函数都用一下,然后再对感兴趣的函数读源代码,建议先读一下相关论文,然后来看代码,这样对应着看,效果会好些。