我的学习概括

1、深度学习-目标检测综述(各种代码,资源非常好):
http://blog.csdn.net/u012538490/article/details/55259984

2、目标检测方法系列——R-CNN, SPP, Fast R-CNN, Faster R-CNN, YOLO, SSD方法对比:
http://www.cnblogs.com/lillylin/p/6207119.html

3、统的目标检测

一般使用滑动窗口的框架,主要包括以下三个步骤:

(1)利用不同尺寸的滑动窗口,框住图像的某一部分,将其作为候选区域;
(2)提取候选区域相关的视觉特征,比如人脸检测常用的Harr特征、行人检测和普通目标检测常用的HOG特征等;
(3)利用分类器进行识别,比如常用的SVM模型。

但是传统目标检测主要存在两个问题:一是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。

自然界的大部分物体具有运动能力,会发生非刚体形变,为此目标类别检测最具影响力的方法之一多尺度形变部件模型(DPM),继承了使用HOG特征和SVM分类器的优点。2012年前,目标检测中分类任务的框架就是使用人为设计的特征训练浅层分类器完成分类任务,最佳算法是基于DPM框架的各种改进算法。2012年DCNN, 2013年是Overfeat。

4、SIFT,Harr与HOG特征
5、DPM:VOC(Visual Object Class)07,08,09年的检测冠军(稍微了解):
http://blog.csdn.net/ttransposition/article/details/12966521

大体思路与HOG一致。先计算梯度方向直方图,然后用SVM(Surpport Vector Machine)训练得到物体的梯度模型(Model)。有了这样的模板就可以直接用来分类了,简单理解就是模型和目标匹配。后面又加了一些部件的子模型,并且给了子模型偏置的loss

你可能感兴趣的:(我的学习概括)