【物体检测】物体检测相关与RCNN系列

现在开始讨论物体检测。

还是从博客及论文开始大量学习。

1.https://www.cnblogs.com/love6tao/p/7351952.html《一篇文章看懂物体检测的发展脉络》

计算机视觉:

第一个层次是图像分类、物体检测、语义分割

第二个层次是3D重建

第三个层次是视觉问答

物体检测典型思路:确定目标位置+置信度分类

确定目标位置方法:

滑动窗口穷举遍历;启发式方法,region proposal method,如Selective Search

置信度分类:

图像模板匹配,计算相关性;

事先知道三维形状,进行匹配;

图像特征表达,欧氏距离匹配;

SIFT\HOG\LBP特征+SVM等分类器;

DPM:Pictorial Structure(弹簧模型,允许部件位置上的一定程度的不同)+HOG dectector

深度学习CNN提取特征然后分类{

R-CNN 系列:先产生region proposal,然后再去分类和回归。

SSD YOLO:一步到位

}

用CNN去解决检测问题的思路,基本就是这几个套路。其实还有一个方向我们并没有讨论,就是用神经网络去学习怎么做检测的后处理,例如非极大抑制(Non-Maximum Suppression)等。这类工作关注的人相对比较少,所以相关的工作也不多。不过在上面介绍的几个基本框架下,可以研究的细节还有很多,例如怎样去处理好物体的尺度问题,物体的形变问题,怎样用多任务学习来提高物体检测的性能,怎样去最好context和detail之前的平衡等等,我们就不在此做详细讨论了。

在物体检测领域,对细节的处理直接影响到模型最终的结果

2. https://www.cnblogs.com/sddai/p/5696870.html 《准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure》

精确率就是有没有误检的,如果有,正确的占比多大

召回率就是有没有漏检的,如果有,检测出来的占比多大

注意理解 TP  FP


你可能感兴趣的:(物体检测)