基于深度学习的目标检测综述

原文链接:http://mp.weixin.qq.com/s?__biz=MzUyMjE2MTE0Mw==&mid=2247485715&idx=2&sn=7f6fddcf6cc21332313ab72eafa92bf2&chksm=f9d1578bcea6de9d52424a0ca8d7700d87bab894bc1cc6d949e8f51fd826a1dd4b92f793f235&mpshare=1&scene=23&srcid=03161EwR0nNTwgifojG7ofyf#rd

 

 

图像分类,检测及分割是计算机视觉领域的三大任务。图像分类模型(详情见[这里](https://medium.com/comet-app/review-of-deep-learning-algorithms-for-image-classification-5fdbca4a05e2))是将图像划分为单个类别,通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体,此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的,并不准确。对于这样的情况,就需要目标检测模型,目标检测模型可以识别一张图片的多个物体,并可以定位出不同物体(给出边界框)。目标检测在很多场景有用,如无人驾驶和安防系统。

 

目前主流的目标检测算法主要是基于深度学习模型,其可以分成两大类:

 

(1)two-stage检测算法,其将检测问题划分为两个阶段,首先产生候选区域(region proposals),然后对候选区域分类(一般还需要对位置精修),这类算法的典型代表是基于region proposal的R-CNN系算法,如R-CNN,Fast R-CNN,Faster R-CNN等;

(2)one-stage检测算法,其不需要region proposal阶段,直接产生物体的类别概率和位置坐标值,比较典型的算法如YOLO和SSD。目标检测模型的主要性能指标是检测准确度和速度,对于准确度,目标检测要考虑物体的定位准确性,而不单单是分类准确度。一般情况下,two-stage算法在准确度上有优势,而one-stage算法在速度上有优势。不过,随着研究的发展,两类算法都在两个方面做改进。

你可能感兴趣的:(基于深度学习的目标检测综述)