YOLO系列0:入门

Faster R-CNN的方法目前是主流的目标检测方法,但是速度上并不能满足实时的要求。YOLO一类的方法慢慢显现出其重要性,这类方法使用了回归的思想,利用整张图作为网络的输入,直接在图像的多个位置上回归出这个位置的目标边框,以及目标所属的类别。

YOLO系列0:入门_第1张图片

 

(1) 给个一个输入图像,首先将图像划分成7*7的网格
(2) 对于每个网格,我们都预测2个边框(上面:bbx+bbx是目标的置信度;下面:每个边框在不同类别的概率)
(3) 根据阈值去除可能性比较低的目标窗口,最后NMS去除冗余窗口即可(关于什么是非极大值抑制NMS,请参看:https://www.julyedu.com/question/big/kp_id/26/ques_id/2141)。
整个过程非常简单,不再需要中间的region proposal找目标,直接回归便完成了位置和类别的判定。

SSD

YOLO存在的问题,使用整图特征在7*7的粗糙网格内回归对目标的定位并不是很精准。那是不是可以结合region proposal的思想实现精准一些的定位?SSD结合YOLO的回归思想以及Faster R-CNN的anchor机制做到了这点。

YOLO系列0:入门_第2张图片

 

上图是SSD的一个框架图&#x

你可能感兴趣的:(目标识别/语义分割,YOLO,深度学习,计算机视觉)