【目标检测】--YOLO系列 (YOLO v1)

目录

0. 思路

不同于以往的滑窗检测方法,YOLO v1另辟蹊径,将检测问题认为是对bounding box中心坐标点以及包围框长宽的回归和对每个包围框的分类。并且YOLO方法因为包含更少的背景,假阳率低。

YOLO整体思路是将一张(448 x 448)图片划分成nn个网格,同时,每个网格会产生B个boundding box(x,y,w,h)和 得到一个confidence(判断是哪个类别,在网络最后一层有输出)。网络输出得到一个nn*(B*5+C)长度的向量,对该向量进行回归和分类loss计算。
confidence表示模型认为是类别i的可能性。
在这里插入图片描述
【目标检测】--YOLO系列 (YOLO v1)_第1张图片
label的确定:如图所示,对于每个网格,如果网格中心点落在那个gt 包围框中,就认为是该类别。重叠情况咋办?没关系,因为输出的是每个网格对应类别的置信度。

1. 网络结构

网络结构不复杂,前面24个卷积堆叠,最后接着两个全连接层。中间的激活用的relu最后输出时候用的leaky relu
【目标检测】--YOLO系列 (YOLO v1)_第2张图片

2. loss

(1)由于检测任务中固有的正负样本不均衡,为了增加网络对正样本的约束,λcoord取5,λnoobj取0.5.
(2)这里需要注意的是中心坐标和w、h只针对confidence最高的那个boundding box结果进行计算。
【目标检测】--YOLO系列 (YOLO v1)_第3张图片

3. 优缺点

优点:

(1) 相比于当时先生成候选框的检测算法,快。只需要对很少的bounding box进行计算

缺点:
(1)一个bounding box只能预测一个目标物体,导致YOLO不适用于小目标检测.
(2)由于网格小,误检会对结果造成很大影响,模型鲁棒性不强。
A small error in a large box is generally benign but a small error in a small box has a much greater effect on IOU. Our main source of error is incorrect localizations.

你可能感兴趣的:(深度学习,算法,深度学习)