yolov3的缺点_深度学习目标检测YOLOv3论文解读

yolov3的缺点_深度学习目标检测YOLOv3论文解读_第1张图片

前言

YOLO v3的模型比之前的模型复杂了不少,之前的算法既有保留又有改进。yolo每一代的提升很大一部分决定于backbone网络的提升,从v2的darknet-19到v3的darknet-53。yolo_v3还提供替换backbone——tiny darknet。要想性能牛叉,backbone可以用Darknet-53,要想轻量高速,可以用tiny-darknet。总之,yolo就是天生“灵活”,所以特别适合作为工程算法。

论文名称:

YOLOv3: An Incremental Improvement

论文下载:

https://pjreddie.com/media/files/papers/YOLOv3.pdf​pjreddie.com

论文解读:

YOLOv3 的先验检测(Prior detection)系统将分类器或定位器重新用于执行检测任务。他们将模型应用于图像的多个位置和尺度。而那些评分较高的区域就可以视为检测结果。此外,相对于其它目标检测方法,我们使用了完全不同的方法。我们将一个单神经网络应用于整张图像,该网络将图像划分为不同的区域,因而预测每一块区域的边界框和概率,这些边界框会通过预测的概率加权。我们的模型相比于基于分类器的系统有一些优势。它在测试时会查看整个图像,所以它的预测利用了图像中的全局信息。

改进之处

  • 多尺度预测 (类FPN)
  • 更好的基础分类网络(类ResNet)和分类器 darknet-53。
  • 分类器-类别预测。

多尺度预测

每种尺度预测3个box, anchor的设计方式仍然使用聚类,得到9个聚类中心,将其按照大小均分给3个尺度.

  • 尺度1: 在基础网络之后添加一些卷积层再输出box信息。
  • 尺度2: 从尺度1中的倒数第二层的卷积层上采样(x2)再与最后一个16x16大小的特征图相加,再次通过多个卷积后输出box信息.相比尺度1变大两倍。
  • 尺度3: 与尺度2类似,使用了32x32大小的特征图。

yolov3的缺点_深度学习目标检测YOLOv3论文解读_第2张图片
基础网络 Darknet-53

darknet-53

仿ResNet, 与ResNet-101或ResNet-152准确率接近,但速度更快.对比如下:

yolov3的缺点_深度学习目标检测YOLOv3论文解读_第3张图片

主干架构的性能对比

检测结构如下:

yolov3的缺点_深度学习目标检测YOLOv3论文解读_第4张图片

yolov3的缺点_深度学习目标检测YOLOv3论文解读_第5张图片

YOLOv3在[email protected]及小目标APs上具有不错的结果,但随着IOU的增大,性能下降,说明YOLOv3不能很好地与ground truth切合.

边框预测

yolov3的缺点_深度学习目标检测YOLOv3论文解读_第6张图片
具有尺寸先验和位置预测的边界框

我们边界框的宽和高以作为离聚类中心的位移,并使用 Sigmoid 函数预测边界框相对于滤波器应用位置的中心坐标。

仍采用之前的logis,其中cx,cy是网格的坐标偏移量,pw,ph是预设的anchor box的边长.最终得到的边框坐标值是b*,而网络学习目标是t*,用sigmod函数、指数转换。

类别预测

YOLOv3不使用Softmax对每个框进行分类,主要考虑因素有两个:

  1. Softmax使得每个框分配一个类别(score最大的一个),而对于Open Images这种数据集,目标可能有重叠的类别标签,因此Softmax不适用于多标签分类。
  2. Softmax可被独立的多个logistic分类器替代,且准确率不会下降。

分类损失采用binary cross-entropy loss。

优点

  • 快速,pipline流水线简单.
  • 背景误检率低。
  • 通用性强。YOLO对于艺术类作品中的物体检测同样适用。它对非自然图像物体的检测率远远高于DPM和RCNN系列检测方法。

但相比RCNN系列物体检测方法,YOLO具有以下缺点

  • 识别物体位置精准性差。
  • 召回率低。在每个网格中预测两个box这种约束方式减少了对同一目标的多次检测(R-CNN使用的region proposal方式重叠较多),相比R-CNN使用Selective Search产生2000个proposal(RCNN测试时每张超过40秒),yolo仅使用7x7x2个.

参考:

https://zhuanlan.zhihu.com/p/136382095​zhuanlan.zhihu.com
yolo系列之yolov3【深度解析】_木盏-CSDN博客_yolov3​blog.csdn.net
yolov3的缺点_深度学习目标检测YOLOv3论文解读_第7张图片

你可能感兴趣的:(yolov3的缺点)