目录
一、概览
1.1 贡献点
1.2 背景
双阶段
单阶段
二、方法
2.1 Unified detection
2.2 网络结构设计
2.3 缺点
三、实验
3.1 模型性能对比
3.2 错误样本分析
3.3 YOLO与fast-RCNN的boost
3.4 实时检测模型对比
四、结论及个人评价
相关内容:
深度学习目标检测2013-2018模型总结概览及详解
深度学习目标检测2013-2018单双阶段主流模型概览及详解:
https://blog.csdn.net/weixin_36474809/article/details/84172579
目标检测模型旨在从图片中定位出目标。分为单阶段目标检测模型和双阶段目标检测模型。
一个阶段提出备选框,一个阶段对备选框进行判断。是一个两阶段级联的网络。主要为RCNN系列的网络。
单阶段的网络,整个生成备选框的过程一体化的实现。代表有YOLO系列和SSD(single shot detector)
之前的双阶段模型,如RCNN系列,将模型分为两部分,一部分给出备选框,另一部分进行备选框的预测。而YOLO将图片作为一个整体进行预测。
分格:
最终,每个S*S的方格预测得出B个备选框(包含5个坐标,x,y,w,h,confidence),同时,每个方格预测得到每个C类的置信概率。最终,网络预测输出一个张量 S*S*(B*5+C). 例如在PASCAL VOC数据集上,作者采用了S=7,也就是7×7个方格,B=2,每个方格负责预测得到2个备选框,同时,因为网络是20个分类标签,是C=20,所以最终预测的张量是:S*S*(B*5+C)=7×7×(2×5+20)
采用卷积神经网络的结构,卷积层提取特征,最终全连接层进行张量的预测,张量包含概率和坐标。沿用GoogLeNet的结构。用1×1的reduction layer后面跟3×3的卷积layer。
预测框被归一化为0-1之间。
激活函数:Leakey ReLU
Loss函数:
由两部分构成,定位误差与分类误差。localization error与classification error, 定位误差相对于分类误差更重要一些,因此将定位误差的系数 λ_coord设为5,分类误差的系数 λ_noobj设为0.5
小目标效果差,宽高比不规则物体效果差,IOU指标的不合理性
在PASCAL VOC2007数据集上进行实验。并且与其他实时模型进行比较,并与双阶段模型,如R-CNN进行对比。
对比相应的帧率和mAP,可以看出,实时模型中,YOLOmAP最高,且Fast YOLO速率最快。
用IOU与分类作为评价标准,目标检测结果分为下列几类。
YOLO可以检测出更少的background,而fast-RCNN可以达到更高的mAP-71.8,因此,两个网络可以通过boosting的过程结合。
通过实验,YOLO对与提升RCNN的性能非常有帮助。在PASCAL2012的数据集上,YOLO与RCNN结合能够达到最高的mAP
在三个数据集上进行对比,VOC2007,Picasso,People-art上。
将双阶段的目标检测模型改进为单阶段目标检测模型,非常具有开创性。并且将bounding box的坐标值预测为张量,将目标检测的定位实现为一个回归问题。
相关内容:
深度学习目标检测2013-2018模型总结概览及详解
目标检测网络mAP的测试的python实现
YOLOv3:Darknet代码解析(一)安装Darknet
YOLOv3:Darknet代码解析(二)代码初步
YOLOv3:Darknet代码解析(三)卷积操作
YOLOv3:Darknet代码解析(四)结构更改与训练
YOLOv3:Darknet代码解析(五)权重与特征存储
YOLOv3:Darknet代码解析(六)简化的程序与卷积拆分