目标检测之YOLO3

前言

YOLO从诞生起就被贴上了两个标签:速度快,小物体检测率低。而在YOLO3中对小物体的检测有了较大的提升。看一下对比:

目标检测之YOLO3_第1张图片

接下来介绍YOLO3究竟使用了什么黑科技?

YOLO3

先贴几段JR在论文中骚话:

目标检测之YOLO3_第2张图片

 

 1、Class Prediction

作者在YOLO3替换了YOLO2的softmax loss 变成binary cross-entropy loss,由于每个点所对应的bounding box少并且差异大,每个bounding与ground truth的matching策略变成了1对1。当预测的目标类别很复杂的时候,采用binary cross-entropy loss进行分类是更有效的,比如在Open Images Dataset数据集进行分类。在这个数据集中,会有很多重叠的标签,比如女人、人,如果使用softmax则意味着每个候选框只对应着一个类别,但是实际上并不总是这样。复合标签的方法能对数据进行更好的建模。

2、Predictions Across Scales

YOLO3增加了top down 的多级预测,解决了YOLO颗粒度粗,对小目标无力的问题。v2只有一个detection,v3一下变成了3个,分别是一个下采样的,feature map为13*13,还有2个上采样的,feature map为26*26,52*52。这应该是对小目标影响最大的地方。在论文中从单层预测五种bounding box变成每层3种bounding box;

3、Feature Extractor

使用加深的Darknet-53进行特征提取。网络结构如下:

目标检测之YOLO3_第3张图片

它比Darknet-19更强大,同时比Res-Net101更有效率。

总结

YOLO3可以说是当前非常好的目标检测算法,很快而且很准确。YOLO在形成过程中,不断学习别人。在YOLO2吸收faster-rcnn中anchors概念,仿Res-Net的Darkent-19。在YOLO3中学习SSD多尺度区域特征,最终进化到第三阶段,终极状态又会是怎么样呢?让我们拭目以待。下节将要介绍SSD。

你可能感兴趣的:(目标检测之YOLO3)