YOLO系列(三)—— YOLOv3: An Incremental Improvement

本系列分为三篇,此文为本系列第三篇,其他文章:
YOLO系列(一)—— You Only Look Once:Unified, Real-Time Object Detection
YOLO系列(二)—— YOLO9000:Better, Faster, Stronger

project: https://pjreddie.com/darknet/yolo/
paper: YOLOv3: An Incremental Improvement

YOLOv3没有太大的创新,主要是借鉴一些现有的方法来对YOLOv2进行一些改进,不过效果还是比较好的,在延续自己速度优势的情况下,提升了检测的准确率,效果如下图所示:
YOLO系列(三)—— YOLOv3: An Incremental Improvement_第1张图片

YOLOv3主要在以下几个方面做了改进:
1)对象分类由softmax改成logistic,这样可以适用于一个物体有多个标签的情况
2)借鉴FPN,在3个不同特征尺度上进行预测,每个尺度每个grid预测3个boxes。
以416×416的输入为例,预测的box数为:
大box: 416/32=13 13×13×3=507
中box: 13×2=26 26×26×3=2028
小box: 26×2=52 52×52×3=8112
这样大大提升了对小物体的检测
3)修改网络结构为Darknet-53
主要是借鉴了residual network加入了shortcut connections,具体结构如下图所示:
YOLO系列(三)—— YOLOv3: An Incremental Improvement_第2张图片

如果采用COCO mAP50做评估指标,YOLOv3的表现效果更好,如下图所示:
YOLO系列(三)—— YOLOv3: An Incremental Improvement_第3张图片

因此在对预测框准确度要求不是特别高的场合,YOLOv3特别适用,也说明了其box的IOU还有待加强。

YOLO系列(二)—— YOLO9000:Better, Faster, Stronger

你可能感兴趣的:(深度学习)