CV 经典主干网络 (Backbone) 系列: Darknet-53

CV 经典主干网络 (Backbone) 系列: Darknet-53

作者:Joseph Redmon

发表时间:2018

Paper 原文: YOLOv3: An Incremental Improvement

该篇是 CV 经典主干网络 (Backbone) 系列 下的一篇文章。

1. 网络结构

Darknet-53 是 YOLOv3 的 backbone。具体结构参考下面的图片。左侧是 Darknet-53 的完整结构图,右侧是对左侧中的 “Convolutional” 层 和 “Residual” 层的细节展示。显然 Darknet-53 借鉴了 Resnet 的设计思想,引入了 shotcut 的概念。

在这里插入图片描述

Darknet-53 顾名思意,总共有 53 个卷积层,但是上面的结构中只看到 52 个卷积层,其实 最后的 “Connected” 层也是卷积层(1x1 的卷积实现的类似 fc 的效果,所以也有资料把它称做 fc 层),“Connected” 层的具体参数如下。

[convolutional]
filters=1000
size=1
stride=1
pad=1
activation=linear

Darknet-53 输入 image size 为 256(没有 fc 层,显然可以随意修改输入 size),最后得到的 feature map size 为 8x8,stride 为 32(值得注意的是 5 次下采样,都不是通过 pooling 做的,而是通过 stride 为 2 的卷积层实现的,上图中蓝色框标出的位置,darknet-19 中是通过 max pooling)。

2. 性能

论文中给出的 Darknet-53 的性能接近 ResNet-152,但是 FPS 要高一倍。

在这里插入图片描述

你可能感兴趣的:(Backbone,darknet53,网络,结构,解析,总结)