【YOLO学习笔记】YOLO v2网络结构

YOLO v2网络结构

1.Darknet-19结构

下面为基础网络Darknet-19的结构。19个conv层,5个maxpool层,每次Pooling后增加一倍channel的数量。最后的conv层、avgpool层和softmax层是用于分类训练时的输出结构,使用global average pooling。

【YOLO学习笔记】YOLO v2网络结构_第1张图片

2.YOLO v2网络架构

用于检测时,去掉最后1个conv层,在conv-18后加上了3个3x3conv层(conv-19、conv-20、conv-21),其中每个conv层都有1024个filters。

【YOLO学习笔记】YOLO v2网络结构_第2张图片

passthrough layer

在预测时使用,将网络中间层的特征图输出。将下采样时同一位置的像素分解成4个子图(变换后通道数变为4倍),concat合并起来。将conv13(第5个Max Pooling层之前的conv层)进行变换(512x26x26变为2048x13x13,和conv20输出的特征图大小一致),再和conv20的输出进行concat后作为conv21的输入。conv22为 1x1的卷积层,得到预测输出的张量,生成目标框。输出的通道大小为 B*(C+5) , B为每个格子预测的anchor数。

一分四示意图:

【YOLO学习笔记】YOLO v2网络结构_第3张图片

参考

【1】YOLO、YOLOv2整理link
【2】YOLO v2网络详细结构分析与参数计算link

你可能感兴趣的:(YOLO,深度学习)