(四)YOLO-V3网络架构(※)

        YOLO-V3在网络架构上进行了很大程度的修改,特征提取、先验框以及softmax分类都做了改进,效果极佳,可以称为YOLO系列的巅峰巨作

(四)YOLO-V3网络架构(※)_第1张图片

(1)多scale先验框(多尺度预测)

        在V2中为了解决小目标检测的问题,采用特征融合的方式进行改善。在V3中引入3个不同scale,每种scale设置3个不同的先验框,3个scale分别适用于不同大小的特征图,比如较大的特征图的感受野较窄,那么对应较大scale的先验框,就能对小目标进行更好的检测

(四)YOLO-V3网络架构(※)_第2张图片

         对于不同的scale,预测的方式有两种。左图为对不同的scale(可以理解为不同大小的特征图层)分别进行预测,即独立地预测大、中、小目标;右图进行了特征融合的工作,比如对于26*26的特征层,将13*13的特征层进行上采样变成26*26,再与26*26的特征层融合,再进行预测任务。很明显第二种方式比较科学,V3版本中采用的就是这样的特征融合。

(四)YOLO-V3网络架构(※)_第3张图片

(2)残差连接

        在神经网络各层的连接中,V3借鉴了ResNet中的思想,添加了残差连接机制。主要起到的就是防止随着网络迭代的深度,训练效果变差的作用。

(四)YOLO-V3网络架构(※)_第4张图片

 (3)整体网络架构

  • 使用卷积层代替池化层和全连接层
  • 采取stride为2的下采样对特征进行resize
  • 对不同的特征图进行融合

(四)YOLO-V3网络架构(※)_第5张图片

  (4)softmax层改进

        V2中的softmax层最终输出结果只能表示是/不是某个物体,而V3中使用logistic激活函数实现,可以得出每个类别的可能性,大于某个阈值时即可判定属于,从而实现多标签检测。

你可能感兴趣的:(YOLO目标检测,深度学习,计算机视觉,目标检测,人工智能)