CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)

YOLO-v3

  • 6. YOLO-v3
    • 6.1 YOLO-v3 改进综述
    • 6.2 多scale方法改进与特征融合
    • 6.3 经典变换方法对比分析
    • 6.4 残差连接方法解读
    • 6.5 整体网络模型架构分析
    • 6.6 先验框设计改进
    • 6.7 softmax层改进

6. YOLO-v3

**tips:**作者本人因为美军广泛运用于军事领域,所以决定不再继续开发YOLO系列。但是其他人还是继续往后做了~v8都有了

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)_第1张图片

注意,原点值(x轴预测时间,y轴map)是50而不是0!YOLO-v3比其他的强很多!

6.1 YOLO-v3 改进综述

  1. 终于到 V3了,最大的改进就是网络结构,使其更适合小目标检测
  2. 特征做的更细致,融入多持续特征图信息来预测不同规格物体
  3. 先验框更丰富了,3种scale,每种3个规格,一共9种
  4. softmax改进,预测多标签任务:多分类改成很多个二分类

6.2 多scale方法改进与特征融合

从上到下依次是检测小、中、大物体

[外链图片转存中…(img-tcdXelFQ-1675132984921)]

6.3 经典变换方法对比分析

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)_第2张图片

很明显,左图的图像金字塔更能满足多尺度特征融合的要求,但是YOLO的特点是速度快,因此这样反而不合适,那右图合适吗?我们接着往下看:

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)_第3张图片

右图是YOLO-v3的核心思想,13 * 13 的特征图可以上采样成26 * 26的特征图,然后融合原来的26 * 26的特征图。

6.4 残差连接方法解读

右边的曲线图表示模型的卷积层并不是越多越好;左图就是resnet所提出的想法:残差连接

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)_第4张图片

残差连接会自动检测出不适合的参数,然后跳过,总结就是一句话:至少不比原来差!

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)_第5张图片

6.5 整体网络模型架构分析

[外链图片转存中…(img-E1iE52ku-1675132984924)]

所有的重复部分用2x,8x等表示出来了。下图表示出了残差连接的部分:上采样——》拼接——》卷积

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)_第6张图片

6.6 先验框设计改进

[外链图片转存中…(img-Td8DWG3g-1675132984924)]

*13 13 * 3 * 85:

  1. 尺度13*13
  2. 3种先验框
  3. 85=80(类别)+4(x,y,w,h)+1(confidence置信度)

[外链图片转存中…(img-rCJDp7RE-1675132984925)]

还是用聚类选择的先验框

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)_第7张图片

结果:

[外链图片转存中…(img-rFfQYa7R-1675132984925)]

6.7 softmax层改进

加了一个交叉熵损失

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)_第8张图片

二分类任务:取阈值大于某个值的作为正确值。

[外链图片转存中…(img-k45c0d5b-1675132984926)]

你可能感兴趣的:(CV,YOLO,计算机视觉,深度学习)