【论文笔记】:YOLO v3

&Title

【论文笔记】:YOLO v3_第1张图片

  • YOLOv3: An Incremental Improvement

&Summary

两点改进对结果提升比较大:

  • fpn的特征融合(借鉴FPN)
  • 改基础网络(借鉴resnet)

相比于YOLOv2,改进的地方有:引入了一个新的基础网络,bundingbox取最好预测框的去训练,其他框丢掉,用了FPN,丢掉了softmax改用二元交叉熵。

对小目标的检测效果提升明显

具体可以看论文

&Results

【论文笔记】:YOLO v3_第2张图片

  • YOLOv3的运行速度明显快于其他具有可比性能的检测方法。

【论文笔记】:YOLO v3_第3张图片

  • 虽然retinanet的精度高,但是它图像处理时间要长3.8倍。YOLOv3比SSD变种要好得多,可与AP50指标上的最新模型相媲美。

【论文笔记】:YOLO v3_第4张图片

  • 在精度差不多的情况下,推理时间远低于retinanet
    (作者从resnet论文中拿了这张图,然后把自己的放在第二象限,想表达什么意思懂了吧哈哈哈哈哈哈)

&Notes

以下内容摘自知乎石山潜的回答

作者:石山潜
链接:https://www.zhihu.com/question/269909535/answer/471978963
来源:知乎

从算法角度补充两点,对比YOLO V3和SSD系列网络结构差异造成的效果的区别。

  1. 对比SSD,为何YOLO V3小物体的检测效果这么好?
    不仅仅因为YOLO V3引入FPN结构,同时它的检测层由三级feature layers融合,而SSD的六个特征金字塔层全部来自于FCN的最后一层,其实也就是一级特征再做细化,明显一级feature map的特征容量肯定要弱于三级,尤其是浅层包含的大量小物体特征。
    【论文笔记】:YOLO v3_第5张图片
    FSSD(SSD的变种改进)虽然也引入金字塔融合,但治标不治本,需要靠最后一层保留所有信息的压力没有减小例如SSD的金字塔融合版本FSSD,虽也有与YOLO V3类似的FPN结构,但它输入到回归层的信息量与SSD无差别,对再多的层做concat也只能补充SSD最后一层信息的不完整,却不能扩充总的特征“容量”。尤其是用类似COCO这样,训练数据很多是大物体的数据训练的模型,可以毫不客气的说SSD的主网络会在训练的时候自然而然的让VGG16的最后一层自动筛掉小物体。【论文笔记】:YOLO v3_第6张图片
    YOLO V3主网络输入回归网络实现了多级输入,而非像SSD一样的单级YOLO V3则不一样,直接把浅层网络拉出来融合撸小物体,这样的结构解决了SSD检测小物体能力不佳的问题。

  2. YOLO V3为何在mAP与SSD相同的情况下速度快很多?
    首先Darknet网络引入了residual结构,结构优势比VGG16不知高到哪里去了,所以如果SSD也用上精简的残差网络,再优化一下冗余的回归金字塔结构,速度也能快很多。另外我猜测使用logistic而不用softmax,对比SSD需要不断抑制background类数量过多而做出的计算上,速度也会更快一些,个人猜测,没有做实际论证。

  3. YOLO V3与SSD比有什么缺点?
    可能是在大物体定位精度上稍微差一些,这个对比两者网络结构应该也不难看出,相信作者在下一代YOLO V4里会做出优化。总而言之作者还是很厉害的,几乎优化了单步检测所有可以优化的点,精度上干掉F-RCN,速度上干掉SSD,别人哪里强我就比它更强。依我个人看来,如果没有极具创新性的算法革新,短期内很难有能超过YOLO V3性能的了.

&Thinks

  1. YOLOv3提升小目标检测精度的主要原因来自于引入了FPN?YOLOv3跟引入了FPN的其他一阶段检测器相比,小目标效果是不是差不多??如果主要原因不是,那这个原因是不是可以用来改善FPN?

注:有知道的大佬可以告知一下,感谢。我有时间做一下实验的话,知道后再来补上。

  1. 关于提升小目标精度的,在特征融合这块,还可以继续怎么做??增加浅层小目标信息???残差连接,保留底层信息???还有其他吗???
  2. 很多特征融合方面的论文,少不了各种的3 * 3卷积,1 * 1卷积等,应该搞清楚作用是啥,目的是啥,可以带来什么好处。这里等我有空总结总结吧,博主本人基础不太扎实(抱哭)!!!
  3. ……待补充

其他小目标检测相关论文笔记:

  • Residual BiFusion Feature Pyramid Network
  • ……

注:广泛阅读中,有好的优质论文,请各位大佬帮忙多多推荐!!

你可能感兴趣的:(#,小目标检测,#,特征层面,计算机视觉)