YOLO V4(2020 CV)

论文标题 YOLOv4: Optimal Speed and Accuracy of Object Detection
论文作者 Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
发表日期 2020年04月01日
GB引用 > Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao. YOLOv4: Optimal Speed and Accuracy of Object Detection[J]. ArXiv E-prints, 2020, abs/2004.10934.
DOI https://arxiv.org/abs/2004.10934

论文地址:https://arxiv.org/pdf/2004.10934

YOLO V4(2020 CV)_第1张图片

摘要

YOLOv4通过结合多种创新技术实现了高精度和高速度的目标检测。该模型使用了CSPDarknet53作为骨干网络,并添加了SPP、PANet等模块来增加感受野和特征聚合能力。YOLOv4还引入了Mosaic数据增强、自对抗训练(SAT)、跨批次归一化(CmBN)等新技术,显著提升了检测性能。最终,在MS COCO数据集上达到了43.5%的平均精度(AP),并且在Tesla V100显卡上的实时速度达到约65帧每秒。这些改进使得YOLOv4可以在常规GPU上进行高效训练和部署。

全文摘要

这篇论文介绍了一种名为 YOLOv4 的目标检测算法,旨在提高准确性和速度。作者使用了多种新特征,如加权残差连接、跨阶段部分连接、自对抗训练等,并结合了一些传统的数据增强和正则化方法,最终在 MS COCO 数据集上实现了 43.5% 的平均精度(65.7%的 AP50),同时保持实时速度。

研究问题

如何设计一个在生产系统中运行速度快且适合并行计算的高效物体检测模型,同时优化哪些特定的技术和方法可以提升模型的准确性和效率?

研究方法

实验研究: 在不同的训练策略下,通过调整参数如激活函数、数据增强方法、正则化技术等,验证了它们对分类器和检测器性能的影响。

调查研究: 通过对比不同特征组合对分类器和检测器的影响,系统地研究了各种Bag of Freebies和Bag of Specials方法的效果。

混合方法研究: 结合多种方法,如数据增强技术(CutMix, Mosaic)、自对抗训练(SAT)、交叉批次归一化(CmBN)等,来优化模型的训练过程和检测性能。

研究思路

  • 研究了多种改进措施,包括数据增强方法(如CutMix、Mosaic)、正则化方法(如DropBlock)、激活函数(如Mish)等,以提升分类器和检测器的准确性。
  • 对于不同的训练策略,研究了不同批量大小对模型性能的影响。
  • 使用了遗传算法来优化超参数选择。
  • 引入了新的数据增强技术(如Mosaic)和自我对抗训练(SAT)。
  • 修改了现有的方法,如SAM、PAN,并引入了新的模块如CmBN。

方法

基本目标是在生产系统中实现神经网络的快速运行速度,以及并行计算的优化,而不是低计算量理论指标(每秒浮点运算次数)。我们提出实时神经网络的两种选择:

• 在卷积层中,我们使用少量组数&#x

你可能感兴趣的:(论文阅读,YOLO,人工智能,计算机视觉,学习,笔记,网络)