(深度学习论文精读总结)You Only Look Once: Unified, Real-Time Object Detection

一、文献名字和作者

文献名:You Only Look Once: Unified, Real-Time Object Detection
作者名:Joseph Redmon,Santosh Divvala,Ross Girshick,Ali Farhadi

二、阅读时间

2019年7月24日~2019年7月26日(本人读的第一篇英文论文,比较慢)

三、文献领域

目标检测

四、文献目的

本文主要实现的是目标检测,即对于给定图片,对其中的各个对象进行检测,最终以比较准确的边界框的形式将其圈出,并显示其具体为哪一个类别。前人已经通过一些算法诸如DPM,R-CNN等实现过目标检测,本文力求提出一种新算法以提高准确率与性能。

五、文献核心与创新点

核心:作者提出了YOLO算法,其详细过程为:给定一张图,分为N x N网格,每一个小网格生成两个边界框,再使用非最大抑制法去掉多余边界框,确保每一个对象最终只有一个边界框,最终输出目标检测结果。

创新点:

  1. 提出了一种新的目标检测算法——YOLO算法
  2. YOLO算法与之前的DPM,R-CNN算法相比,总的来说mAP和fps都有显著提升,尤其是实时目标检测方面更加出色
  3. YOLO+R-CNN结合的方法进一步提升性能,在当前所有检测算法中性能可以排到第五位

六、文献前景与不足

前景:文里没说,应该是继续优化提升YOLO算法性能
不足:YOLO算法对于小物体以及挨得很近的物体预测的不是很好,由于其算法设定特性可能会漏预测个别对象

七、自己的收获

这是我阅读的第一篇英文学术论文,比较有纪念价值,首先要克服语言上的障碍,比如单词不认识,单词认识但是句子不懂,阅读速度慢等等。这篇论文用了3天时间读完,当然比较懒,每天就读了不到2小时,边读边要查漏补缺各种知识所以比较慢,以后应该会加快速度。

小知识点:

  • mAP:mean average precision,平均精度
  • fps:frames per second,每秒传输帧数

这两个是评价算法性能的主要指标,mAP是根据presicion-recall曲线面积计算得到

你可能感兴趣的:(深度学习,论文总结)