(论文阅读15/100)You Only Look Once: Unified, Real-Time Object Detection

文献阅读笔记

简介

题目

You Only Look Once: Unified, Real-Time Object Detection

作者

Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi

原文链接

https://arxiv.org/pdf/1506.02640.pdf

《You Only Look Once: Unified, Real-Time Object Detection》-CSDN博客

关键词

Null

研究问题

目标检测框架问题。

研究方法

将detection视为回归问题,仅使用一个neural network同时预测bounding box的位置和类别,因此速度很快。

由于不需提取region proposal,而是直接在整幅图像进行检测,因此YOLOv1可以联系上下文信息和特征,减少将背景检测为物体的错误。

YOLOv1学习到的是目标的泛化表示(generalizable representations),泛化能力非常强,更容易应用于新的领域或输入。

由于不需提取region proposal,则YOLOv1的检测流程很简单:

Resize image:将输入图片resize到448x448。

Run ConvNet:使用CNN提取特征,FC层输出分类和回归结果。

Non-max Suppression:非极大值抑制筛选出最终的结果。

研究结论

背景上预测假阳性的可能性比较低。

创新不足

损失函数设计存在缺陷,会产生更多地定位错误。

对重叠、邻近的物体检测不友好。

测试数据中出现了训练数据中没有的长宽比时,泛化能力低。

额外知识

DPM(Deformable PartsModel)算法基于部件的检测方法,对目标的形变具有很强的鲁棒性。

DPM(Deformable Parts Model)--原理(一)_deformable parts models.-CSDN博客

你可能感兴趣的:(论文阅读,目标检测,人工智能)