目标检测基本概念

一、什么是目标检测

目标检测的任务是找出图像中所有感兴趣的目标,确定它们的位置和类别。由于各类物体有不同的外观、形状、姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是计算机使君领域最具有挑战的问题。
图像识别有四大类任务:
分类(Classification): 解决"what"。
定位(Location):解决”where“。
检测(Detection):解决”what & where“。
分割(Segmentation):分为 实例分割(Instance-level)和 语义分割(semantic segmentation)。解决“每一个像素属于哪个实例或哪一类”。

二、核心问题

除了图像分类以外,目标检测要解决的核心问题是:
1、目标可能出现在图像的任何位置。
2、目标有各种不同的大小。
3、目标有各种不同的形状。
则如果用矩形框来定义目标,则矩形框需要有不同的宽高比。由于目标的宽高比不同,因此采用传统的滑动窗口+图像缩放的方案解决通用目标检测问题的成本太高。

三、目标检测算法分类

基于深度学习的目标检测算法主要分为两类:

  • 1、Two stage目标检测算法
    先进行区域建议框(Region Proposal, RP)的生成,再通过卷积神经网络进行分类。
    步骤:特征提取 → 生成RP → 分类/回归。
    常见的two stage目标检测算法:R-CNN、Spp-Net、Fast R-CNN、Faster R-CNN和R-FCN等。
  • 2、One stage目标检测算法
    直接提取特征来预测物体类别和位置。
    步骤:特征提取 → 分类/回归。
    常见的one stage目标检测算法有:OverFeat、YOLO v1-3、SSD和RetinaNet。

你可能感兴趣的:(目标检测基本概念)