目标检测(1)—目标检测的基础知识

一.目标检测的定义

目标检测是计算机视觉领域基础研究,对于计算机视觉中其它的任务通常会依赖于目标检测任务的结果进行后续的处理,比如目标跟踪等。

目标检测是在图片中对数目是可变的目标进行分类和定位。对于目标检测这个任务而言,可能存在一些问题使得目标检测问题难度加大。比如(1)可能存在多个不同类的目标和目标的数量不定的问题。(2)目标尺度问题(目标大小不一,大物体,小物体)(3)外在环境干扰(光照的变化,遮挡,图片的质量问题)。这些问题的存在使得目标检测问题值得研究和探讨。

二.目标检测vs图像分类 

  1. 输出物体的坐标位置和类别(图片出现的矩形框上的零点几就是代表判断这个物体是某一个类别的置信度,当前判断的类别是真正的类别的概率值,通常在训练之前,会给出一个阈值(默认是0.5),通过这个阈值过滤掉一些错误的矩形框。并且也对矩形框中的物体进行分类)
  2. 图片分类是将图片作为输入,属于某一个类别的概率作为输出。将指定的图片判断是属于哪一个类别的。
  3. 特征提取,传统的是手工提取,深度学习则是通过卷积神经网络来提取特征。

三.目标检测vs目标分割

  1. 目标分割要找到当前的目标所占的区域
  2. 目标分割分为语义分割和实例分割

        语义分割:只要找到同一类物体所占的区域(精确的位置,精确到像素级别),不同语义上的区分

        实例分割:对于同一类别的实例也要划分出不同的区域。(精确到像素级别)

  1. 目标检测与目标分割的区别
  1. 目标检测定位目标的信息(矩形,四维的数据),目标检测通常会采取上采样,反卷积得到同原始图像相同大小的输出结果

四.目标检测的方法

  1. 传统目标检测方法

     传统的目标检测方法主要有VJ算法,HOG,DMP(包围框回归)等,这些方法主要是在传统的手动设计特征基础上结合了滑动窗口来进行目标检测和定位。传统的目标检测方法存在的缺点,可以主要概括为以下几点:(1)通过传统的方式手工设计特征的时候,特征可能会比较难设计,而且设计的特征可能会存在一些问题(对于某种条件不适应),设计的特征会不鲁棒。手工设计特征,效率不高。

  1. 通过滑动窗口的方式提取目标框,并对目标框进行分类判定,这个过程比较繁琐也比较耗时。2008年的时候传统的目标检测遇到了瓶颈,很难有提升。

传统的目标检测算法基本流程:

  1. 给定图片作为输入
  2. 提取候选框(传统目标检测,手工提取),对于候选框进行特征提取,并且利用分类器进行判定是目标还是背景
  3. 利用NMS进行候选框的合并
  4. 输出结果

(2)深度学习目标检测方法

2012年,随着卷积神经网络的兴起,利用卷积神经网络代替传统手工设计特征的方式,完成目标检测也出现。

2013年,overfeat

2014年,RCNN

2015年,SPPNet,Fast RCNN,Faster RCNN——基于候选框提名

2015年,YOLO

2016年,SDD(难样本挖掘,聚焦)

2017年,Rerina_Net,

深度学习目标检测方法主要分为两类:

(1.)基于object propasal的目标检测(two_stage)的目标检测。(Faster RCNN系列

算法基本流程:

  1. 给定图片作为输入
  2. 提取候选框(深度学习,卷积神经网络),对于候选框进行特征提取,并且利用分类器进行判定是目标还是背景
  3. 利用NMS进行候选框的合并
  4. 得到目标的输出结果

(2)直接回归目标位置的目标检测方法,one-stage的目标检测(YOLO,SSD系列)

算法基本流程:

  1. 给定图片作为输入
  2. 特征提取+目标框直接回归的方法(深度学习)进行目标区域的提取
  3. 利用NMS对目标框进行合并
  4. 得到目标的输出结果

传统目标检测方法VS深度学习目标检测方法

传统目标检测方法:

  1. 手动设计特征
  2. 滑动窗口
  3. 传统分类器
  4. 多步骤
  5. 准确度和实时性差

深度学习目标检测方法

  1. 深度网络学习特征
  2. Prooasal或者直接回归
  3. 深度网络
  4. 端到端
  5. 准确度高

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(s)