目标检测最新综述

一.目标检测的定义
目标检测是计算机视觉领域基础研究,对于计算机视觉中其它的任务通常会依赖于目标检测任务的结果进行后续的处理,比如目标跟踪等。
目标检测是在图片中对数目是可变的目标进行分类和定位。对于目标检测而言,可能存在一些问题:
(1)可能存在多个不同类的目标和目标的数量不定的问题
(2)目标尺度问题(目标大小不一,大物体,小物体)
(3)外在环境干扰(光照的变化,遮挡,图片的质量问题)

目标检测最后输出物体的坐标位置和类别(图片出现的矩形框上的零点几就是代表判断这个物体是某一个类别的置信度,当前判断的类别是真正的类别的概率值,通常在训练之前,会给出一个阈值(默认是0.5),通过这个阈值过滤掉一些错误的矩形框。并且也对矩形框中的物体进行分类)。特征提取,传统的是手工提取,深度学习则是通过卷积神经网络来提取特征。目标检测定位目标的信息(矩形,四维的数据),目标检测通常会采取上采样,反卷积得到同原始图像相同大小的输出结果
**二、**传统目标检测方法
1、 传统的目标检测方法主要有VJ算法,HOG,DMP(包围框回归)等,这些方法主要是在传统的手动设计特征基础上结合了滑动窗口来进行目标检测和定位。传统的目标检测方法存在的缺点,可以主要概括为以下几点:
(1)通过传统的方式手工设计特征的时候,特征可能比较难设计
(2) 设计的特征可能会存在一些问题(对于某种条件不适应)
(3)设计的特征会不鲁棒
(4)手工设计特征,效率不高
2、传统的目标检测算法基本流程:
(1)给定图片作为输入
(2)提取候选框(传统目标检测,手工提取),对于候选框进行特征提取,并且利用分类器进行判定是目标还是背景
(3)利用NMS进行候选框的合并
(4)输出结果
三、度学习目标检测方法
1、发展历程:
2012年,随着卷积神经网络的兴起,利用卷积神经网络代替传统手工设计特征的方式,完成目标检测也出现。
2013年,overfeat
2014年,RCNN
2015年,SPPNet,Fast RCNN,Faster RCNN
2015年,YOLO
2016年,SSD
2017年,Rerina_Net
2018年,YOLO v3、RefineNet、
2019年,M2Det
2、深度学习目标检测方法主要分为两类:
(1)基于object propasal的目标检测(two_stage)的目标检测(RCNN系列)
算法基本流程:
1)给定图片作为输入
2)提取候选框(深度学习,卷积神经网络),对于候选框进行特征提取,并且利用分类器进行判定是目标还是背景
3)利用NMS进行候选框的合并
4)得到目标的输出结果
(2)直接回归目标位置的目标检测方法,one-stage的目标检测(YOLO,SSD系列)
算法基本流程:
1)给定图片作为输入
2)特征提取+目标框直接回归的方法(深度学习)进行目标区域的提取
3)利用NMS对目标框进行合并
4)得到目标的输出结果
四、传统目标检测方法与深度学习目标检测方法比较
1、传统目标检测方法:
手动设计特征; 滑动窗口
传统分类器; 多步骤
准确度和实时性差
2、深度学习目标检测方法:
深度网络学习特征; Prooasal或者直接回归
深度网络; 端到端
准确度高

你可能感兴趣的:(目标检测)