目标检测传统算法与神经网络结合_基于卷积神经网络的目标检测算法简介

1.什么是目标检测?

目标检测的主要任务是从图像中定位感兴趣的目标,需要准确判断每个目标的具体类别,并给出每个目标的边界框。

2.实现目标检测需要哪些步骤?

要实现目标检测,传统的方法主要分为预处理、窗口华东、特征提取、特征选择、特征分类和后处理六个步骤。

a) 预处理,对待检测图像进行图像去噪、图像增强、色彩空间转换等操作

b) 在待检测图像中滑动一个固定大小的窗口,将窗口中的子图像作为候选区

c) 利用特定算法对候选区域进行特征提取

d) 从特征向量中选择具有代表性的特征,降低特征维数

e) 利用特征分类器对特征进行分类,判定候区是否包含了目标及其类别

f) 合并判定为统一类别的相交候选区,计算出每个目标的边界框,完成目标检测。

3.目标检测算法的研究难点在哪?

主要是两个方面。第一,特征提取,即如何提高特征的表达能力和抗形变能力。第二,特征分类,即如何提高分类器的准确度和速度。

3.为什么说使用设计的特征存在缺点?

a) 设计的特征为底层特征,对目标表达能力不足

b) 设计的特征的可分性较差,导致分类错误率较高

c) 设计的特征具有针对性,很难选择单一特征应用于多目标检测,如Haar特征用于人脸检测,HOG特征用于行人检测,Strip特征用于车辆检测

5.什么是卷积神经网络?

卷积神经网络是一个层次模型,主要包括输入层,卷积层,池化层、全连接层以及输出层。

卷积神经网络是专门针对图像而设计,主要特点在于卷积层的特征是由前一层的局部特征通过卷积共享的权重得到。

在卷积神经网络中,输入图像通过多个卷积层和池化层进行特征提取,逐步由底层特征变为高层特征;高层特征再经过全连接层和输出层进行特征分类,产生一维向量,表示当前输入图像的类别。

根据每层的功能,卷积神经网络可划分为两个部分:由输入层、卷积层和池化层构成特征提取器,以及由全连接层和输入层构成分类器。其中:

输入层:作用是接收输入图像,输入层的大小与输入图像的大小一致。

卷积层:作用是运用卷积操作提取特征,卷积层越多,特征表达能力越强。

池化层:通过设置在卷积层之后,通过对特征图的局部区域进行池化操作,使特征具有一定的空间不变性。常用的池化操作有均值池化和最大值池化。池化层具有类似于特征选择的功能,根据一定规则从卷积特征图的局部区域计算出重要的特征值,通常情况下,池化层会无重叠地选择局部区域,因此,池化操作降低了特征维度,同时保证了特征具有抗形变的能力。池化层与卷积层的特征图是一一对应,因此,池化层的特征图个数与卷积层的特征图个数一致。

全连接层:

位于特征提取之后,将前一层的所有神经元与当前层的每个神经元相连接。全连接层会根据输出层的具体任务,有针对性地对高层特征进行映射。

输出层:输出层的形式面向具体任务,如果将卷积神经网络作为分类器使用,输出层采用softmax回归,产生一个图形类别的预测向量y=(y1,…,ym)T,其中,M表示类别的个数。

6.卷积神经网络的常见网络类型有哪些?

常用的卷积神经网络类型包括:LeNet-5,AlexNet,VGG,GooLeNet和ResNet等。

7.基于卷积神经网络实现的目标检测算法怎么分类?

根据卷积神经网络的使用方式,可以将基于卷积神经网络的目标检测分为两大类:基于分类的卷积神经网络目标检测和基于回归的卷积神经网络目标检测。

传统目标检测方法包含预处理、窗口滑动、特征提取、特征选择、特征分类、后处理等步骤,而卷积神经网络本身具有特征提取、特征选择和特征分类的功能。那么,可以直接利用卷积神经网络对每个滑动窗口产生的候选区进行二分类,判断其是否为待检测目标。相比于传统目标检测的六个步骤,基于分类的卷积神经网络目标检测只有:窗口滑动、图像分类、后处理三个步骤,而且窗口滑动和后处理都是固定的方法。因此,该类方法的研究重点在于如何提升卷积神经网络的特征提取能力、特征选择能力以及特征分类能力,以提高图像识别的准确度。

基于分类的卷积神经网络目标检测充分利用了卷积神经网络在图像识别上的能力,然而,候选区提取的准确度很大程度上决定了这类方法的准确度。因此,研究者开始针对目标检测重新设计卷积神经网络的结构,提出了将卷积神经网络作为回归器,把整幅待检测图像看成一个候选区,直接输入卷积神经网络,回归目标在待检测图像中的位置信息。这类方法可以称为基于回归的卷积神经网络目标检测。

8.基于卷积神经网络实现的目标检测目前存在哪些问题?

目前,基于卷积神经网络的目标检测取得了一定进展,但仍存在一些需要解决的问题。一方面,目前都是通过实验来证明卷积神经网络的有效性,训练参数的设置大多依靠经验和实践,缺乏理论指导和量化分析;另一方面,需要针对目标检测设计更加合理的网络结构,提升检测效率,实现多尺度多类别的目标检测。

你可能感兴趣的:(目标检测传统算法与神经网络结合)