基于卷积神经网络的目标检测研究综述——笔记

传统目标检测方法主要分为预处理、窗口滑动、特征提取、特征选择、特征分类和后处理六个步骤。

a) 预处理对待检测图像进行图像去噪、图像增强、色彩空间转换等操作;

b) 在待检测图像中滑动一个固定大小的窗口,将窗口中的子图像作为候选区;

c) 利用特定的算法对候选区进行特征提取;

d) 从特征向量中挑选具有代表性的特征,降低特征的维数;

e) 利用特定的分类器对特征进行分类,判定候选区是否包含了目标及其类别;

f) 合并判定为同一类别的相交候选区,计算出每个目标的边界框,完成目标检测。

利用卷积神经网络进行目标检测,准确度可以获得较大的提升。不仅因为卷积神经网络提取了高层特征,提高了特征的表达能力,还因为卷积神经网络将特征提取、特征选择和特征分类融合在同一模型中,通过端到端的训练,从整体上进行功能优化,增强了特征的可分性。所以,基于卷积神经网络的目标检测得到了广泛的关注,成为当前计算机视觉领域的研究热点之一。

卷积层单个特征图的计算方式可以分为三个步骤:

a) 不同的卷积核与前一层的特征图进行卷积;  

b)累加相关联的卷积结果以及偏移量;

c) 累加结果通过非线性激活函数获得一张卷积层的特征图。

输入层的作用在于接收输入图像,输入层的大小与输入图像的大小一致。卷积层的作用是运用卷积操作提取特征,卷积层越多,特征的表达能力越强池化层通常设置在卷积层之后,通过对特征图的局部区域进行池化操作,使特征具有一定的空间不变性。常用的池化操作有均值池化和最大值池化。池化层具有类似于特征选择的功能,根据一定规则从卷积层特征图的局部区域计算出重要的特征值。通常情况下,池化层会无重叠地选择局部区域,因此,池化操作降低了特征维度,同时保证了特征具有抗形变的能力。全连接层位于特征提取之后,将前一层的所有神经元与当前层的每个神经元相连接。全连接层会根据输出层的具体任务,有针对性地对高层特征进行映射。

你可能感兴趣的:(目标检测,cnn,深度学习)