05《基于深度卷积神经网络的车型识别研究》学习总结

  • 一、本篇介绍
  • 二、本文主要内容(知识点)
    • 1、历史和发展
    • 2、使用卷积神经网络的优势
      • 1. 不对原始图像进行处理,简化特征模型,提高运算效率
      • 2.对图片质量要求较低,鲁棒性比较好
    • 3、具体的模型
    • 4、训练的阶段
    • 5、实验的数据集
    • 6、实验结果分析
  • 三、具体创新
  • 四、心得感想
  • 五、专业词汇的学习

一、本篇介绍

篇名:基于深度卷积神经网络的车型识别研究
作者:邓柳,汪子杰
作者单位:西南交通大学 信息科学与技术学院
发表在:计算机应用研究,2016年3日

二、本文主要内容(知识点)

1、历史和发展

传统的依赖人工判读的方法已无法满足如今海量交通视频处理的需要,构建智能识别系统以自动处理各种交通视频信息成为必然趋势。
卷积神经网络可将原始数据(如图像像素值)直接作为输入,避免了传统识别算法中额外的数据预处理过程。

2、使用卷积神经网络的优势

1. 不对原始图像进行处理,简化特征模型,提高运算效率

传统方法依赖人工设计特征,如SIFT、PCA+SIFT、HOG等,这些特征针对通用问题,运算量大且在实际应用中往往还需对输入图像进行一系列的预处理工作。而卷积神经网络直接以原始图像为输入,在训练数据的驱动下通过自主学习获取特征描述,简化特征模型的同时提高运算效率。

2.对图片质量要求较低,鲁棒性比较好

车辆外观表现形式复杂。摄像机距离、高度和角度以及环境光照等因素往往会引起视频图像中车辆参数缩放、旋转、模糊等外观变化,加大识别的难度。而卷积神经网络对平移、缩放等仿射形变具有良好的抵抗能力,有效克服了车辆外观多变带来的困难。

3、具体的模型

CNN特征学习模型训练过程包括逐层构建CNN和训练CNN两个部分。
05《基于深度卷积神经网络的车型识别研究》学习总结_第1张图片
本文采用的是五层网络,网络的构建过程如上图所示。
第一层为网络的输入I,CNN能够对二维图像的特征进行自主学习,故在此将原始图像灰度化后直接作为网络的输入。
第二层C1为网络的卷积层,卷积层通过6个5×5大小的滤波器和可加偏置bi进行卷积,得到6个21×21大小的特征图。
第三层S2为网络的下采样层,所有的下采样层都是依次通过如下处理得到:每邻域四个像素求和,权值Wi+1(卷积核元素)加权,加上偏置bi+1,最后通过一个影响函数核小的sigmoid激活函数,将特征图缩小为6个58×46大小的特征图。
第四层C3为网络的卷积层,卷积层通过12个5×5大小的滤波器和可加偏置bi进行卷积,得到12个54×42大小的特征图。
第五层S为网络的下采样层,所有的下采样层都是依次通过如下处理得到:每邻域四个像素求和,权值Wi+1(卷积核元素)加权,加上偏置bi+1,最后通过一个影响函数核小的sigmoid激活函数,将特征图缩小为12个27×21大小的特征图。
最后将12张特征图排列为一条列向量,得到最终的特征向量。

4、训练的阶段

1.正向传播阶段。将训练样本输入CNN网络,得到实际输出;
2.反向传播阶段。计算实际输出与理想输出间的误差,通过反向传播算法逐层传播误差,并更新各层权值。

5、实验的数据集

共采集不同尺度、光照和角度的车辆图片3000张,根据高速公路上三种车型出现的比例分别选取小车1400张,货车950张,公客车650张。由于每张图片的大小不一,为了满足深度卷积神经网络的输入要求,在实验中三种车型均归一化为同一尺度(高宽比120×96)。每种车型随机选取450张图片作为训练样本,其余的作为测试样本。

6、实验结果分析

分析CNN的最优训练次数,根据网络训练次数分别定义三种网络为CNN1、CNN5、CNN10。从准确率来看,CNN5得到的特征分类效果比CNN1得到的特征分类效果提高了1%;而CNN10在CNN5基础上只提高了0.1%,没有明显的提升,但训练时间前者约是后者的两倍,所以从准确率和网络训练时间综合考虑,CNN5比较合适。从时间消耗来看,特征提取时间三种网络差别较小,CNN5网络得到的特征分类器训练时间和识别时间均是最短的。综合以上各因素,针对本文的数据集,选定CNN5用于特征提取。表3还给出了车型识别中常用的HOG特征以及PCA+SIFT特征的识别效果进行比较。在特征识别率方面,本文构建的CNN5比HOG高了6.5%,比PCA+SIFT高9%;从特征提取速度来看,CNN5比HOG快了2倍,比PCA+SIFT快了95倍;在分类器训练方面,PCA+SIFT最快,比CNN5快了240倍,比HOG快了350倍;分类识别时间PCA+SIFT最快,比CNN5快了9倍,比HOG快了10倍。综合识别率和时间消耗两个方面,CNN5的效果是最好的。

三、具体创新

用CNN解决车型识别问题,一个三分类的解决方案,相比于传统的机器学习,使用CNN可以大幅度提高准确率和减低数据预处理的难度。

四、心得感想

图像识别是一个大的方向,其中车型的识别是一个热门问题,用CNN来解决车型识别是目前的一个学术创新,也是一个热点研究方向,但是,我认为CNN来做车型识别已经到了一个瓶颈,可以在使用CNN的基础上,对CNN的某些步骤进行改进,从而进一步提高识别效率。但是,在这之前,必须先了解CNN。

五、专业词汇的学习

vehicle recognition 车辆识别

另:一些说明
1、本博客仅用于学习交流,欢迎大家瞧瞧看看,为了方便大家学习,相关论文请去知网等地方自行下载。
2、如果原作者认为侵权,请及时联系我,我的qq是244509154,邮箱是[email protected],我会及时删除侵权文章。
3、我的文章大家如果觉得对您有帮助或者您喜欢,请您在转载的时候请注明来源,不管是我的还是其他原作者,我希望这些有用的文章的作者能被大家记住。
4、最后希望大家多多的交流,提高自己,从而对社会和自己创造更大的价值。

你可能感兴趣的:(卷积神经网络)