06《基于卷积神经网络LeNet-5的车牌字符识别研究》学习总结

  • 一、本篇介绍
  • 二、本文主要内容(知识点)
    • 1、概要
    • 2、卷积神经网络介绍
      • 1.卷积层
      • 2.次抽样层
    • 3、LeNet-5介绍
    • 4、对LeNet-5的改进
    • 5、实验的数据集
    • 6、实验结果分析
  • 三、具体创新
  • 四、心得感想
  • 五、专业词汇的学习

一、本篇介绍

篇名:基于卷积神经网络LeNet-5的车牌字符识别研究
作者:赵志宏,杨绍普,马增强
作者单位:北京交通大学 机械与电子控制工程学院
发表在:系统仿真学报,2010年3日#二、本文主要内容(知识点)

二、本文主要内容(知识点)

1、概要

车牌识别系统主要包括三个部分:车牌定位、字符分割与字符识别。本篇论文主要研究字符识别。
字符识别方法大致可以分为两类:基于结构的方法和基于统计的方法。
基于结构的方法的优点是符合人的直觉,可以容易地处理局部变换,其主要缺点是抗噪声能力差。
基于统计的方法比较成熟,具有抗干扰、噪声的能力,识别性能好,识别速度快的优点,它的难点是特征提取,因此,在统计字符识别中,特征提取的质量是影响系统性能的关键因素。
卷积神经网络较一般神经网络在图像处理方面具有如下优点:(1)输入图像和网络的拓扑结构能很好的吻合;(2)特征提取和模式分类同时进行;(3)权值共享可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强。

2、卷积神经网络介绍

卷积神经网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了广泛的应用。
卷积神经网络通过结合三个方法来实现识别位移、缩放和扭曲不变性:局域感受野、权值共享和次抽样。

1.卷积层

在卷积层,前一层的特征图与一个可学习的核进行卷积,卷积的结果经过激活函数后的输出形成这一层的特征图。每一个输出的特征图可能与前一层的几个特征图的卷积建立关系。一般地,卷积层的形式如式(1)所示:
这里写图片描述
其中,l代表层数,k是卷积核,Mj代表输入特征图的一个选择。每个输出图有一个偏置b。

2.次抽样层

一个次抽样层对输入进行抽样操作。如果输入的特征图为n个,则经过次抽样层后特征图的个数仍然为n,但是输出的特征图要变小(例如,变为原来的一半)。次抽样层的一般形式如式(2)所示:
这里写图片描述
其中,down(·)表示次抽样函数。次抽样函数一般是对该层输入图像的一个n×n大小的区域求和,因此,输出图像的大小是输入图像大小的1/n。每一个输出的特征图有自己的β和b。

3、LeNet-5介绍

输入图像要经过大小归一化,每一个神经元的输入来自于前一层的一个局部邻域,并被加上由一组权值决定的权重。提取的这些特征在下一层结合形成更高一级的特征。同一特征图的神经元共享相同的一组权值,次抽样层对上一层进行平均。
LeNet-5包括输入,由8层组成,每一层都包括可训练的参数(权值) ,其中C层是由卷积层神经元组成的网络层,S层是由次抽样层神经元组成的网络层。
第一层是输入层,是32×32的图像。
第二层,网络层C1是由6个特征图组成的卷积层。每个神经元与输入图像的一个5×5的邻域相连接,因此每个特征图的大小是28×28。
第三层,网络层S2是由6个大小为14×14的特征图组成的次抽样层,它是由C1层抽样得到。特征图的每个神经元与C1层的一个大小为2×2的邻域连接。
第四层,网络层C3是由16个大小为10×10的特征图组成的卷积层。特征图的每个神经元与S2网络层的若干个特征图的5×5的邻域连接。
第五层,网络层S4是由16个大小为5×5的特征图组成的次抽样层。特征图的每个神经元与C3层的一个2×2大小的邻域相连接。
第六层,网络层C5是由120个特征图组成的卷积层。每个神经元与S4网络层的所有特征图的5×5大小的邻域相连接。
第七层,网络层F6,包括84个神经元,与网络层C5进行全连接。
第八层,输出层有10个神经元,是由径向基函数单元(RBF)组成,输出层的每个神经元对应一个字符类别。
RBF单元的输出yi的计算方法如式(3)所示:
这里写图片描述

4、对LeNet-5的改进

改变C5层特征图的个数。
C5层特征图个数对车牌字符识别率有直接影响,随着C5层特征图个数的增加,车牌字符的识别率也有所提高。这说明,在类别数增加的情况下,增加C5层特征图的个数,可以提高LeNet-5卷积神经网络的分类能力。但当提高到一定程度后,再增加C5层特征图的数目,识别率将不再提高。

5、实验的数据集

车牌图像经过定位,字符分割后,存入车牌字符数据库,没有对车牌图像进行去噪处理。为了应用卷积神经网络LeNet-5,所有的车牌字符都归一化为32×32大小。
所用的车牌图像均由数码相机在实际环境中获取的分辨率为640×480的真实车牌图像,收集到实际车牌图像数据共650个,利用其中的字符分别建立训练数据集与测试数据集,训练数据集与测试数据集之间没有重叠。

6、实验结果分析

随着训练次数的增加,训练样本与测试样本的正确率都随着增加。并且当训练样本集的正确率达到100%后,继续训练,测试样本集的正确率仍然得到提高,基本不出现过训练的情况。这体现了卷积神经网络良好的性能。
识别错误的38个车牌字符或者是由于预处理效果不好(字符分割的效果不理想),或者是由于噪声的影响(在字符的关键地方有很强的噪声),还有部分是由于倾斜的影响(倾斜角度很大)。识别错误的字符,可以通过有效的预处理过程来进一步减少。另外,可以通过扩大训练字符集来进一步提高车牌字符识别的正确率。

三、具体创新

用CNN中的LeNet-5解决车牌字符识别问题,相比于传统的机器学习,使用CNN可以大幅度提高准确率和减低数据预处理的难度,传统的卷积神经网络LeNet-5的结构进行了改进,改进后的LeNet-5比传统的LeNet-5识别率有所提高。

四、心得感想

对CNN的学习,本文虽然和车型识别没关系,而且年份太早,但是本文的被引次数却非常的高,证明这是一篇质量非常高的论文。
本文从一个车牌字符识别的领域入手,通过对一个现有的LeNet-5网络的改进,提高了识别率。

五、专业词汇的学习

license plate character recognition 车牌字符识别

另:一些说明
1、本博客仅用于学习交流,欢迎大家瞧瞧看看,为了方便大家学习,相关论文请去知网等地方自行下载。
2、如果原作者认为侵权,请及时联系我,我的qq是244509154,邮箱是[email protected],我会及时删除侵权文章。
3、我的文章大家如果觉得对您有帮助或者您喜欢,请您在转载的时候请注明来源,不管是我的还是其他原作者,我希望这些有用的文章的作者能被大家记住。
4、最后希望大家多多的交流,提高自己,从而对社会和自己创造更大的价值。

你可能感兴趣的:(卷积神经网络)