多路径识别算法

随着各省市高速公路的不断建设,基本上建成了大小规模不等的联网收费系统,在联网收费系统建设中,都面临了一个共同的问题——车辆行驶路径的识别。路径识别不仅仅涉及对每一通行车辆如何计算通行费,同时还要考虑将收入的通行费拆分给哪个收费单位的问题,通行费的拆分直接关系到各条高速公路的合法利益,是联网收费的关键。所以说解决多路径识别问题在完善高速公路联网收费系统中起着至关重要的作用。

本文介绍了多路径识别的多种算法,并着重分析了识别算法中的汽车牌照识别,根据车牌图像特点,对车牌识别算法关键环节包括数字图像预处理,车牌定位,车牌字符识别等三部分一一进行了分析研究。

本文采用直方图变换、边缘检测、二值化等方法对车牌图像进行了预处理。对车牌定位采用了一种基于灰度图像求取卷积能量极值区域的车牌定位方法。采用模板匹配法对车牌字符进行识别。并采用了MATLAB来完成算法的设计与实现。研究结果表明车牌识别率较高,适应性较强,实时性比较好。

随着高速公路路网规模的不断扩大,联网收费区域内的环状路结构变得更加复杂,仅河北省一片区(京津以南高速公路)联网收费区域内的已有路、在建路和未建路共有约20个最小封闭环路,如果在每个不同业主的路段设收费站,投资巨大,也会影响高速公路的效率,同时,传统的收费车道所采用的人工输入车牌号码后3位数字的方式时效性差,巨大的工作量直接影响高速公路的通行能力和服务水平。因此,高速公路上两点之间车辆行驶的多路径识别问题成为联网收费及网络费用清分模式中迫切需要解决的问题。

多路径识别主要解决高速公路通行费的合理收取以及通行费的准确拆分问题。同时由于高速公路中大型车辆倒卡、逃费现象十分猖獗,通常表现为利用目前机电系统存在的功能不完善漏洞,实现相同货车套牌倒卡具体表现为满载长途与空载短途同号牌车辆倒卡,即通过减少里程,逃避超载处罚力度。为高速公路正常收取车辆通行费造成的及大的损失,同时也带来了不良的社会影响。所以多路径识别在实现识别车辆的实际行驶路径从而进行收费拆分,同时也要解决倒卡、逃费问题。综上所述,多路径识别就需要解决以下三个问题:

(1)高速公路通行费的合理收取。

(2)通行费的准确拆分。

(3)倒卡、逃费问题。

3.1 多路径识别方法的分类

目前,在高速公路路径识别的主要技术方法有:标识站法、车牌照识别法、最短路径法。从基本思路看,多路径识别技术可以分为精确识别和概率识别两类。

3.1.1精确识别

精确识别的原理是识别出路网中每一车辆的实际行驶路径,避免路网中出现行驶路径的歧义,从而解决路网中多路径问题。标识站法、车牌照识别法都属于精确识别的范畴。

要做到对车辆行驶路径的精确识别通常由两种方法:通过土建设施的手段,确保任意车辆从一个收费站(点)到另一收费站(点)间只能有唯一的行驶路径;通过标识方法采集车辆行驶路径信息,确认车辆行驶路径。第二种方法只需在产生歧义的路段设立标识站,获取车辆行驶的标识信息,就可以根据出口信息、入口信息、标识信息,识别出任意车辆的行驶路径。

1.标识站识别法

准确识别车辆的实际行驶路径,可分为停车式和不停车两种,以下提到的标识站均为“停车式标识站”。在收费车道上安装非接触式IC卡读写设备,司机通过此路段时,将IC卡(通行卡)在读写天线的规定距离内划过,自动栏杆开启、车辆通行,并记录该标识站信息。

标识站的主要缺点是车辆每次经过标识站时必须停车,导致行车速度减慢,降低了高速公路的服务水平,与联网收费的精神直接相违背,在实施时,轻易不采用。在国家政策方面,交通部交公路发 [1999]9号文件《关于认真做好公路收费站点清理整顿的通知》中规定“对通行车辆一次完成通行费收缴和票证发放工作,不准设立旨在进行内部监督验票的检查站”。显然,国家法律法规的规定对设置停车式标识站做出了限制,设置停车式标识站已不可行。

2.车牌照识别技术

随着图像识别技术的发展,也可应用“车牌照识别”技术进行多路径的识别。即高速公路入、出口以及路网内关键点设置车牌照抓拍系统,摄取通过车辆牌照。

车牌照识别方法虽然不影响行车速度,但是应用车牌照抓拍系统进行多路径的判别,投资较大且系统精度根据图像识别算法的不同效果也不同一般不能达到100%。

3.1.2概率识别

一般来说,道路使用者路径选择行为是基于道路使用效益最大化和运营成本最小化的原则之上的,即:花最少的时间、最少的费用、走最短的路、获取最大的效益。因此,运行时间最少的路径对于时间价值导向型的道路使用者来说具有更强的吸引力,用户一般采用最短路径法。

最短路径法取最短路径为行驶路径。从起点到终点存在两条或两条以上的路径,将最短路径作为车辆选择路径,此方法最为简便,投资最少。最短路径法直接将多路径车辆通行费分配给最短路径业主,因此,这种方法的精确度取决于车辆在实际的路径选择过程中选择最短路径的概率。但是在高速公路中倒卡、逃费问题严重,因此这种算法的拆分关系到将通行费拆分给哪个收费单位的问题,影响了一部分单位的收益。

所以在本次设计中主要研究了精确识别中的车牌照识别技术,分析研究图像处理得算法,用以提高车牌照识别的准确度。

3.2多路径识别算法的理论基础

在本文涉及到的多路径识别算法—车牌照识别技术中,对于一个完整的车辆牌照识别系统而言应该包括图像采集、图像预处理、车牌定位、字符切分、字符识别以及图像编码、数码传输与更新等步骤,基本可以分为硬件部分和软件部分,硬件部分主要完成车辆图像的摄取采集,软件部分主要完成对采集到的车辆图像进行车辆牌照定位、车牌字符切分与车牌字符识别等工作,这部分工作最为复杂,最后对识别结果进行数据传送和存储,将处理后的识别信息交给管理系统进行管理。整个系统的核心是软件部分的工作,能否通过牌照对车辆进行有效管理,很大程度上取决于软件部分识别车牌的准确性。

3.2.1 车牌照识别的主要算法

车牌识别的常用算法法有很多种,如结构模式识别方法、统计模式识别、人工神经网络识别等等。下面分别介绍各种方法:

1.结构模式识别

结构模式识别可能比较复杂,但都具有相当严格的规律性。换句话说,字符图像含有丰富的结构信息。可以设法提取含有这种信息的结构特征及其组字规律作为识别的依据,这就是结构模式识别。

结构模式识别是早期汉字识别研究的主要方法。其主要出发点是汉字的组成结构.从汉字的构成上讲,汉字是由笔划以及偏旁部首构成的;还可以认为汉字是由更小的结构基元构成的。由这些结构基元及其相互关系完全可以精确地对汉字加以描述,这种方法也叫句法模式识别。识别时,利用上述结构信息以及句法分析地方法进行识别,类似于一个逻辑推理器。

基于这种方法来描述字符的结构在理论上是比较恰当的,其主要优点在于对字体变化的适应性强,区分相似字的能力强;但是,在实际应用中,其所面临的问题是抗干扰能力差,因为在实际得到的文本图像中存在各种干扰,比如倾斜、断裂、粘连、污点等。这些因素直接影响到结构基元的提取。假如基元不能准确得到,后面的识别就成了无源之水。所以,在字符识别领域,纯结构模式识别方法己经逐渐衰落。

2.统计模式识别

统计决策论发展较早,理论也比较成熟.其要点是提取待识别模式的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决。字符的统计模式识别是将字符点阵看作一个整体,其所用的特征是从这个整体上经过大量的统计而得到的.统计特征的特点是抗干扰能力强,匹配与分类的算法简单,易于实现.不足之处在于细分能力较弱,区分相似字的能力差一些。常见的统计模式识别方法有:

(1)投影直方图法。利用字符图像在水平及垂直方向的投影作为特征。这种方法是模式识别早期使用的方法。

(2)利用变换特征方法。对图像进行变换,变换后对图像从空间域变到频域,特征的维数大大降低。但是这些方法总的特征就是运算量太大,运算复杂度高,难以满足实时处理的要求。

(3)傅立叶描述子和Spline曲线近似。这两种方法都是针对字符图像轮廓的。傅立叶描述子是利用傅立叶函数模拟封闭的轮廓线,将傅立叶和函数的各个系数作为特征,该方法致命缺点是对于轮廓线不封闭的字符图像不适用。车牌字符本身所占象素点较少,常常会出现笔划断裂轮廓不封闭。Spline曲线是在轮廓上找到曲率大的折点,利用Spline曲线来近似相邻折点之间的轮廓线,该方法的缺点在于对旋转现象比较敏感。

(4)特征点方法。它的主要思想是利用字符点阵中一些有代表性的点作为特征来区分不同的字符。这些点包括端点、折点以及交叉点等等,获得了比较好的效果。其特点是对于内部笔划粘连的字符识别的适应性较强,直观性好,但是不易表示为矢量形式,不适合作为粗分类的特征,匹配难度大。

(5)基于微结构特征的方法。字符是由笔划组成的,笔划是由一定方向,一定位置关系和长宽比的矩形线段组成的。这些矩形则称为微结构。利用微结构及微结构之间的关系组成的特征对字符进行识别。其不足之处正好和特征点的方法相反,在内部笔划粘连时,微结构的提取会遇到困难。

统计模式识别认为图像可能包含一个或多个物体,并且每个物体属于若干事先定义的类型、范畴或模式之一。虽然模式识别可以用多种方法实现,但我们只关心用数字图像处理技术对它的实现。字符统计模式是把字符的点阵看成一个整体,通过做大量的统计得到所需要的特征。最常用的字符统计模式方法是模板匹配的字符识别方法。模板匹配的字符识别方法是通过一定准则确定决策函数,并进行分类判断的方法。模板匹配的字符识别方法是指度量输入模式与样本之间的某种相似性,取最相似者为输入模式所属类别。它根据字符的直观形象抽取特征,用相关匹配原理进行识别。这个方法不需要特征提取这个过程,字符图像直接作为特征与模板进行比较,相似度最高的模板即定为识别结果。它优点是可以并行处理,简单易行。缺点是如果进行简单的模板匹配,只能够识别同种字体、同样大小的字符,对于笔划变粗、变细、倾斜的字符适应能力比较差,特别是模板与字符笔划的匹配失误时,会有很大的误差。

3人工神经网络识别

人工神经网络是模拟人脑思维方式的数学模型。神经网络是现代生物学研究人脑的组织成果基础上提出的,用来模拟人类大脑神经网络的结构和行为,它从微观结构和功能上对人脑进行抽象和简化。

人工神经网络方法的优点和缺点主要表现在如下的几个方面:

神经网络的优点:

1,能逼近任意线性函数

2,信息的并行分布式处理和存储

3,可以多输入多输出

4,便于用超大规模的集成电路或光学集成电路系统实现

5,具有自学习的能力;

6,具有联想存储功能;

7,具有高速寻找优化解的能力.

虽然人工神经网络有上述的优点,并且在OCR中也取得了一些成果,但是在车牌字符的识别中仍然存在很大的缺陷:

l,车牌字符象素点阵小,笔划常常出现断裂,通过学习规则,误差系数相差很小,容易出现误识;

2,神经网络在进行学习时,每次迭代的梯度值都受样本中噪声干扰,影响较大,整个系统收敛速度较慢,不适合实时识别的要求。用于字符识别最常用的神经网络是BP神经网络,所谓BP神经网络是指误差反向传播神经网络,核心方法是梯度下降法,它采用梯度搜索技术,以期使网络的实际输值与期望的均方差为最小。

 

4.1图像采集

图像采集部分所采集的图像一般是采用CCD摄像机摄取的车牌前视图或后视图,这些通过由光照检测装置控制现场的光照,位置检测装置控制摄像机的拍摄角度而得到的。

本设计中所用到图片是用数码相机拍的,模型如下图:

多路径识别算法_第1张图片 

图4.1 照片模型

4.2图像预处理

图像预处理部分需要对采集到的图像进行图像加强、平滑滤波等操作,目的是突出车牌的主要特征,以便更好地提取车牌。

图像预处理一般包括以下步骤:对图像的灰度进行处理、图像平滑、图像增强、图像二值化、图像锐化、边缘检测。

 

多路径识别算法_第2张图片

多路径识别算法_第3张图片

 

图4.2 二值化的图像

 

 

                             图4.3图像边缘提取的图像

采集的车辆图像为彩色图像,应将彩色图像转化为灰度图像。由于光线不足或者反光等诸多因素,又可能造成车牌对比度较差,对接下来的纹理分析产生影响,所以有必要进行图像增强。本文对图像中特亮和特暗的地方进行灰度拉伸,有效增强图像对比度,提高车牌定位准确率。为了进一步提高定位准确率,我们通过连续的两帧图像定出车大概位置,再在车的位置上搜索车牌,这样不仅提高了准确率,还提高了整个程序的运行效率。同时为了减少图像中的孤立干扰点,保留车牌字符边缘,让车牌字符的图像灰度水平投影更有的连续性。选用 MXl的模板对灰度拉伸后的图像进行中值滤波。

 

完成牌照区域的定位后,再将牌照区域分割成单个字符,然后进行识别。由于字符在垂直方向上的投影必然在字符间或字符内的间隙处取得局部最小值的附近,并且这个位置应满足牌照的字符书写格式、字符、尺寸限制和一些其他条件。利用投影法对复杂环境下的汽车图像中的字符分割有较好的效果。分割步骤:

                                                                

 

 

图4.9 分割后的车牌

 

当一幅车牌的原始图像经过车牌定位和字符分割处理后,得到这个车牌的字符图像,首先对字符图像做归一化处理,即把字符图像归一化成20 ×32的标准大小的图像,然后对这幅归一化的图像调用设计好的模板匹配程序进行识别,字符识别流程如下:

1、识别车牌的第1个字符(若分割正确的话应该是汉字):

(1)调用汉字模板库进行匹配识别,若识别结果为汉字,则最终结果为一汉字,识别结束;若识别结果为空字符,即表示不是汉字,则进行第二步。

(2)调用字母模板库进行识别,若为字母,则最终结果为一个字母,识别结束;若识别结果为空字符,则表示不是字母,进行第三步。

(3)调用数字模板库进行识别,若为数字,则最终结果为一数字,识别结束;若为空字符,则最终结果为空字符,识别结束。

2、识别车牌的第2个字符(若分割正确的话应该是字母):

(1)调用字母模板库进行识别,若为字母,则最终结果为一个字母,识别结束;若识别结果为空字符,则表示不是字母,进行第二步。

(2)调用数字模板进行识别,若为数字,则最终结果为一数字,识别结束;若为空字符,则表示不是数字,进行第三步。

(3)调用汉字模板进行识别,若识别结果为汉字,则最终结果为一汉字,识别结束;若识别结果为空字符,则最终识别结果为空字符,识别结束。

3、识别车牌的第3、4个字符(若分割正确的话应该是字母或数字):

(1)调用字母模板库进行识别,若为字母,则最终结果为一个字母,识别结束;若识别结果为空字符,则表示不是字母,进行第二步。

(2)调用数字模板进行识别,若为数字,则最终结果为一数字,识别结束;若为空字符,则表示不是数字,进行第三步。

(3)调用汉字模板进行识别,若识别结果为汉字,则最终结果为一汉字,识别结束;若识别结果为空字符,则最终识别结果为空字符,识别结束。

4、识别车牌的第5、6、7个字符(若分割结果正确的话应该是数字):调用数字模板进行识别,若为数字,则最终结果为一个数字,识别结束;若为空字符,则最终识别结果为空字符,识别结束。

对于车牌图像的第1、2和3个字符,进行完全的识别,主要是因为考虑到字符的分割不一定正确,即不能保证分割后的第1个车牌字符为汉字,第2个车牌字符为字母,而第3、4个车牌字符为字母或数字。对这三个字符做这样的完全识别后,可以得到一些非常有用的信息,这些信息可以返回到字符分割模块,可以指导字符分割调整字符分割的策略。例如,若识别出的车牌图像的第2个字符是汉字,则说明字符模块做字符分割的时候在车牌图像的左边提取了一个多余的字符,因此字符分割模块要去掉这个多余的字符,从汉字字符起,依次提取出7个字符来。

多路径识别算法_第4张图片

你可能感兴趣的:(MATLAB,板块2:图像-特征提取处理,车牌识别,hslogic)