模式识别的一些基本概念

    模式识别诞生于20实际20年代,随着40年代计算机的出现,50年代人工智能的兴起,模式识别在60年代初迅速发展成为一门学科。简单点说,模式识别是根据输入的原始数据对齐进行各种分析判断,从而得到其类别属性,特征判断的过程。为了具备这种能力,人类在过去的几千万年里,通过对大量事物的认知和理解,逐步进化出了高度复杂的神经和认知系统。举例来说,我们能够轻易的判别出哪个是钥匙、哪个是锁,哪个是自行车、哪个是摩托车;而这些看似简单的过程,其背后实际上隐藏着非常复杂的处理机制。而弄清楚这些机制的作用机理正是模式识别的基本任务。

    那么,到底什么是模式呢?广义地说,模式是存在于时间和空间中的可观察的事物,如果我们可以区别它们是否相同或者是否相似,那我们从这种事物所获取的信息就可以称之为模式。人们为了掌握客观的事物,往往会按照事物的相似程度组成类别,而模式识别的作用和目的就在于把某一个具体的事物正确的归入某一个类别。

   下面我们举一些例子来说明,到底哪些是模式识别的范畴:

1.将铅笔、钢笔、圆珠笔、毛笔、彩笔都归类为书写用的“笔”;

2.医生根据心电图化验单来判断病人是否得心脏病;

3.警察根据指纹来进行身份验证;

4.利用计算机进行字符识别;

5.根据用户的虹膜进行身份识别;

6.判断当前用户发出的声音是什么字符;

7.判断当前图片中是否有行人、人脸、车辆等;

8.对出现在图片序列中的行人、车辆进行跟踪;

9.对图片中的人脸进行身份识别验证;

10.对车辆的拍照进行识别;

11.判断车辆的颜色、车型;

12.在海量图片库当中寻找与某一张图片相似的若干图片;

13.根据用户哼唱的音调搜索对应的歌曲;

。。。。。

 

一个典型的模式识别系统可以分为下图所示的几个模块:

 

 

   (1)数据采集

显然,数据的采集是进行生物识别验证的前提条件。一个性能良好的生物特征识别系统一定需要首先捕获到好的生物特征数据。利用这些数据,我们就可以进行后续的预处理、特征提取、特征选择等工作。一般来说,这里的数据采集肯定需要借助相应的硬件设备,诸如,声音传感器、图像传感器等等。如果传感器的灵敏度不高,或者传感器的精确度不高,那么势必会对所采集到的数据产生一定的噪声污染。这样一来,尽管可以通过后续的预处理来减弱甚至消除一部分噪声,但是,终究无法做到完全去除噪声的干扰。所以,数据采集部分应该尽量保证所得到的数据纯正、干净。通常我们可以采集相当数量的数据,并从中选择最优、最好、最具有代表性的数据来作为原始的输入。这样,就从源头上保证了数据取样对最终生物识别验证系统的干扰最小。

另外,需要注意的是,针对不同的生物特征,数据采集的方法和原理是不同的。比如,虹膜识别系统是通过分析人的虹膜表面不同区域不同的纹理分布来进行分类辨别的。而掌纹识别,则是基于人的手掌脉络的不同分叉、线条的粗细等特征为依据来进行最终的识别。笔迹识别则是利用了不同的人在签名时笔划的长度、角度、偏移,握笔的力度、书写时的速度,加速度等特征来进行区分的。

(2)预处理

       在基于统计方法的生物识别技术领域,所谓的预处理一般是指去除噪声的干扰,加强有效信息的过程。前面已经提到,原始数据的采集不可避免的要引入一些噪声的干扰,对于一个实际的生物识别系统而言,预处理是一个必要的环节。但是,需要注意的是,虽说预处理的作用都是减弱甚至消除噪声的干扰,同时增强有用信息的强度,不过,针对不同的特征,预处理的方法也是千差万别。

   (3)特征提取

    一般来说,从传感器得到的数据属于原始测量空间的数据,而原始测量空间的数据是无法直接进行判别分类的,或者说,直接利用原始测量空间得到的数据进行判别分类往往达不到期望的效果。通常来说,我们需要将数据从原始的测量空间“变换”到二次空间,而这个二次空间,研究人员一般将它称为特征空间。将数据从原始空间变换到特征空间后,我们就得到了表征某模式的二次特征,一般我们所指的特征就是这里所谓的二次特征。

   (4)特征选择

    数据从原始空间变换到特征空间后,得到了二次特征,而这里的二次特征不一定就是我们需要的特征,或者,变换得到的二次特征对最终的分类判别不一定有很好的作用。而特征选择的作用就是从若干二次特征中挑选对模式的最终分类判别最有帮助或者分类效果最后的一部分二次特征。不难发现,这里的特征选择,实际上是一个寻优问题。

   (5)分类判别

    在得到了对分类最有帮助的二次特征之后,最终需要做的就是对二次特征进行分类判别。一般而言,简单点的分类判别方法是将特征表示为向量的形式,然后,利用诸如欧氏距离、马氏距离、卡方距离、范数等手段来计算任意两个向量之间的相似性,之后,根据计算得到的向量的相似性来进行分类判别。复杂点的分类判别方法是利用SVM、ANN、CART、SNOW等方法将特征进行某种线性或者非线性的变换,从而在变换后的空间进行二次分类。

你可能感兴趣的:(CV相关)