本系列文章由孙旭编辑,转载请注明出处
http://blog.csdn.net/longyindiyi/article/details/20068781
多谢合作!
如果您在阅读文章过程中发现有表述错误的地方,还请指正。
在正式引入模式识别的概念之前,让我们先看几个模式识别应用的实例。
1.iphone5s 中的指纹识别系统
苹果公司于2013年发布新一代手机——iPhone5s,革命性地在其经典的Home键上加入了指纹识别系统,实现自动解锁的功能。
2.讯飞语点语言识别系统
继苹果 Siri 语言系统之后,科大讯飞推出了中文语音助手——讯飞语点,丰富人们与手机间的交互方式,该软件主要涉及到语音识别系统。
3.相机中的笑脸模式
在现在的很多相机(无论专业单反,还是手机相机)中,纷纷加入了笑脸模式——即在检测到相机视野中的人脸露出笑容时,自动进行拍照,而不必手动按下快门,此处应用到了图像识别技术。
由以上应用实例可以看出,模式识别已经逐步走入到了实用的阶段。
在日常生活中,我们可以轻而易举地辨识人脸、识别语音、阅读手写文字、从口袋里摸出钥匙,或者根据气味判断苹果是否成熟,这大大掩盖了隐藏在这些简单的识别行为背后的非常复杂的处理机制,模式识别所承担的使命,就是要探索这种处理机制。
从本文开始,让我们一起拨开模式识别的神秘面纱。
那么,到底什么是模式识别呢?
我们定义模式识别为:通过计算机技术自动地或半自动(人机交互)地实现人类的识别过程。
这里,模式是这样定义的:为了能让机器执行识别任务,必须先将识别对象的有用信息输入计算机。为此,必须对识别对象进行抽象,建立其数学模型,用以描述和代替识别对象。这种对象的描述就是模式。
简单说就是识别对象所属的类别,比如人脸识别中的人脸。
为了更好地理解机器模式识别的过程,我们先举一个人类识别过程的实例作为对照。
实例:阵发性心房颤动(paroxysmalatrial fibrillation, PAF)的识别
先验知识
图片说明:
正常的心电图可分解为三个主要部分:P波(P-wave)、QRS(QRScomplex)、T波(T-wave)。
与心房颤动相关的特征是P波和R-R间距(R-Rinterval)。
在上图中,红色箭头指示的是阵发性心房颤动发作时的心电图,紫色箭头指示的则是正常的心电图。
医生在进行诊断的过程如下图所示:
也就是说医生诊断是依据先验知识通过对从获取到的心电图中提取来的特征的分析而进行的。
机器模式识别采用的也是类似的做法,以下显示的是典型机器模式识别的过程:
由上图可以看出,机器模式识别同样需要依据先验知识对采集到的信号进行特征处理之后再进行类型判别。在本系列文章中,笔者关注的重点将是上述过程中的分类算法。
一个完整的模式识别过程包括三个步骤:学习模块,训练模块和验证模块,可以用下图进行表示:
由此可见,每个模块都需要有对应的样本。
根据学习过程方式的不同,模式识别可以分为两大类:分类(有监督学习)和聚类(无监督学习)。
顾名思义,有监督学习就是学习过程是在监督下进行的,可以知道学习过程中有没有犯错,犯了什么错,对应的样本有类别标签。而无监督学习就是自学成才,对应的样本无类别标签。
从研究方法上看,传统模式识别又可以分为统计模式识别和句法模式识别,步入现代后,模式识别与其他学科相互渗透,出现了诸如神经网络模式识别,模糊模式识别,遗传算法,支撑向量机等新方法,或者称为分支。
可以说,经过近一个世纪的发展,模式识别中涌现出了大量优秀的算法,但是,经典的算法却不外乎几种,其他算法可以看作是对这些算法的改进和发展。
在今后的文章中,我们将对那些经典的算法进行剖析。
本节最后,附上获取模式识别电子资源的主要网址: