模式识别--绪论 什么是模式识别?模式识别的主要方法及具体应用

一、什么是模式识别

人类每时每刻在完成某种模式识别的任务,例如读书看报(文字识别)、茫茫人海中寻找一个伙伴(特征识别)、鸟鸣(声音识别)……人们对外界对象的几乎所有认识都是对类别的认识,通过计算机模仿人脑对现实世界各种事物 进行描述、分类、判断和识别的过程即为模式识别。那么什么是模式呢?顾名思义,模式即为模式识别的对象,可以是一些文字,一个人,一张纸,鸟语花香等等一切可以进行识别测量的生活中的事物。

在对模式识别有了大致的认识之后,开始正式学习前,以下这些关键名词需要理解掌握

样本(sample):所研究对象的一个个体。
样本集(sample set): 若干样本构成的集合。
类或类别(class):在所有样本上定义的一个子集,处于同 一类的样本在某种性质上是不可区分的。
特征(features):指用于表征样本的观测,通常是数值表示的某些量化特征,有时也被称作属性。如果存在多个特征,则组成了特征向量。
已知样本(known samples):事先知道类别标号的样本。
未知样本(unknown samples):类别标号未知但特征已知的样本。

模式识别的问题就是用计算的方法根据样本的特征对样本进行分类。

二、模式识别的主要方法

(1)基于知识的方法 (Knowledge-based)

例如:AI、专家系统(Expert Systems)
句法(结构)模式识别 (Syntax PR or Structural PR)

(2)基于数据的方法 (Data-based)
例如:统计模式识别方法(Statistical PR)、人工神经网络(ANN)、 支持向量机(SVM)
基于数据的识别方法,基础是统计模式识别,即依据统计的原理来构建分类器。下图为统计模式识别过程
模式识别--绪论 什么是模式识别?模式识别的主要方法及具体应用_第1张图片

基于数据的模式识别方法适用于已知对象的某些特征与我们所 感兴趣的类别性质有关系,但无法确切描述这种关系的情况
分类和特征之间的关系可以完全确切的描述出来,采用基于知 识的方法更有效;
若二者的关系完全随机,即不存在规律性的练习,应用模式识 别也无法得到有意义的结果。

三、监督模式识别与非监督模式识别

监督模式识别
已知类别,并且能够获得类别已知的训练样本,这种情况 下建立分类器的问题属于监督学习问题,称为监督模式识别。

非监督模式识别

事先我们并不知道类别,也没有类别已知的样本。根据样本特征将样本分为几个类(划分的过程称为聚类),使属于同一类的样本在一定程度上是相似的,而不同类别之间的样本有较大差异。这种学习过程称作非监督模式识别。

四、模式识别系统举例

笔者在此摘录了一些书籍上的例子,如下:
1、语音识别
2、说话人识别(通过语音来确定说话者的身份)
3、字符与文字识别
4、复杂图像中特定目标的识别(道路检测、复杂图像中人脸检测)
5、根据地震勘探数据对地下存储性质的识别
6、利用基因表达数据进行癌症的分类

五、模式识别系统的典型构成

一个模式识别系统通常包括原始数据的获取和预处理特征提取与选择分类或聚类后处理 四个主要部分。

监督模式识别(supervised PR)
模式识别--绪论 什么是模式识别?模式识别的主要方法及具体应用_第2张图片
监督模式识别问题一般步骤:
分析问题---->原始特征获取—>特征提取与选择—>设计分类器

非监督模式识别(unsupervised PR)
模式识别--绪论 什么是模式识别?模式识别的主要方法及具体应用_第3张图片
非监督模式识别问题一般步骤:
分析问题---->原始特征获取—>特征提取与选择—>聚类分析—>结果解释

区别:

监督模式识别需要训练数据,根据训练样本设计分类器
非监督模式识别则不需要训练数据,是根据样本的相似性来进行分类的。

特征提取与选择分类器设计和聚类分析,以及分类器和聚类结果的性能评价方法 等是各种模式识别系统中具有共性的步骤,是整个系统的核心,也是模式识别学科研究的主要内容。

笔者最近在学习模式识别,以上是对模式识别的基本概念做了大致阐述,与大家分享,共同学习,共同进步。若有描述不当的地方,还请指正,感激不尽!

参考所学书籍《模式识别》第三版 (张工学先生编著)

你可能感兴趣的:(机器学习,聚类,机器学习)