模式识别快速入门——基本概念

本文将简洁地介绍模式识别的相关概念和一些问题。

模式识别的历史:

大家可以自己百度一下。此处即不赘述。

模式识别的概念:

什么是模式:广义的说,存在于时间和空间中可以被观察的食物,如果我们可以区别它们是否相同、相似,都可以被成为模式。模式不是物体本身,更强调物体的特征信息。而实际中,模式识别可能并不对应实际的时间和空间,可以适当做更广义、更抽象的理解。

特征是决定相似性与分类的关键,当分类的目的决定后,如何找到合适的特征成为认知与识别的核心问题。对于一个实际的模式识别系统,只有在特征确定以后,才能对分类器的参数进行计算,实际中两者常常相互交叉进行。

模式识别的作用和目的:将某一具体事物正确地归入某一类别。

模式识别系统:

有两种基本的模式识别方法:统计模式识别方法、结构(句法)模式识别方法。相应的模式识别系统都由两个过程实现,即设计和实现。设计:用一定数量的样本(训练集)进行分类器的设计;实现:用所设计的分类器对待识别的样本进行分类决策。本blog主要讨论基于统计方法的模式识别系统。

一般流程是:信息获取→预处理→特征提取和选择→设计→实现

预处理的目的是去除噪声,包括测量仪器、传感器带来的机器误差、退化现象等,加强有用的信息。特征提取往往是从测量空间中表示的模式提取中具有代表性的、能够甄别不同类的特征,一般会组成一个多维向量的表示形式。分类决策就是在特征空间中用统计方法把被识别对象归为某一个类别。

一些基本问题:

1、模式类的紧致性

按我的理解,即是否可以用有限个、符合我们期望的超平面将模式分类。

2、相似、等价

满足对称和自返关系——相似关系;

同时满足对称、自返和传递关系——等价关系。

目前,广泛应用的相似性度量是在空间中定义的某种距离。一输入样本集合Χ,用D维空间中的一个点表示某个样本,两个样本xk和xj的相似性度量δ(xk,xj)满足:

(1)相似性度量应为非负值,即δ(xk,xj)≥0;

(2)样本本身之间相似性度量应为最大;

(3)相似性度量应满足对称性。

你可能感兴趣的:(模式识别快速入门——基本概念)