模式识别 - 名词解释整理

  1. 模式识别:模式识别是指把对象根据其特征归到若干类别中适当的一类。模式识别也称为模式分类
  2. 模式:模式是指因素间存在确定性或随机性规律的对象、过程或事件的集合
  3. 识别:识别就是把对象分门别类地认出来
  4. 样本(sample):所研究对象的一个个体
  5. 样本集(sample set):若干样本的集合
  6. 类或类别(class):在所有样本上定义的一个子集,处于同一类的样本具有相同的模式
  7. 特征(feature):表征样本的特点或性状的量化集合,通常是数值表示(对非数值型要转换为数值型),也被称作属性(attribute)。如果存在多个特征,它们就组成特征向量(feature vector)。样本的特征构成了样本特征空间,空间的维数就是特征维数,每个样本是样本空间的一个点。
  8. 统计量:指不含未知参数的样本函数。如样本x_{1},x_{2},…,x_{n}的算术平均值\frac{1}{n}\sum_{i=1}^{n}x_i
  9. 参数空间:在参数估计中,总是假设总体概率密度函数的形式已知,而未知的仅是分布中的几个参数,将未知参数记为\theta,在统计学中,将总体分布未知参数\theta的全部可容许值组成的集合称为参数空间,记为 \Theta
  10. 点估计、估计量和估计值:点估计就是要构造一个统计量{\color{Red} d(x_i,…,x_N)}作为参数\theta的估计\hat{ \theta },在统计学中称\hat{ \theta }为\theta的估计量。如果x_1 ^ {i},…,x_N^{i}是属于类别的\omega _i几个样本估计值,代入统计量{\color{Red} d(x_i,…,x_N)}就得到对于第i类的\hat{ \theta }具体的数值,这个数值称为\theta的估计值。
  11. 区间估计:区间估计是除点估计之外的另一类参数估计。相对于点估计只给出一个具体的数值,区间估计能够给出一个估计的范围。区间估计 = 点估计值 ± 边际误差。这个区间称为置信区间。
  12. 最优分类超平面:一个超平面,如果它能够将训练样本没有错误地分开,并且两类训练样本中离超平面最近的样本与超平面之间的距离最大,则把这个超平面称作最优分类超平面。两类样本中离分类超平面最近的样本到分类面的距离称作分类间隔,最优分类超平面也称作最大间隔超平面。

你可能感兴趣的:(模式识别,机器学习,算法,分类)