机器学习与模式识别第三章:判别函数

在很多实际问题中,由于样本特征空间的类条件概率密度的形式常常很难确定,利用非参数方法估计需要很大的样本空间,而且随着特征空间位数的增加所需的样本数急剧增加,因此在实际问题中,我们往往不确定某个判别函数类,然后利用样本集确定出判别函数中的未知参数。

线性判别

线性判别函数法是一种较为简单的判别函数,最简单的是线性函数,它的分界面是超平面,采用线性判别函数所产生的错误率或风险虽然可能比贝叶斯分类器来的大,但是他简单,容易实现,而且需要的计算量和存储量小。因此可以认为线性判别函数是统计模式识别的基本方法之一。

  1. 模式识别系统的主要作用 ,判别各个模式所属的类别,对一个两类问题的判别,就是将模式x划分成ω1和ω2两类。
  2. 用判别函数分类的概念 两类问题的判别函数(以二维模式样本为例)
    若x是二维模式样本x = (x1 x2)T,用x1和x2作为坐标分量,得到模式的平面图:
    机器学习与模式识别第三章:判别函数_第1张图片
    这时,若这些分属于ω1和ω2两类的模式可用一个直线方程d(x)=0来划分
    d(x) = w1x1 + w2x2 + w3 = 0
    其中x1、x2为坐标变量,w1、w2、w3为参数方程,则将一个不知类别的模式代入d(x),有
  • 若d(x) > 0,则x属于w1
  • 若d(x) < 0,则x属于w2
    此时,d(x)=0称为判别函数。
  1. 用判别函数进行模式分类依赖的两个因素
    用判别函数进行模式分类依赖的两个因素
    (1)判别函数的几何性质:线性的和非线性的函数。
    线性的是一条直线;
    非线性的可以是曲线、折线等;
    线性判别函数建立起来比较简单(实际应用较多);
    非线性判别函数建立起来比较复杂。
    (2)判别函数的系数:判别函数的形式确定后,主要就是确定判别函数的系数问题。
    只要被研究的模式是可分的,就能用给定的模式样本集来确定判别函数的系数。

  2. n维线性判别函数的一般形式
    一个n维线性判别函数的一般形式:
    在这里插入图片描述
    其中w0 = (w1, w2, …, wn)T称为权向量(或参数向量), x = (x1, x2, …, xn)T。
    d(x)也可表示为:
    d(x) = wTx
    其中,x = (x1, x2, …, xn, 1)T称为增广模式向量,w = (w1, w2, …, wn+1)T称为增广权向量。

两类情况:判别函数d(x)
在这里插入图片描述
8. 线性判别函数

  • 多类情况1
    用线性判别函数将属于ωi类的模式与不属于ωi类的模式分开,其判别函数为:
    在这里插入图片描述
    i = 1, 2, …, M
    这种情况称为两分法,即把M类多类问题分成M个两类问题,因此共有M个判别函数,对应的判别函数的权向量为wi, i = 1, 2, …, M。
    图例:对一个三类情况,每一类模式可用一个简单的直线判别界面将它与其它类模式分开。
    例如对的模式,应同时满足:d1(x)>0,d2(x)<0,d3(x)<0
    不确定区域:若对某一模式区域,di(x)>0的条件超过一个,或全部di(x)<0,i = 1, 2, …, M,则分类失败,这种区域称为不确定区域(IR)。
    机器学习与模式识别第三章:判别函数_第2张图片
    例:设有一个三类问题,其判别式为:
    d1(x)= -x1 + x2,d2(x)= x1 + x2 - 5,d3(x)= -x2 + 1
    则对一个模式x=(6, 5)T,判断其属于哪一类。
    将x=(6, 5)T代入上述判别函数,得:
    d1(x) = -1,故d1(x)<0
    d2(x) = 6,故d2(x)>0
    d3(x) = -4,故d3(x)<0
    从而
    假若x=(3, 5)T,则
    d1(x) = 2>0
    d2(x) = 3>0
    d3(x) = -2<0
    分类失败。
  • 多类情况2:
    采用每对划分,即ωi/ωj两分法,此时一个判别界面只能分开两种类别,
    但不能把它与其余所有的界面分开。其判别函数为:
    在这里插入图片描述
    若dij(x)>0,,则重要性质:dij = -dji
    图例:
    机器学习与模式识别第三章:判别函数_第3张图片
    对一个三类情况,d12(x)=0仅能分开ω1和ω2类,不能分开ω1和ω3类。
    要分开M类模式,共需M(M-1)/2个判别函数。不确定区域:若所有dij(x),找不到,dij(x)>0的情况。

例:设有一个三类问题,其判别函数为:
d12(x)= -x1 - x2 + 5,d13(x)= -x1 + 3,d23(x)= -x1 + x2
若x =(4, 3)T,则:d12(x) = -2,d13(x) = -1,d23(x) = -1

机器学习与模式识别第三章:判别函数_第4张图片
分类失败。

  • 多类情况3(多类情况2的特例)
    这是没有不确定区域的ωi/ωj两分法。假若多类情况2中的dij可分解成:dij(x) = di(x) - dj(x) = (wi – wj)T x,则dij(x)>0相当于di(x)>dj(x),任意j!=i,这时不存在不确定区域。此时,对M类情况应有M个判别函数:
    在这里插入图片描述
    即di(x)>dj(x),,i, j = 1,2,…,M,
    则,也可写成,若di(x)=max{dk(x), k=1,2,…,M},则。该分类的特点是把M类情况分成M-1个两类问题。
    机器学习与模式识别第三章:判别函数_第5张图片
    例:设有一个三类问题的模式分类器,其判别函数为:
    d1(x)= -x1 + x2,d2(x)= x1 + x2 - 1 ,d3(x)= -x2
    属于ω1类的区域应满足d1(x)>d2(x)且d1(x)>d3(x),ω1类的判别界面为:
    d12(x)= d1(x)-d2(x) = -2x1 + 1 = 0
    d13(x)= d1(x)-d3(x) = -x1 + 2x2 = 0
    属于ω2类的区域应满足d2(x)>d1(x)且d2(x)>d3(x),ω2类的判别界面为:
    d21(x)= d2(x)-d1(x) = 2x1 - 1 = 0,可看出d21(x)=-d12(x)
    d23(x)= d2(x)-d3(x) = x1 + 2x2 - 1= 0
    同理可得ω3类的判别界面为:
    d31(x) = -d13(x) = x1 - 2x2 = 0
    d32(x) = -d23(x) = -x1 - 2x2 + 1= 0
    若有模式样本x =(1, 1)T,则:d1(x) = 0,d2(x) = 1,d3(x) = -1
    从而:d2(x)>d1(x)且d2(x)>d3(x),故
  1. 小结:线性可分
  • 模式分类若可用任一个线性函数来划分,则这些模式就称为线性可分的,否则就是非线性可分的。
  • 一旦线性函数的系数wk被确定,这些函数就可用作模式分类的基础。
  1. 多类情况1和多类情况2的比较
  • 对于M类模式的分类,多类情况1需要M个判别函数,而多类情况2需要M*(M-1)/2个判别函数,当M较大时,后者需要更多的判别式(这是多类情况2的一个缺点)。
  • 采用多类情况1时,每一个判别函数都要把一种类别的模式与其余M-1种类别的模式分开,而不是将一种类别的模式仅与另一种类别的模式分开。
  • 由于一种模式的分布要比M-1种模式的分布更为聚集,因此多类情况2对模式是线性可分的可能性比多类情况1更大一些(这是多类情况2的一个优点)
  1. 习题
  • 在一个10类的模式识别问题中,有3类单独满足多类情况1,其余的类别满足多类情况2。问该模式识别问题所需判别函数的最少数目是多少?
    :将10类问题看成4个多类情况1的问题,那么需要4个判别函数,在第4个类中有7个是多类函数情况2,因此需要21个判别函数,加起来一共25个。
  • 一个三类问题,其判别函数如下:
    d1(x)=-x1, d2(x)=x1+x2-1, d3(x)=x1-x2-1
    设这些函数是在多类情况1条件下确定的,绘出其判别界面和每一个模式类别的区域。
    设为多类情况2,并使:d12(x)= d1(x), d13(x)= d2(x), d23(x)= d3(x)。绘出其判别界面和多类情况2的区域。
    设d1(x), d2(x)和d3(x)是在多类情况3的条件下确定的,绘出其判别界面和每类的区域
    第一种:
    机器学习与模式识别第三章:判别函数_第6张图片
    第二种:
    机器学习与模式识别第三章:判别函数_第7张图片
    第三种:
    机器学习与模式识别第三章:判别函数_第8张图片

画的好丑啊!!!

下一次来说广义线性判别函数,拜拜

你可能感兴趣的:(模式识别与机器学习,模式识别,线性函数)