最小错误率贝叶斯决策

在一般的模式识别问题中,人们的目标往往是尽量减少分类的错误,追求最小的错误率。根据之前的文章,即求解一种决策规则,使得:

minP(e)=P(e|x)p(x)dx

这就是 最小错误率贝叶斯决策

在上式中, P(e|x)0,p(x)0 对于所有的 x 均成立,故 minP(e) 等同于对所有的 x 最小化 P(e|x) ,即:使后验概率 P(wi|x) 最大化。根据贝叶斯公式:

P(wi|x)=p(x|wi)P(wi)p(x)=p(x|wi)P(wi)kj=1p(x|wj)P(wj),i=1,2,...,k

在上式中,对于所有类别,分母都是相同的,所以决策的时候实际上只需要比较分子,即:

p(x|wi)P(wi)=maxkj=1P(wj|x)P(wi),xwi

先验概率 P(wi) 和类条件概率密度 p(x|wi) 是已知的。概率密度 p(x|wi) 反应了在 wi 类中观察到特征值x的相对可能性( likelihood )。

举个简单的例子还说明最小错误贝叶斯决策。
假设某地区检测到细胞为正常细胞的概率 w1 和癌细胞的概率 w2 分别为:

w1=0.9,w2=0.1

现在对于一个待决策的细胞,其特征的观察之为 x ,且从类条件概率密度曲线上分别查得:
p(x|w1)=0.2,p(x|w2)=0.4

现在需要对该细胞进行决策,判断是正常细胞还是癌细胞。根据贝叶斯公式,分别计算出 w1 w2 的后验概率:
P(w1|x)=p(x|w1)P(w1)2j=1p(x|wj)P(wj)=0.2×0.90.2×0.9+0.4×0.1=0.818

P(w2|x)=1P(w1|x)=0.182

因为: P(w1|x)=0.818>0.182=P(w2|x) ,所以更合理的决策是将 x 归类为 w1 ,即正常细胞。

说白了,贝叶斯决策就是将待分类物 x 归类于最大后验概率的那一类,即:

P(wi|x)=maxj=1,...,cP(wj|x),xwi

等价于: p(x|wi)P(wi)=maxkj=1P(wj|x)P(wi),xwi
贝叶斯公式是用来计算后验概率的工具。

对于多类别决策,错误率的计算量较大,可以转化为计算平均正确率 P(c) 来计算错误率:

P(e)=1P(c)=1j=1kP(xRi|wj)P(wj)1j=1kP(wj)Rjp(x|wj)dx

你可能感兴趣的:(模式识别)