贝叶斯网络分类器

 

贝叶斯网络分类器:

在贝叶斯网络中将其中代表类别变量的结点作为根结点,其余所有的变量结点都作为该类别变量结点的子结点,则贝叶斯网络就变成了贝叶斯网络分类器。构造分类器需要根据给定训练样本数据集(训练集)作为输入,通过对训练集进行训练,归纳出分类器,利用分类器对没有分类的数据进行分类。

 

贝叶斯网络分类器概述

贝叶斯分类器是基于贝叶斯学习方法的分类器。设有变量集U={A1,A2,...,An,C},其中A1,A2,...,An是实例的n个属性变量,实例可用向量xi=(a1,a2,,an)表示,其中,aiAi的值,令C是类变量,c表示C的值。应用贝叶斯定理,实例xi属于类cj的概率为:

 

 

其中, 是正则化因子,P(a1,a2,…,an)的倒数,为常量,p(cj)是类cj的先验概率,p(cj|a1,a2,,an)是类cj的后验概率。先验概率独立于训练数据集,而后验概率反映了样本数据对类cj的影响。贝叶斯分类模型参数学习的关键就是如何计算p(ai|a1,a2,,ai-1,cj)。目前,不同贝叶斯分类模型的区别就在于,它们以不同的方式来求p(ai|a1,a2,,ai-1,cj)xi被分到c类,即g(e)=argmax p(c|a1,a2,,an),称g(e)为贝叶斯分类器。

贝叶斯分类器同其他分类器相比具有如下特点:

(1)贝叶斯分类器并不把一个对象绝对地指派给某一类,而是通过计算得出属于某一类的概率分布;

(2)一般情况下在贝叶斯分类器中所有的属性都潜在地起作用,即并不是一个或者几个属性决定分类,而是所有的属性都参与分类;

(3)用于贝叶斯分类器分类的对象的属性可以是离散的、连续的,也可以是混合的。

 

多模块集成式贝叶斯网络分类器

多模块集成式贝叶斯网络分类器是基于分治法的思想,将一个难以直接解决的大问题,分割成一些规模较小的问题,以便各个击破,分而治之。该模型既具有结构简单的优点。其思路将一个规模为n的问题分解为k个规模较小的子问题,最终使子问题缩小到很容易直接求出其解,而这些子问题互相独立且与原问题等价。最后把各部分的解组合成整个问题的解。

 

贝叶斯网络学习算法的准确性评价指标:预测准确度、计算复杂度和模型描述的简洁度。

贝叶斯网络分类器算法的准确性评价方法:利用似然概率评价网络结构的准确性。

 

  

你可能感兴趣的:(技术文档)