朴素贝叶斯分类原理

为什么叫朴素贝叶斯分类呢?

1.它用到了贝叶斯定理

2.这种方法的思想真的很朴素

对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。你在街上看到一个黑人,你很可能会猜非洲。因为黑人中非洲人的比率最高,当然也不一定对。但在没有其它可用信息下,我们会选择条件概率最大的类别,这就是朴素贝叶斯的思想基础。

举个栗子:

用cu,fe,ca三种元素的含量判断某人是否患病。

可以先统计1000人的患病情况,并测出他们的三种元素含量。

若其中400人患病,那p(患病)=0.4,p(健康)=0.6

患病的400人中:

p(cu>0.1)=0.8, p(cu<0.1)=0.2,

p(fe>0.1)=0.7,  p(fe<0.1)=0.3,

p(ca>0.1)=0.6, p(ca>0.1)=0.4,

健康的600人中:

p(cu>0.1)=0.3, p(cu<0.1)=0.7,

p(fe>0.1)=0.2,  p(fe<0.1)=0.8,

p(ca>0.1)=0.1, p(ca<0.1)=0.9,

那么我们就可以计算其他人的患病概率了:

加入一个人cu,fe,ca三种元素含量分别为0.12,0.8,0.7

那他的p(患病)=0.4*0.8*0.3*0.4=0.0384

p(健康)=0.6*0.3*0.8*0.9=0.1296

可以看出,他的p(健康)明显大于p(患病),所以很可能是健康的

你可能感兴趣的:(朴素贝叶斯分类原理)