分类--贝叶斯分类

1、贝叶斯分类方法是统计学的分类方法,它利用概率统计知识预测给定元组属于特定类的概率。

2、贝叶斯分类源于贝叶斯定理,最简单的贝叶斯分类算法是朴素贝叶斯分类法。该方法虽然简单,但是在实际应用上表现出了很高的准确率和效率,而且可以用到大型数据库中。

3、我们先聊了解下贝叶斯定理是怎么一回事儿。

给出情景:有一批产品,在机器良好的时候生产产品合格的概率为70%,在机器故障的时候生产产品合格的概率为30%,机器良好的概率为60%,那么当我们生产出的产品合格时,机器良好的概率为多少?

1)先根据语句写出已知条件:假设机器良好为A1,机器故障为A2,产品合格为B

       P(B|A1)=70%, P(B|A2)=30%,P(A1)=60%

2)可知先验概率   A1:A2=60%:(1-60%)=6:4

      似然函数        P(B|A1)=70%:P(B|A2)=30%=7:3

      两两相乘得42:12

     42+12=54便是全概率公式计算出来的值

      故而得出后验概率为42/54=7/9

3)作图来直面一下过程:(把先验概率写x向,证据因子写y向)

P(B|A1)=(70%X60%)/(70%X60%+30%X40%)=7/9

4)贝叶斯定理公式:

5)并且,比值 P(B|A)/P(B)>1,意味着"先验概率"被增强,事件A的发生的可能性变大;

                                                  =1,意味着B事件无助于判断事件A的可能性;

                                                  <1,意味着"先验概率"被削弱,事件A的可能性变小。

4、朴素贝叶斯分类有一个简单的前提假设,即属性之间是条件独立的,也叫做类条件独立性假设。

5、举例说明


一只大晚上懒得敲公式直接打的统计狗

6、朴素贝叶斯的优缺点:

它的优势在于它易于实现,而且在大多数情况下能够获得较好的分类准确率。劣势在于它的类条件独立性假设,如果数据的各个属性之间有较强的依赖关系,那么朴素贝叶斯就不能取得较好的结果。

7、如何处理属性之间的依赖关系呢?

贝叶斯信念网络告诉你做人的道理~

你可能感兴趣的:(分类--贝叶斯分类)