贝叶斯分类器 (4)

目录

平滑:拉普拉斯修正

半朴素贝叶斯分类器


平滑:拉普拉斯修正

书接上回,我们讲到了朴素贝叶斯分类器,那么为了考察大家学的怎么样,请大家完成下面的题目

例题:伍老师最近读了小编的文章后,迷上了编程,今天我们要帮助伍老师挑选更合适的计算机,已知对于伍老师而言,计算机的特性与她买不买相机的部分对应关系如下:

贝叶斯分类器 (4)_第1张图片

 那么,请用朴素分类器的思想判断,对于价格便宜、内存大、屏幕大、性能好的计算机,伍老师是买还是不买?

让小编来还原一下大家的思路:

贝叶斯分类器 (4)_第2张图片

 倘若你完成到了这一步,那么恭喜你,整体的思路并没有错,错的是样本的数量太少了。我们来算一算,一共有多少种情况:价格有三种,性能有两种,内存有两种,屏幕大小有两种,一共是3×2×2×2=24种,但是样本只有9个,且在这些样本中,只要是便宜的,伍老师都不打算买,而机器又没有我们这么聪明,它很笨,不知道变通,要是既便宜又各方面都不错的话,小编肯定是买了。所以我们为了让机器学会“变通”,其“变通”方法就是“平滑”操作,我们常用“拉普拉斯修正法

拉普拉斯修正法的思想如下:

贝叶斯分类器 (4)_第3张图片

不好理解?那我们把这个题修正后重新做一遍

贝叶斯分类器 (4)_第4张图片

有的同学会吐槽,闹了半天,不照样不会买吗,那用拉普拉斯修正有什么用,伍老师不照样还是那个富婆吗?小了,我只能说你格局太小了,虽然在本题中确实如此,但是拉普拉斯修正为我们提供了一种“变通”的良好思路,我们要学会通过现象、通过题目去看问题的本质,再去寻找更加合适的方法,我想,这就是数学的魅力所在吧!

半朴素贝叶斯分类器

为了让大家更好理解,我仍然先上一个例子

 引例:刚刚伍老师去买了计算机,买计算机需要时间,导致伍老师没时间批改作业了,那么,为了让伍老师买计算机时不分心,接下来由我们替伍老师改作业。我们决定从平时学习态度、作业字迹、正确率以及完成速度来给同学们的作业评级。(一般作业的字迹、正确率、完成速度和平时的学习态度有相互依赖关系!)

贝叶斯分类器 (4)_第5张图片

 改到下一份作业时,该学生的学习态度很好,字迹一般,正确率低且完成速度慢,聪明的你应该给他的作业评什么等级?

震惊!这四个属性之间有相互依赖关系,岂不是说不能用朴素贝叶斯分类器了吗?那该怎么办?

是的朴素贝叶斯分类器在平时很难成立,因为属性条件独立假设并不是那么容易实现。所以热爱学习的我们要来学习另一种更厉害的分类器:半朴素贝叶斯分类器

半朴素贝叶斯分类器的基本想法是适当考虑一部分属性间的相互依赖信息,从而既不需进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系 。“独依赖估计”是半朴素贝叶斯分类器最常用的一种策略。顾名思议,所谓“独依赖”就是假设每个属性在类别之外最多仅依赖于一个其他属性。就比如说,举个例子:字迹、正确率以及完成速度都仅依赖于学习态度。

有下面这个公式,大家应该能够理解:

贝叶斯分类器 (4)_第6张图片

所以问题的关键转换为如何求出这个被依赖的属性!

对于所有属性都依赖于同一个属性的情况,我们会称该属性为“超父属性”,比如例题中假如字迹、正确率以及完成速度都仅依赖于学习态度,那么超父属性就为“学习态度 ”,下图中,a图为朴素贝叶斯的依赖情况,b图为超父独依赖的依赖情况。

贝叶斯分类器 (4)_第7张图片

 至于TAN算法,有点过于复杂了,感兴趣的同学们可以自己到别的网站中自己学一下。

那么,半朴素分类器的思想学完了,也就标志着贝叶斯分类器的知识学的差不多啦!太优秀了各位,为自己鼓个掌吧!你的坚持学习必然会得到回报的!完结撒花!wohoo!

贝叶斯分类器 (4)_第8张图片

小编接下来还有各方各面的文章,感兴趣的友友们可以给我点赞加关注后再走吗,小编在此鞠躬感谢啦!

你可能感兴趣的:(机器学习,人工智能,python,开发语言)