机器学习分类算法(四)-贝叶斯算法

朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。。

贝叶斯算法

贝叶斯(Thomas Bayes,1701—1761年),英国数学家。所谓的贝叶斯定理源于他生前为解决一个“逆概”问题而写的一篇文章。先通过一个小例子来理解一下什么是正向逆向概率。假设你的口袋里面有N个白球、M个黑球,你伸手进去随便拿一个球,问拿出黑球的概率是多大?

这个问题可以轻松地解决,但是,如果把这个问题反过来还那么容易吗?如果事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,要对袋子里面的黑白球的比例作推测。好像有一点绕,这就是逆向概率问题。接下来就由一个小例子带大家走进贝叶斯算法。

贝叶斯公式

直接看贝叶斯公式可能有点难以理解,先通过一个实际的任务来看看贝叶斯公式的来历,假设一个学校中男生占总数的60%,女生占总数的40%。并且男生总是穿长裤,女生则一半穿长裤、一半穿裙子。

1.正向概率。随机选取一个学生,他(她)穿长裤和穿裙子的概率是多大?这就简单了,题目中已经告诉大家男生和女生对于穿着的概率。

2.

你可能感兴趣的:(机器学习)