朴素贝叶斯,Laplace平滑

朴素贝叶斯分类是基于贝叶斯公式和特征条件独立假设的分类方法。
贝叶斯公式为: p(y|x)=p(x|y)p(y)p(x) 。x为特征向量,y是类别。
给定特征向量,求他属于那一个类别,也就是:

maxyp(y|x)=maxyp(x|y)p(y)

假设特征是条件独立的,即 p(x|y)=p(x1x2...xn|y)=ni=1p(xi|y)

拉普拉斯平滑在训练集有限的情况下,给定类别,某一特征值出现的条件概率 p(xi|y) 可能为0,这样在贝叶斯公式中分子和分母都为0,为了避免这种情况,就要用到Laplace平滑,分子加1,分母加 xi 可能出现的种类数。

你可能感兴趣的:(数据挖掘)