朴素贝叶斯

参考-《统计分析方法》-李航
第四章 朴素贝叶斯法
电脑可以将图像视频文字等呈现在人类面前但是它自己却没有判断力,并不能去这些信息进行分类和识别。机器学习就是为了让机器获得识别这些信息的能力。在机器学习中朴素贝叶斯是一种非常简单但是却应用十分广泛的分类方法。 朴素贝叶斯是基于贝叶斯的一种分类方法,它通过输入的训练数据集和类别标签来学习联合分布概率P(X,Y),然后利用P(X,Y)来对测试数据进行分类。

输入(特征值)X:
朴素贝叶斯_第1张图片

其中 i:1,2,……N;j:1,2,3……n; Xi (j)的特征可选值:aj1,aj2,……aj Si 。
输出(类别)Y:朴素贝叶斯_第2张图片
Y:c1,c2,……ck

训练数据:
朴素贝叶斯_第3张图片
因此得到P(X,Y)是朴素贝叶斯训练过程的目标。
2. 求联合概率分布P(X,Y)
这里写图片描述
已知贝叶斯定理:朴素贝叶斯_第4张图片

所以我们只要知道了P(Y)和P(X|Y)就能得到P(X,Y)了。
1)求P(Y).
P(Y)是先验概率,即求每一个类别的概率,用样本猜测模型,也就是用样本中ck的出现次数除以样本容量即可。
2)求P(X|Y)
P(X|Y)是条件概率 在Y情况下的X的概率,也叫后验概率。

你可能感兴趣的:(机器学习)