面试算法(一)—朴素贝叶斯

朴素贝叶斯


先大致过一遍最近看的朴素贝叶斯内容,李航的书先讲什么是先验概率、条件概率和后验概率;朴素贝叶斯的朴素是因为假设了特征条件独立,这样减少了大量的参数计算;而后介绍了如何由贝叶斯公式推出朴素贝叶斯的分类原理,主要在计算参数时候运用了极大似然估计,通过后验概率最大化得到正确的类别;这个后验概率最大化可以证明等价于期望风险最小化。随后介绍了平滑方法,防止条件概率为0的情况出现。

下面列一些博客作为参考,方便遗忘时翻阅。

NLP系列(2)_用朴素贝叶斯进行文本分类(上)

NLP系列(3)_用朴素贝叶斯进行文本分类(下)

NLP系列(4)_朴素贝叶斯实战与进阶

这三篇博客主要从工程应用方面较为总览的介绍朴素贝叶斯模型,提到了混合模型和一些工程上的tricks,包含了大量的实例,第三篇提到了朴素贝叶斯模型的优缺点和注意点。


朴素贝叶斯算法原理小结

这篇就是一个简洁的朴素贝叶斯模型原理小结,也提到了朴素贝叶斯模型的伯努利和高斯形式。


贝叶斯统计观点下的拉普拉斯平滑

这篇数学推导了一下李航书中的拉普拉斯平滑公式的缘来;同时也证明了在二项分布的情况下为何用频率估计概率是一个极大似然估计。


一个小例子完美解释Naive Bayes(朴素贝叶斯)分类器

非常直白的一个小例子

基于朴素贝叶斯的自然语言分类器

这篇文章简单实现了一个完整的自然语言分类器,可以参考流程。

机器学习实战教程(四):朴素贝叶斯基础篇之言论过滤器

朴素贝叶斯实战篇之新浪新闻分类

与上面一篇类似,更详细的实现了基于朴素贝叶斯的分类器,有代码。


朴素贝叶斯的三个常用模型:高斯、多项式、伯努利

简单介绍了三个模型和sklearn中的调用方法


数学 · 朴素贝叶斯(零)· 贝叶斯决策论

数学 · 朴素贝叶斯(一)· 参数估计数学 

数学 · 朴素贝叶斯(二*)· 推导与推广

Python · 朴素贝叶斯(零)· 简介

Python · 朴素贝叶斯(一)· 框架

Python · 朴素贝叶斯(二)· MultinomialNB

Python · 朴素贝叶斯(三)· GaussianNB

Python · 朴素贝叶斯(四)· MergedNB

完整介绍了朴素贝叶斯的理论和实现


数学之美番外篇:平凡而又神奇的贝叶斯方法

拓展介绍了贝叶斯方法

你可能感兴趣的:(面试算法)