先验概率、后验概率、似然估计三者的区别与联系

在机器学习日渐风靡于全世界的今天,概率论与数理统计作为机器学习的关键理论越来越体现出它的重要地位。本文模仿《机器学习》中周志华老师的举例,以西瓜的品质好坏为例,对三个概念:先验概率、后验概率、似然估计展开讨论,帮助读者深刻了解。


前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容:概率论与数理统计中的先验概率、后验概率、似然估计三者的区别与联系。 首先我们假设有一个村是全村种瓜,这个村每个人有一块瓜地,假设这个村有若干人并且足够多。客人可以在村里的店铺买瓜,买到的瓜随机来自这些瓜农。

一、先验概率

由历史求因,先验概率一般是基于多次实验的数据进行的概率估计。例如一个瓜地里有多少好瓜,由统计好瓜率推出长出好瓜的比例。
先验概率即P(因)。

二、后验概率

P(因∣果),已知很多客人买到了好瓜并且我们统计了概率,在这个前提下推算这个村的好瓜率,就是后验概率。

三、似然估计

P(果∣因),也就是由果求因,通过每个瓜地的好瓜率推算顾客买到好瓜的概率。

四、贝叶斯公式

P(A∣B)=P(B∣A)*P(A)/P(B) 实际上就是 后验概率=似然估计×先验概率/B事件概率分布。

总结

在笔者上大二的时候,概率论课上老师讲解了贝叶斯公式,当时读者并未有更深的理解。随着对机器学习深入研究,愈发觉得概率论十分重要,故而继续回头学习。今日有感,写下此文,抛砖引玉,望不吝赐教。

你可能感兴趣的:(机器学习,概率论,人工智能,机器学习,大数据)