概率统计篇:概率基础(联合概率、条件概率和贝叶斯法则)[第二天]

联合概率:由多个随机变量决定的概率我们就叫联合概率,它的概率分布就是联合概率分布。

边缘概率:对于离散型随机变量,我们可以通过联合概率 P(x, y) 在 y 上求和,就可以得到 P(x)。对于连续型随机变量,我们可以通过联合概率 P(x, y) 在 y 上的积分,推导出概率 P(x)。这个时候,我们称 P(x) 为边缘概率。

条件概率:条件概率也是由多个随机变量决定,但是和联合概率不同的是,它计算了给定某个(或多个)随机变量的情况下,另一个(或多个)随机变量出现的概率,其概率分布叫做条件概率分布。给定随机变量 x,随机变量 y 的条件概率使用 P(y | x) 表示。

三者之间的关系:联合概率是条件概率和概率的乘积,

                                                                 

贝叶斯定理:

                                                           

在这里面,我们把 P(x) 称为先验概率。之所以称为“先验”,是因为它是从数据资料统计得到的,不需要经过贝叶斯定理的推算。

P(y | x) 是给定 x 之后 y 出现的条件概率。在统计学中,我们也把 P(y | x) 写作似然函数 L(x | y)。

针对离散型和连续型的边缘概率推导分别如下:

                                                                 

                                                                  

因此我们把P(x|y)称作后验概率;

随机变量之间的独立性可以简化公式,

你可能感兴趣的:(数据分析-数学基础)