机器学习——联合概率分布及其意义

1 定义

1.1 联合概率

联合概率表示为包含多个条件并且所有的条件都同时成立的概率,记作 P(X=a,Y=b)或 P(a,b),有的书上也习惯记作P(ab)。

1.2 联合概率分布

联合概率分布就是联合概率在样本空间中的分布情况

下面是百度百科上的定义:
联合概率分布简称联合分布,是两个及以上随机变量组成的随机变量的概率分布。根据随机变量的不同,联合概率分布的表示形式也不同。对于离散型随机变量,联合概率分布可以以列表的形式表示,也可以以函数的形式表示;对于连续型随机变量,联合概率分布通过非负函数的积分表示。

简单来说就是两个及以上的随机变量组成的关于随机变量的概率分布。

1.3 相关公式

与条件概率的关系:

P ( X ∣ Y ) = P ( X , Y ) P ( Y ) ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ( 1 ) P(X|Y) = \cfrac{P(X, Y)}{P(Y)} · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · (1) P(XY)=P(Y)P(X,Y)(1)

与边缘概率的关系 :

P ( X ) = ∑ i = 1 N P ( X , Y ) ⋅ P ( Y ) ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ( 2 ) P(X) = \sum_{i=1}^NP(X, Y) · P(Y)· · · · · · · · · · · · · · · · · · · · · · · · · · · · · (2) P(X)=i=1NP(X,Y)P(Y)(2)

2 意义

在统计学习,机器学习中,我们的目标就是找到两个随机变量的联合概率分布P(X,Y)。

比如说我们有一个模型,有输入变量空间X=(x1,x2,…,xn)和输出变量空间Y=(y1,y2,…,ym),可能是离散的,可能是连续的。那么现在我们这个模型的作用就是在输入一个x的时候,能够给出一个y,也可以说我们这个模型的作用就是找到X和Y的联合概率分布P(X,Y)。那么我们就可以根据公式(1),即根据联合概率得到条件概率P(Y∣X),于是就可以利用这个条件概率找到给定一个x的情况下,最大可能的y
是哪一个。

而我们上面的基本前提就是假设存在 X 关于Y 的联合概率分布。如果根本就不存在这样的联合概率分布,那么这个模型也是个没有什么意义的模型。

本文参考:https://blog.csdn.net/qq_39636214/article/details/85036837

你可能感兴趣的:(机器学习数学笔记)