本文是《人工智能数学基础–概率与统计3:随机变量与概率分布》的后续篇,本文中的公式编号从15开始,前面14个公式请参考人工智能数学基础–概率与统计3:随机变量与概率分布》。
《人工智能数学基础–概率与统计3:随机变量与概率分布》的随机变量分布函数的概念推广到两个或更多个随机变量的情形对应的概率分布就是联合分布。即离散随机变量的概率质量函数和连续随机变量的概率密度函数都可以同时作用于多个随机变量,这种多个随机变量的概率分布被称为联合概率分布(joint probability distribution)。
考虑两个随机变量的典型情形,它们或者两个都是离散的或者两个都是连续的。至于一个变量是离散的而另一个是连续的情形,则只要适当修改就容易解决,推广为两个以上变量的情形,也能解决。
若X和Y是两个离散的随机变量,我们用下式来定义X和Y的联合概率函数:
P(X = x,Y= y)=f(x,y) (13)
其中:
(1)、f(x,y)≥0;
(2)、ΣΣf(x,y)=1,即对概率密度函数基于x和y两个维度叠加求和后的值为1。
假定X可取m个值x1,x2,…,xm中的任一个,Y可取n个值y1,y2,…,yn中的任一个,则事件X=xj和Y=yk的概率由下式给出:
P(X= xj,Y=yk)=f(xj,yk) (14)
X和Y的联合概率函数可以用表2-3中的联合概率来描述。X=xj的概率可对所有在对应于xj的行上各项相加,用下式得到:
公式(15)中 j=1,2,…,m,该公式对应表2-3的最右边的列或边缘,为每行所有单元小格的和。类似地,Y=yk的概率可对所有在对应于yk的列上各项相加,用下式得到
对k=1,2,…,n,分别对应在表2-3的最下边的行或边缘,表示为各列单元和。由于概率(15)和(16)是从表的边缘得到的,我们常常把f1(xj)和f2(yk)(或简记为f1(x)和f2(y))分别称为X和Y的边缘概率函数(marginal probability function)。也应该注意到
它可以写成
在表2-3中,F(x,y)是所有满足工xj≤x和yk≤y的单元小格的总和。
丙个变量都是连续的情形,只要对离散的情形中的求和用积分代替就可类似地得到,因此,随机变量X和Y的联合概率函数(或通常称之为X和Y的联合密度函数)被定义为
x=f(x,y)的图形描绘出一块曲面,称为概率曲面,像图2-4所显示的那样。按上述性质2,界于该曲面与xy平面之间的总体积等于1。
对于X属于a与b之间而Y属于c与d之间的概率,在几何上,由图2-4中阴影部分的体积给出,在数学上由下式给出:
更一般地,若A 代表任一个事件,对应它的是xy平面上的一个区域RA,在此情形中,我们可用RA上的积分来求A的概率,即:
在该情形中,X和Y的联合分布函数被下式定义:
下列式子与《人工智能数学基础–概率与统计3:随机变量与概率分布》中的(11)式类似:
即密度函数由对分布函数关于x与y求导而得到。
我们分别称(24)和(25)式为X和Y的边缘分布函数或简称分布函数,则(24)和(25)式关于x和y的导数就称为X和Y的边缘密度函数,或简称密度函数,并用下式给出:
概率密度函数都同时作用于多个随机变量的概率分布被称为联合概率分布(joint probability distribution),联合概率分布可以看做是一组变量的概率分布,如果需要了解其中一个子集的概率分布,则就是边缘概率分布。
对于离散随机变量,某个子集的边缘概率计算就是将带该子集变量的所有其他子集可能取值求和,对于连续随机变量,则是对该子集变量外的其他子集求积分。
本文内容是老猿学习美版M.R.斯皮格尔等著作的《概率与统计》的总结,有需要高数原教材电子版以及OpenCV、Python基础知识、图像处理原理介绍相关电子资料,或对文章内有有疑问咨询的,请扫博客首页左边二维码加微信公号,根据加微信公号后的自动回复操作。
更多人工智能数学基础请参考专栏《人工智能数学基础》。
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。
对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。
如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。