2.3.1 条件高斯分布

多元高斯的一个重要性质: 若果两组变量是联合高斯分布,那以一组变量维条件,另一组变量同样是高斯分布。类似的,任何一个变量的边缘分布也是高斯分布

首先来考虑条件概率的情形,本章的重要结论是得出条件高斯分布的的均值和协方差的表达式为:


假设是一个服从高斯分布的D维向量。我们将划分为两个不相交的子集,。这样我们令为的前个分量,为的后个分量,有

同样均值向量为

协方差矩阵为

\Sigma=\begin{bmatrix} {\Sigma_{aa}}&{\Sigma_{ab}}\\ {\Sigma_{ba}}&{\Sigma_{bb}} \end{bmatrix}\\ 其中由于\Sigma的对称性,\Sigma_{aa},\Sigma_{bb}都是对称的,而\Sigma_{ab}^T = \Sigma_{ba}


在这引入精度矩阵,精度矩阵是协方差的逆矩阵,高斯分布的一些性质可以使用精度矩阵来表示,对于向量,其划分形式为
\wedge_=\begin{bmatrix} {\wedge_{aa}}&{\wedge_{ab}}\\ {\wedge_{ba}}&{\wedge_{bb}} \end{bmatrix}\\ 其中对称矩阵的逆矩阵也是对称矩阵,\wedge_{aa},\wedge_{bb}都是对称的,而\wedge_{ab}^T = \wedge_{ba}。\\需要强调的是,\wedge_{aa}并非简单对\Sigma_{aa}求逆,后面会详细讲到


以下为证明

  1. 寻找条件概率的表达式,将上一章高斯分布指数项给出的二次型公式,结合本章的公式可以得出:
    -\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu) = \\ -\frac{1}{2}(x_a-\mu_a)^T\wedge_{aa}(x_a-\mu_a)-\frac{1}{2}(x_a-\mu_b)^T\wedge_{ab}(x_a-\mu_b)\\ -\frac{1}{2}(x_b-\mu_a)^T\wedge_{ba}(x_b-\mu_a)-\frac{1}{2}(x_b-\mu_b)^T\wedge_{bb}(x_b-\mu_b)
    从上面的公式来找到的均值和协方差的表达式

  2. 同时,高斯分布的指数项的完全平方可以写成一般形式

    一般形式下,的二阶项的系数矩阵为协方差的逆矩阵,线性项的系数等于,从而求得协方差矩阵和均值,常数项表示于无关的项

  3. 将上面的公式应用到高斯分布,将该分布的均值和方差记作和,将当作常量。
    a. 首先我们找出所有的二阶项(注意等均为常量),有

    显而易见

    b.然后我们考虑的一阶项
    -\frac{1}{2}(x_a-\mu_a)^T\wedge_{aa}(x_a-\mu_a)得到x_a^T\wedge_{aa}\mu_a\\ -\frac{1}{2}(x_a-\mu_b)^T\wedge_{ab}(x_a-\mu_b)得到-\frac{1}{2}(x_a^T\wedge_{ab}x_b-x_a^T\wedge_{ab}\mu_b)\\ -\frac{1}{2}(x_b-\mu_a)^T\wedge_{ba}(x_b-\mu_a)得到-\frac{1}{2}(x_b^T\wedge_{ba}x_a-\mu_b^T\wedge_{ba}x_a)\\ 利用\wedge_{ba}^T = \wedge_{ab},a^T M b = b^TM^Ta的运算法则,可以得到一阶项为\\ a^T(\wedge_{aa}\mu_a-\wedge_{ab}(x_b-\mu_b))
    结合可知


初步结论


初步结论的结果是使用分块精度矩阵来表达的,下面换成分块协方差矩阵来表达。

对于分块矩阵的逆矩阵有恒等式
\begin{bmatrix} {A}&{B}\\ {C}&{D} \end{bmatrix}^{-1} =\begin{bmatrix} {M}&{-MBD^{-1}}\\ {-D^{-1}CM}&{D^{-1}+D^{-1}CMBD^{-1}} \end{bmatrix}\\ 其中M=(A-BD^{-1}C)^{-1},M^{-1}为左侧矩阵关于子矩阵D的舒尔补

使用该恒等式,有

可以得到

另外,条件概率分布的均值是的线性函数,协方差与无关,这是线性高斯模型的一个例子

你可能感兴趣的:(2.3.1 条件高斯分布)