概率论:协方差矩阵

一、协方差矩阵

1.1 从方差/协方差到协方差矩阵

根据方差的定义,给定 d d d个随机变量 x k , i = 1 , 2 , . . . , d x_k,i=1,2,...,d xk,i=1,2,...,d,则这些随机变量的方差为:

σ ( x k , x k ) = 1 n − 1 ∑ i = i n ( x k i − x ‾ k ) 2 \sigma(x_k,x_k)={1\over n-1}\sum_{i=i}^n(x_{ki}-\overline{x}_k)^2 σ(xk,xk)=n11i=in(xkixk)2

其中 x k i x_{ki} xki表示随机变量 x k x_k xk中的第 i i i个观测样本, n n n表示样本量,每个随机变量所对应的观测样本数均为 n n n

对于这些随机变量,我们还可以根据协方差的定义,求出两两之间的协方差,即:

σ ( x m , x k ) = 1 n − 1 ∑ i = 1 n ( x m i − x ‾ m ) ( x k i − x ‾ k ) \sigma(x_m,x_k)={1\over n-1}\sum_{i=1}^n(x_{mi}-\overline{x}_m)(x_{ki}-\overline{x}_k) σ(xm,xk)=n11i=1n(xmixm)(xkixk)

为了表示这d个随机变量两两间的相关关系,提出了协方差矩阵的概念,协方差矩阵形式如下:

Σ = [ σ ( x 1 , x 1 ) σ ( x 1 , x 2 ) … σ ( x 1 , x n ) σ ( x 2 , x 1 ) σ ( x 2 , x 2 ) … σ ( x 2 , x n ) ⋮ ⋮ ⋱ ⋮ σ ( x n , x 1 ) σ ( x n , x 2 ) … σ ( x n , x n ) ] ∈ R d × d \Sigma=\begin{bmatrix}\sigma(x_1,x_1)&\sigma(x_1,x_2)&\dots&\sigma(x_1,x_n)\\\sigma(x_2,x_1)&\sigma(x_2,x_2)&\dots&\sigma(x_2,x_n)\\\vdots&\vdots&\ddots&\vdots\\\sigma(x_n,x_1)&\sigma(x_n,x_2)&\dots&\sigma(x_n,x_n)\end{bmatrix}\in R^{d\times d} Σ=σ(x1,x1)σ(x2,x1)σ(xn,x1)σ(x1,x2)σ(x2,x2)σ(xn,x2)σ(x1,xn)σ(x2,xn)σ(xn,xn)Rd×d

其中,对角线上的元素为各个随机变量的方差,非对角线上的元素为两两随机变量之间的协方差,根据协方差的定义,我们可以知道协方差矩阵是一个对称矩阵。

1.2 多元正态分布与线性变换

假设一个向量 x x x服从均值向量为 μ \mu μ、协方差矩阵为 Σ \Sigma Σ的多元正态分布,则:

p ( x ) = 1 2 π Σ e − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) p(x)={1\over\sqrt{2\pi\Sigma}}e^{-{1\over2}(x-\mu)^T\Sigma^{-1}(x-\mu)} p(x)=2πΣ 1e21(xμ)TΣ1(xμ)

令该分布的均值向量为 μ = 0 \mu=0 μ=0,由于指数项外面的系数 ∣ 2 π Σ ∣ − 1 2 |2\pi\Sigma|^{-{1\over2}} 2πΣ21通常是常数,故可将多元正态分布简化为

p ( x ) ∝ e x p ( − 1 2 x T Σ − 1 x ) p(x)\varpropto exp(-{1\over2}x^T\Sigma^{-1}x) p(x)exp(21xTΣ1x)

此时用二元正态分布实例化这个分布,令 x = ( y , z ) T x=(y,z)^T x=(y,z)T,包含两个随机变量 y y y z z z,则协方差矩阵可写成如下形式:

Σ = [ σ ( y , y ) σ ( y , z ) σ ( z , y ) σ ( z , z ) ] ∈ R 2 × 2 \Sigma=\begin{bmatrix}\sigma(y,y)&\sigma(y,z)\\\sigma(z,y)&\sigma(z,z)\end{bmatrix}\in R^{2\times2} Σ=[σ(y,y)σ(z,y)σ(y,z)σ(z,z)]R2×2

假设这个协方差矩阵为单位矩阵,生成若干个随机数如下图所示:
概率论:协方差矩阵_第1张图片
在生成的若干个随机数中,每个点的似然为:

L ( x ) ∝ e x p ( − 1 2 x T x ) L(x)\varpropto exp(-{1\over2}x^Tx) L(x)exp(21xTx)

对上图中的每个点都考虑一步线性变换: t = A ( x ) t=A(x) t=A(x),我们可以得到图二:

你可能感兴趣的:(概率论)