矩阵篇(四)-- 实随机向量的相关矩阵、协方差矩阵、相关系数

        观测数据和加性噪声通常取随机变量。由随机变量组成的向量称为随机向量,也可以称作多维随机变量。

1 随机向量

        描述随机向量的统计函数有累积分布函数、概率密度函数、均值函数和协方差函数等。

        一个含有 m m m 个随机变量的实值向量
x ( ξ ) = [ x 1 ( ξ ) , ⋯   , x m ( ξ ) ] T (1-1) \pmb{x}(\xi) = [x_1(\xi), \cdots, x_m(\xi)]^T \tag{1-1} xx(ξ)=[x1(ξ),,xm(ξ)]T(1-1)

        称为 m × 1 m \times 1 m×1 实随机向量,或简称随机向量(当维数无关紧要时)。其中, ξ \xi ξ 表示样本点,例如它可以是时间 t t t,圆频率 f f f,角频率 w w w 或位置 s s s 等。

1.1 概率密度函数

        一个随机向量所有元素的联合累积分布函数常用符号 F x ( x 1 , ⋯   , x m ) F_{\boldsymbol{x}}(x_1, \cdots,x_m) Fx(x1,,xm) 表示,联合概率密度函数常用 f x ( x 1 , ⋯   , x m ) f_{\boldsymbol{x}}(x_1, \cdots,x_m) fx(x1,,xm) 表示。为了简化,令 F ( x ) = F x ( x 1 , ⋯   , x m ) F(\pmb{x}) = F_{\boldsymbol{x}}(x_1, \cdots,x_m) F(xx)=Fx(x1,,xm) f ( x ) = f x ( x 1 , ⋯   , x m ) f(\pmb{x}) =f_{\boldsymbol{x}}(x_1, \cdots,x_m) f(xx)=fx(x1,,xm)。一个随机向量由它的联合累积分布函数或联合概率密度函数完全描述。

        随机向量 x ( ξ ) \pmb{x}(\xi) xx(ξ) 的联合累积分布函数为:
F ( x ) = d e f P { ξ : x 1 ( ξ ) ≤ x 1 , ⋯   , x m ( ξ ) ≤ x m } (1-2) F(\pmb{x}) \overset{def}{=} P\{\xi: x_1(\xi)\leq x_1, \cdots, x_m(\xi)\leq x_m\} \tag{1-2} F(xx)=defP{ξ:x1(ξ)x1,,xm(ξ)xm}(1-2)
        随机向量 x ( ξ ) \pmb{x}(\xi) xx(ξ) 的联合概率密度函数为:
f ( x ) = d e f lim ⁡ Δ x 1 → 0 , ⋯   , Δ x m → 0 P { ξ : x 1 < x 1 ( ξ ) ≤ x 1 + Δ x 1 , ⋯   , x m < x m ( ξ ) ≤ x m + Δ x m } Δ x 1 ⋯ Δ x m = ∂ m ∂ x 1 ⋯ ∂ x m F x ( x 1 , ⋯   , x m ) (1-3) f(\pmb{x}) \overset{def}{=} \lim_{\Delta x_1 \to 0,\cdots, \Delta x_m \to 0} \frac{P\{\xi: x_1 < x_1(\xi) \leq x_1+\Delta x_1, \cdots, x_m < x_m(\xi) \leq x_m + \Delta x_m\}}{\Delta x_1 \cdots \Delta x_m} \\ = \frac{\partial ^m}{\partial x_1 \cdots \partial x_m}F_{\boldsymbol{x}}(x_1, \cdots,x_m) \tag{1-3} f(xx)=defΔx10,,Δxm0limΔx1ΔxmP{ξ:x1<x1(ξ)x1+Δx1,,xm<xm(ξ)xm+Δxm}=x1xmmFx(x1,,xm)(1-3)
        若对于 m m m 个事件 { x 1 ( ξ ) ≤ x 1 } ⋯   , { x m ( ξ ) ≤ x m } \{x_1(\xi)\leq x_1\} \cdots, \{x_m(\xi)\leq x_m\} {x1(ξ)x1},{xm(ξ)xm} 有概率关系,
P { ξ : x 1 ( ξ ) ≤ x 1 , ⋯   , x m ( ξ ) ≤ x m } = P { ξ : x 1 ( ξ ) ≤ x 1 } ⋯ P { x m ( ξ ) ≤ x m } (1-4) P\{\xi: x_1(\xi)\leq x_1, \cdots, x_m(\xi)\leq x_m\} = P\{\xi: x_1(\xi)\leq x_1\}\cdots P\{x_m(\xi)\leq x_m\} \tag{1-4} P{ξ:x1(ξ)x1,,xm(ξ)xm}=P{ξ:x1(ξ)x1}P{xm(ξ)xm}(1-4)
        则随机变量 ξ : x 1 ( ξ ) ≤ x 1 , ⋯   , x m ( ξ ) ≤ x m \xi: x_1(\xi)\leq x_1, \cdots, x_m(\xi)\leq x_m ξ:x1(ξ)x1,,xm(ξ)xm 称为独立。
        所以,
F ( x ) = F x ( x 1 , ⋯   , x m ) = F x 1 ( x 1 ) ⋯ F x m ( x m ) f ( x ) = f x ( x 1 , ⋯   , x m ) = f x 1 ( x 1 ) ⋯ f x m ( x m ) (1-5) F(\pmb{x}) = F_{\boldsymbol{x}}(x_1, \cdots,x_m) = F_{x_1}(x_1)\cdots F_{x_m}(x_m) \\ f(\pmb{x}) = f_{\boldsymbol{x}}(x_1, \cdots,x_m) = f_{x_1}(x_1)\cdots f_{x_m}(x_m) \tag{1-5} F(xx)=Fx(x1,,xm)=Fx1(x1)Fxm(xm)f(xx)=fx(x1,,xm)=fx1(x1)fxm(xm)(1-5)

         m m m 个随机变量的联合分布函数(或联合概率密度函数)等于各个随机变量的边缘分布函数(或边缘概率密度函数)之积,则这 m m m 个随机变量是联合独立的。

1.2 随机向量的统计描述

1.2.1 均值向量

        随机向量的最重要的统计运算为数学期望。令随机变量 x i ( ξ ) x_i(\xi) xi(ξ) 的均值 E { x i ( ξ ) } = μ i E\{x_i(\xi)\}=\mu_i E{xi(ξ)}=μi,则随机向量的数学期望称为均值向量,记作 μ x \pmb{\mu_x} μxμx,定义为
μ x = E { x ( ξ ) } = [ E { x 1 ( ξ ) } ⋮ E { x m ( ξ ) } ] = [ μ 1 ⋮ μ m ] (1-6) \pmb{\mu_x} = E\{x(\xi)\}= \begin{bmatrix} E\{x_1(\xi)\} \\ \vdots \\ E\{x_m(\xi)\} \end{bmatrix} = \begin{bmatrix} \mu_1 \\ \vdots \\ \mu_m \end{bmatrix} \tag{1-6} μxμx=E{x(ξ)}= E{x1(ξ)}E{xm(ξ)} = μ1μm (1-6)

1.2.2 相关矩阵

1. 自相关矩阵
        均值向量是随机向量的一阶矩,它描述随机向量的元素围绕其均值的散布情况。与均值向量不同,随机向量的二阶矩为矩阵,它描述随机向量分布的散布情况。

        随机向量的自相关矩阵定义为该向量与自身的外积的数学期望
R x = d e f E { x ( ξ ) x H ( ξ ) } = [ r 11 ⋯ r 1 m ⋮ ⋱ ⋯ r m 1 ⋯ r m m ] (1-7) \begin{aligned} \pmb{R}_{\boldsymbol{x}} \overset{def}{=}E\{\pmb{x}(\xi){\pmb{x}}^H(\xi)\} = \begin{bmatrix} r_{11} & \cdots & r_{1m} \\ \vdots & \ddots & \cdots \\ r_{m1} & \cdots & r_{mm} \end{bmatrix} \end{aligned} \tag{1-7} RRx=defE{xx(ξ)xxH(ξ)}= r11rm1r1mrmm (1-7)
        式中, r i i , i = 1 , ⋯   , m r_{ii}, i=1, \cdots, m rii,i=1,,m 表示随机变量 x i ( ξ ) x_i(\xi) xi(ξ) 的自相关系数,定义为
r i i = d e f E { ∣ x i ( ξ ) ∣ 2 } , i = 1 , ⋯   , m (1-8) r_{ii}\overset{def}{=} E\{|x_i(\xi)|^2\}, i=1, \cdots, m \tag{1-8} rii=defE{xi(ξ)2},i=1,,m(1-8)
        而 r i j r_{ij} rij 表示随机变量 x i ( ξ ) x_i(\xi) xi(ξ) x j ( ξ ) x_j(\xi) xj(ξ) 之间的互相关函数,定义为
r i j = d e f E { x i ( ξ ) x j ( ξ ) } , i , j = 1 , ⋯   , m , i ≠ j (1-9) r_{ij}\overset{def}{=} E\{x_i(\xi)x_j(\xi)\}, i, j=1, \cdots, m, i \not= j \tag{1-9} rij=defE{xi(ξ)xj(ξ)},i,j=1,,m,i=j(1-9)

        显然,自相关矩阵是对称的。

2. 互相关矩阵
        推广自相关矩阵的概念,则有随机变量的互相关矩阵
R x y = d e f E { x ( ξ ) y H ( ξ ) } = [ r x 1 , y 1 ⋯ r x 1 , y m ⋮ ⋱ ⋯ r x m , y 1 ⋯ r x m , y m ] (1-10) \begin{aligned} \pmb{R}_{\boldsymbol{xy}} \overset{def}{=}E\{\pmb{x}(\xi){\pmb{y}}^H(\xi)\} = \begin{bmatrix} r_{x_1,y_1} & \cdots & r_{x_1,y_m} \\ \vdots & \ddots & \cdots \\ r_{x_m,y_1} & \cdots & r_{x_m,y_m} \end{bmatrix} \end{aligned} \tag{1-10} RRxy=defE{xx(ξ)yyH(ξ)}= rx1,y1rxm,y1rx1,ymrxm,ym (1-10)
        式中, r x i , y j = d e f E { x i ( ξ ) y j ( ξ ) } r_{x_i,y_j}\overset{def}{=}E{\{x_i(\xi)y_j(\xi)\}} rxi,yj=defE{xi(ξ)yj(ξ)} 是随机变量 x i ( ξ ) x_i(\xi) xi(ξ) y j ( ξ ) y_j(\xi) yj(ξ) 之间的互相关。

1.2.3 协方差矩阵

1. 自协方差矩阵
        随机向量 x ( ξ ) \pmb{x}(\xi) xx(ξ) 的自协方差矩阵记为 C x \pmb{C_{x}} CxCx,定义为:
C x = C o v ( x , x ) = d e f E { [ x ( ξ ) − μ x ] [ x ( ξ ) − μ x ] T } = [ c 11 ⋯ c 1 m ⋮ ⋱ ⋯ c m 1 ⋯ c m m ] (1-11) \pmb{C_{x}} = Cov(\pmb{x}, \pmb{x}) \overset{def}{=} E\{[\pmb{x}(\xi)-\pmb{\mu_x}][{\pmb{x}(\xi)}-\pmb{\mu_x}]^T\} = \begin{bmatrix} c_{11} & \cdots & c_{1m} \\ \vdots & \ddots & \cdots \\ c_{m1} & \cdots & c_{mm} \end{bmatrix} \tag{1-11} CxCx=Cov(xx,xx)=defE{[xx(ξ)μxμx][xx(ξ)μxμx]T}= c11cm1c1mcmm (1-11)
        式子中,主对角线元素,
c i i = d e f E { ∣ x i ( ξ ) − μ i ∣ 2 } , i = 1 , ⋯   , m (1-12) c_{ii}\overset{def}{=} E\{|x_i(\xi)-\mu_i|^2\}, i=1, \cdots, m \tag{1-12} cii=defE{xi(ξ)μi2},i=1,,m(1-12)
        表示随机变量 x i ( ξ ) x_i(\xi) xi(ξ) 的方差 σ i 2 \sigma_i^2 σi2,即 c i i = σ i 2 c_{ii}=\sigma_i^2 cii=σi2,而非主对角线元素
c i j = d e f E { [ x i ( ξ ) − μ i ] [ x j ( ξ ) − μ j ] } , i , j = 1 , ⋯   , m , i ≠ j (1-13) c_{ij}\overset{def}{=} E\{[x_i(\xi)-\mu_i][x_j(\xi)-\mu_j]\}, i, j=1, \cdots, m, i \not= j \tag{1-13} cij=defE{[xi(ξ)μi][xj(ξ)μj]},i,j=1,,m,i=j(1-13)

        表示随机变量 x i ( ξ ) x_i(\xi) xi(ξ) x j ( ξ ) x_j(\xi) xj(ξ) 之间的协方差,也是对称矩阵。

        自协方差矩阵有时也称为方差矩阵,用符号 V a r ( x ) Var(\pmb{x}) Var(xx) 表示,即有 V a r ( x ) = E { [ x ( ξ ) − μ x ] [ x ( ξ ) − μ x ] T } Var(\pmb{x})=E\{[\pmb{x}(\xi)-\pmb{\mu_x}][{\pmb{x}(\xi)}-\pmb{\mu_x}]^T\} Var(xx)=E{[xx(ξ)μxμx][xx(ξ)μxμx]T}。显然, V a r ( x ) = C o v ( x , x ) Var(\pmb{x})=Cov(\pmb{x}, \pmb{x}) Var(xx)=Cov(xx,xx)

        自相关矩阵和自协方差矩阵之间存在下列关系
C x = R x − μ x μ x T (1-14) \pmb{C_{x}} = \pmb{R_{x}} - \pmb{\mu_{x}}\pmb{\mu_{x}}^T\tag{1-14} CxCx=RxRxμxμxμxμxT(1-14)

2. 互协方差矩阵
C x y = C o v ( x , x ) = d e f E { [ x ( ξ ) − μ x ] [ y ( ξ ) − μ x ] T } = [ c x 1 , y 1 ⋯ c x 1 , y m ⋮ ⋱ ⋯ c x m , y 1 ⋯ c x m , y m ] (1-15) \pmb{C_{xy}} = Cov(\pmb{x}, \pmb{x}) \overset{def}{=} E\{[\pmb{x}(\xi)-\pmb{\mu_x}][{\pmb{y}(\xi)}-\pmb{\mu_x}]^T\} = \begin{bmatrix} c_{x_1, y_1} & \cdots & c_{x_1, y_m} \\ \vdots & \ddots & \cdots \\ c_{x_m, y_1} & \cdots & c_{x_m, y_m} \end{bmatrix} \tag{1-15} CxyCxy=Cov(xx,xx)=defE{[xx(ξ)μxμx][yy(ξ)μxμx]T}= cx1,y1cxm,y1cx1,ymcxm,ym (1-15)
        式中, c x i , y j = d e f E { [ x i ( ξ ) − μ x i ] [ y j ( ξ ) − μ y j ] } c_{x_i,y_j}\overset{def}{=}E{\{[x_i(\xi)-\mu_{x_i}][y_j(\xi)-\mu_{y_j}]\}} cxi,yj=defE{[xi(ξ)μxi][yj(ξ)μyj]} 是随机变量 x i ( ξ ) x_i(\xi) xi(ξ) y j ( ξ ) y_j(\xi) yj(ξ) 之间的互协方差。

        易知,互协方差矩阵与互相关矩阵之间存在下列关系
C x y = R x y − μ x μ y T (1-16) \pmb{C_{xy}} = \pmb{R_{xy}} - \pmb{\mu_{x}}\pmb{\mu_{y}}^T \tag{1-16} CxyCxy=RxyRxyμxμxμyμyT(1-16)

        一个实随机向量的自相关矩阵和自协方差矩阵均为实对称方阵,而两个维数不同的实随机向量的互相关矩阵和互协方差矩阵是非方阵。即使随机向量 x ( ξ ) \pmb{x}(\xi) xx(ξ) y ( ξ ) \pmb{y}(\xi) yy(ξ) 维数相同,互相关矩阵和互协方差矩阵为方阵,它们也不是对称的。

        自协方差矩阵与互协方差矩阵的以下性质:
        (1)自协方差矩阵是转置对称的,即有 [ V a r ( x ) ] T = V a r ( x ) [Var(\pmb{x})]^T=Var(\pmb{x}) [Var(xx)]T=Var(xx)
        (2)线性组合向量 A x + b \pmb{Ax}+\pmb{b} AxAx+bb 的自协方差矩阵 V a r ( A x + b ) = V a r ( A x ) = A V a r ( x ) A T Var(\pmb{Ax}+\pmb{b})=Var(\pmb{Ax})= \pmb{A}Var(\pmb{x})\pmb{A}^T Var(AxAx+bb)=Var(AxAx)=AAVar(xx)AAT
        (3)互协方差矩阵不是转置对称的,但满足 C o v ( x , y ) = [ C o v ( y , x ) ] T Cov(\pmb{x}, \pmb{y}) = [Cov(\pmb{y}, \pmb{x})]^T Cov(xx,yy)=[Cov(yy,xx)]T
        (4) C o v ( x 1 + x 2 , y ) = C o v ( x 1 , y ) + C o v ( x 2 , y ) Cov(\pmb{x}_1+ \pmb{x}_2 ,\pmb{y})= Cov(\pmb{x}_1 ,\pmb{y}) +Cov(\pmb{x}_2 ,\pmb{y}) Cov(xx1+xx2,yy)=Cov(xx1,yy)+Cov(xx2,yy)
        (5)若 x \pmb{x} xx y \pmb{y} yy 具有相同的维数,则 V a r ( x + y ) = V a r ( x ) + C o v ( x , y ) + C o v ( y , x ) + V a r ( y ) Var(\pmb{x}+ \pmb{y}) = Var(\pmb{x}) + Cov(\pmb{x}, \pmb{y}) +Cov(\pmb{y}, \pmb{x}) +Var(\pmb{y}) Var(xx+yy)=Var(xx)+Cov(xx,yy)+Cov(yy,xx)+Var(yy)
        (6) C o v ( A x , B y ) = A C o v ( x , y ) B T Cov(\pmb{Ax}, \pmb{By})=\pmb{A}Cov(\pmb{x}, \pmb{y})\pmb{B}^T Cov(AxAx,ByBy)=AACov(xx,yy)BBT

1.2.4 两个随机向量的统计不相关与正交

        两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 之间的相关系数定义为:
ρ x y = d e f c x y E { ∣ x ( ξ ) ∣ 2 } E { ∣ y ( ξ ) ∣ 2 } = c x y σ x σ y (1-17) \rho_{xy}\overset{def}{=} \frac{c_{xy}}{\sqrt{E\{|x(\xi)|^2\}E\{|y(\xi)|^2\}}}=\frac{c_{xy}}{\sigma_x\sigma_y}\tag{1-17} ρxy=defE{x(ξ)2}E{y(ξ)2} cxy=σxσycxy(1-17)

        式中, c x y c_{xy} cxy 是随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 之间的互协方差,而 σ x 2 \sigma_x^2 σx2 σ y 2 \sigma_y^2 σy2 分别是 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 的方差。对相关系数的定义公式使用Cauchy-Schwartz不等式,易知
0 ≤ ∣ ρ x y ∣ ≤ 1 (1-18) 0\leq|\rho_{xy}|\leq1\tag{1-18} 0ρxy1(1-18)

        相关系数 ρ x y \rho_{xy} ρxy 给出了两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 之间的相似程度的度量; ρ x y \rho_{xy} ρxy 越接近于零,随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 的相似度越弱;反之,若 ρ x y \rho_{xy} ρxy 越接近于1,则 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 的相似度越大。特别地,相关系数的两个极端值0和1有着重要的意义。

         ρ x y = 0 \rho_{xy}=0 ρxy=0 意味着互协方差 c x y = 0 c_{xy}=0 cxy=0,这表明随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 之间不存在任何相关部分。因此,若 ρ x y = 0 \rho_{xy}=0 ρxy=0 ,则称随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 不相关。鉴于这种不相关是在统计意义下定义的,所以常称之为统计不相关。

        将两个随机变量之间的不相关条件 c x y = 0 , i , j ≠ 0 c_{xy}=0,i,j \not=0 cxy=0i,j=0 加以推广,立即得到 m × 1 m \times 1 m×1 随机向量 x ( ξ ) \pmb{x}(\xi) xx(ξ) n × 1 n \times 1 n×1 随机向量 y ( ξ ) \pmb{y}(\xi) yy(ξ) 统计不相关定义如下。

        若 m × 1 m \times 1 m×1 随机向量 x ( ξ ) x(\xi) x(ξ) n × 1 n \times 1 n×1 随机向量 y ( ξ ) y(\xi) y(ξ) 统计不相关,则它们的互协方差矩阵等于零矩阵,即 C x y = 0 m × n \pmb{C_{xy}}=\pmb{0}_{m\times n} CxyCxy=00m×n

        两个随机变量 x ( ξ ) x(\xi) x(ξ) y ( ξ ) y(\xi) y(ξ) 称为正交,若它们的互相关等于零,即
r x y = E { x ( ξ ) y ( ξ ) } = 0 (1-19) r_{xy} = E\{x(\xi)y(\xi)\}=0\tag{1-19} rxy=E{x(ξ)y(ξ)}=0(1-19)

        类似地,两个随机向量 x ( ξ ) = [ x 1 ( ξ ) , ⋯   , x m ( ξ ) ] T \pmb{x}(\xi) = [x_1(\xi), \cdots, x_m(\xi)]^T xx(ξ)=[x1(ξ),,xm(ξ)]T y ( ξ ) = [ y 1 ( ξ ) , ⋯   , y n ( ξ ) ] T \pmb{y}(\xi) = [y_1(\xi), \cdots, y_n(\xi)]^T yy(ξ)=[y1(ξ),,yn(ξ)]T 称为正交,若 x ( ξ ) \pmb{x}(\xi) xx(ξ) 的任一元素 x i ( ξ ) x_i(\xi) xi(ξ) 与随机向量 y ( ξ ) \pmb{y}(\xi) yy(ξ) 的任一元素 y j ( ξ ) y_j(\xi) yj(ξ) 正交,

        即 r x i , y j = E { x i ( ξ ) y j ( ξ ) } = 0 , i = 1 , ⋯   , m ; j = 1 , ⋯   , n r_{x_i,y_j}=E\{x_i(\xi)y_j(\xi)\} =0, i=1,\cdots, m;j=1,\cdots,n rxi,yj=E{xi(ξ)yj(ξ)}=0,i=1,,m;j=1,,n。显然,这意味着这两个随机向量的互相关矩阵等于零矩阵,即有 R x y = 0 m × n \pmb{R_{xy}}=\pmb{0}_{m\times n} RxyRxy=00m×n

        若 m × 1 m \times 1 m×1 随机向量 x ( ξ ) \pmb{x}(\xi) xx(ξ) n × 1 n \times 1 n×1 随机向量 y ( ξ ) \pmb{y}(\xi) yy(ξ) 正交,则它们的互相关矩阵等于零矩阵,即 R x y = 0 m × n \pmb{R_{xy}}=\pmb{0}_{m\times n} RxyRxy=00m×n

        对比互协方差矩阵和互相关矩阵的定义知,若随机向量 x ( ξ ) \pmb{x}(\xi) xx(ξ) y ( ξ ) \pmb{y}(\xi) yy(ξ) 均具有零均值向量,则 C x y = R x y \pmb{C_{xy}}=\pmb{R_{xy}} CxyCxy=RxyRxy。因此,对于分别具有零均值向量的两个随机向量而言,它们之间的统计不相关与正交是等价的。

你可能感兴趣的:(数学基础,矩阵,线性代数,相关矩阵,协方差矩阵,相关系数)