《应用多元统计分析》的马氏距离

《应用多元统计分析》例2.3.1(有用结论)

设x是一个p维随机向量,E(x)=μ,V(x)=Σ>0,c为一整数,试证到μ的马氏距离固定为c的x集合,即
{ x : ( x − μ ) ′ Σ − 1 ( x − μ ) } = c 2 ( 2.3.6 ) \left \{ x:{\left ( x-\mu \right )}' \Sigma ^{-1}\left ( x-\mu \right )\right \}=c^{2} (2.3.6) { x:(xμ)Σ1(xμ)}=c22.3.6
是一个椭圆(p=2)或椭球面(p=3)或者超椭球面(p>3)。

书本的证明过程

 证明   存在正交矩阵T和对角线元素皆为正的对角矩阵Λ=diag(λ1​,λ2​,⋯,λp​),使得Σ=TΛT′。令y=T′(x−μ),于是
c 2 = { x : ( x − μ ) ′ Σ − 1 ( x − μ ) } c^{2} =\left \{ x:{\left ( x-\mu \right )}' \Sigma ^{-1}\left ( x-\mu \right )\right \} c2={ x:(xμ)Σ1(xμ)}

= y ′ Λ − 1 y ={y}'\Lambda ^{-1}y =yΛ1y

= y 1 2 λ 1 + y 2 2 λ 2 + ⋯ + y p 2 λ p =\frac{y_{1}^{2}}{\lambda_{1}}+\frac{y_{2}^{2}}{\lambda_{2}}+\cdots +\frac{y_{p}^{2}}{\lambda_{p}} =λ1y12+λ2y22++λpyp2
故(2.3.6)式当p=2时是一个椭圆,当p=3时是一个椭球面,当p>3时是一个超椭球面。

详细的证明过程补充

逆矩阵的基本性质: ( A − 1 ) ′ = ( A ′ ) − 1 \left ( A^{-1} \right )^{ {}'}=\left ( {A}' \right )^{-1} (A1)=(A)1
若A是正交矩阵,则 A − 1 = A ′ A^{-1}={A}' A1=A
则详细过程换算为:

c 2 = ( x − μ ) ′ Σ − 1 ( x − μ ) c^{2}={\left ( x-\mu \right )}'\Sigma ^{-1}\left ( x-\mu \right ) c2=(xμ)Σ1(xμ)

= ( x − μ ) ′ ( T Λ T ′ ) − 1 ( x − μ ) ={\left ( x-\mu \right )}'\left ( T\Lambda {T}' \right )^{-1}\left ( x-\mu \right ) =(xμ)(TΛT)1(xμ)

= ( x − μ ) ′ ( Λ T ′ ) − 1 T − 1 ( x − μ ) ={\left (x-\mu \right )}'\left ( \Lambda {T}' \right )^{-1}T^{-1}\left ( x-\mu \right ) =(xμ)(ΛT)1T1(xμ)

= [ T − 1 ( x − μ ) ] − 1 Λ − 1 T ′ ( x − μ ) =\left [ T^{-1} \left ( x-\mu \right )\right ]^{-1}\Lambda ^{-1}{T}'\left ( x-\mu \right ) =[T1(xμ)]1Λ1T(xμ)

= y ′ Λ − 1 y ={y}'\Lambda ^{-1}y =yΛ1y

= y 1 2 λ 1 + y 2 2 λ 2 + ⋯ + y p 2 λ p =\frac{y_{1}^{2}}{\lambda_{1}}+\frac{y_{2}^{2}}{\lambda_{2}}+\cdots +\frac{y_{p}^{2}}{\lambda_{p}} =λ1y12+λ2y22++λpyp2

拓展

Σ = σ 2 I \Sigma =\sigma ^{2}I Σ=σ2I时,(2.3.6)式是圆或者圆球面或者超圆球面。

最后认识一下平方马氏距离的推导过程:

x 1 , x 2 x_{1},x_{2} x1x2是从均值为 μ \mu μ,协方差矩阵为 Σ \Sigma Σ(>0)的总体 π \pi π中抽取的两个样本( p p p维),则存在正交矩阵T和对角线元素皆为正的对角矩阵 。令y= T ′ x {T}'x Tx= ( y 1 , y 2 , ⋯   , y p ) ′ {\left( y_{1}, y_{2},\cdots , y_{p} \right )}' (y1,y2,,yp),也就是几何上对原p维坐标轴作一正交旋转,于是 y 1 = T ′ x 1 = ( y 11 , y 12 , ⋯   , y 1 p ) ′ y_{1}={T}'x_{1}={\left ( y_{11}, y_{12},\cdots , y_{1p} \right )}' y1=Tx1=(y11,y12,,y1p) y 2 = T ′ x 2 = ( y 21 , y 22 , ⋯   , y 2 p ) ′ y_{2}={T}'x_{2}={\left ( y_{21}, y_{22},\cdots , y_{2p} \right )}' y2=Tx2=(y21,y22,,y2p)为两个样品的新坐标。
由于

V ( y ) = T ′ Λ T = Λ V\left( y \right )= {T}'\Lambda T=\Lambda V(y)=TΛT=Λ

故正交旋转后的新坐标 y 1 , y 2 , ⋯   , y p y_{1}, y_{2},\cdots , y_{p} y1,y2,,yp是两两不相关的,这样就可在无变量间相关性的影响下计算欧氏距离。为进一步消除 y 1 , y 2 , ⋯   , y p y_{1}, y_{2},\cdots , y_{p} y1,y2,,yp这件的方差差异影响,计算
y 1 与 y 2 y_{1}与y_{2} y1y2这件经各分量标准化之后的平方欧式距离,即为
( y 11 − y 21 λ 1 ) 2 + ( y 12 − y 22 λ 2 ) 2 + ⋯ + ( y 1 p − y 2 p λ p ) 2 \left ( \frac{y_{11}-y_{21}}{\sqrt{\lambda _{1}}} \right )^{2}+\left ( \frac{y_{12}-y_{22}}{\sqrt{\lambda _{2}}} \right)^{2}+\cdots +\left ( \frac{y_{1p}-y_{2p}}{\sqrt{\lambda _{p}}} \right)^{2} (λ1 y11y21)2+(λ2 y12y22)2++(λp y1py2p)2

= ( y 1 − y 2 ) ′ Λ − 1 ( y 1 − y 2 ) ={\left ( y_{1}-y_{2} \right )}'\Lambda ^{-1}\left ( y_{1}-y_{2} \right) =(y1y2)Λ1(y1y2)

= ( T ′ x 1 − T ′ x 2 ) ′ Λ − 1 ( T ′ x 1 − T ′ x 2 ) ={\left ( {T}'x_{1}-{T}'x_{2} \right )}'\Lambda ^{-1}\left ( {T}'x_{1}-{T}'x_{2}\right ) =(Tx1Tx2)Λ1(Tx1Tx2)

= ( x 1 − x 2 ) ′ Σ − 1 ( x 1 − x 2 ) ={\left ( x_{1}-x_{2} \right )}'\Sigma ^{-1}\left ( x_{1}-x_{2} \right ) =(x1x2)Σ1(x1x2)

因此设x,y为总体 π \pi π中的两个样品,该总体的均值和协方差矩阵分别为 μ 和 Σ ( > 0 ) \mu和 \Sigma(>0) μΣ>0,则x和y之间的平方马氏距离定义为 d 2 ( x , y ) = ( x − y ) ′ Σ − 1 ( x − y ) d^{2}\left ( x,y \right )={\left ( x-y \right )}'\Sigma ^{-1}\left ( x-y \right ) d2(x,y)=(xy)Σ1(xy)

X到总体 π \pi π的平方马氏距离定义为

d 2 ( x , π ) = ( x − π ) ′ Σ − 1 ( x − π ) d^{2}\left ( x,\pi \right )={\left ( x-\pi \right )}'\Sigma^{-1}\left ( x-\pi \right ) d2(x,π)=(xπ)Σ1(xπ)

总结:这篇文章要用到挺多的LateX公式编辑的,过程中有过放弃,坚持的动力来源于去年参加数学建模比赛的时候认识了LateX公式编辑,真的比Word的公式编辑方便简单美观,第一次编写CSDN文章,最终终于编写完了,有什么不正确的希望可以指正。

你可能感兴趣的:(抽象代数)