设x是一个p维随机向量,E(x)=μ,V(x)=Σ>0,c为一整数,试证到μ的马氏距离固定为c的x集合,即
{ x : ( x − μ ) ′ Σ − 1 ( x − μ ) } = c 2 ( 2.3.6 ) \left \{ x:{\left ( x-\mu \right )}' \Sigma ^{-1}\left ( x-\mu \right )\right \}=c^{2} (2.3.6) { x:(x−μ)′Σ−1(x−μ)}=c2(2.3.6)
是一个椭圆(p=2)或椭球面(p=3)或者超椭球面(p>3)。
证明 存在正交矩阵T和对角线元素皆为正的对角矩阵Λ=diag(λ1,λ2,⋯,λp),使得Σ=TΛT′。令y=T′(x−μ),于是
c 2 = { x : ( x − μ ) ′ Σ − 1 ( x − μ ) } c^{2} =\left \{ x:{\left ( x-\mu \right )}' \Sigma ^{-1}\left ( x-\mu \right )\right \} c2={ x:(x−μ)′Σ−1(x−μ)}
= y ′ Λ − 1 y ={y}'\Lambda ^{-1}y =y′Λ−1y
= y 1 2 λ 1 + y 2 2 λ 2 + ⋯ + y p 2 λ p =\frac{y_{1}^{2}}{\lambda_{1}}+\frac{y_{2}^{2}}{\lambda_{2}}+\cdots +\frac{y_{p}^{2}}{\lambda_{p}} =λ1y12+λ2y22+⋯+λpyp2
故(2.3.6)式当p=2时是一个椭圆,当p=3时是一个椭球面,当p>3时是一个超椭球面。
逆矩阵的基本性质: ( A − 1 ) ′ = ( A ′ ) − 1 \left ( A^{-1} \right )^{ {}'}=\left ( {A}' \right )^{-1} (A−1)′=(A′)−1,
若A是正交矩阵,则 A − 1 = A ′ A^{-1}={A}' A−1=A′。
则详细过程换算为:
c 2 = ( x − μ ) ′ Σ − 1 ( x − μ ) c^{2}={\left ( x-\mu \right )}'\Sigma ^{-1}\left ( x-\mu \right ) c2=(x−μ)′Σ−1(x−μ)
= ( x − μ ) ′ ( T Λ T ′ ) − 1 ( x − μ ) ={\left ( x-\mu \right )}'\left ( T\Lambda {T}' \right )^{-1}\left ( x-\mu \right ) =(x−μ)′(TΛT′)−1(x−μ)
= ( x − μ ) ′ ( Λ T ′ ) − 1 T − 1 ( x − μ ) ={\left (x-\mu \right )}'\left ( \Lambda {T}' \right )^{-1}T^{-1}\left ( x-\mu \right ) =(x−μ)′(ΛT′)−1T−1(x−μ)
= [ T − 1 ( x − μ ) ] − 1 Λ − 1 T ′ ( x − μ ) =\left [ T^{-1} \left ( x-\mu \right )\right ]^{-1}\Lambda ^{-1}{T}'\left ( x-\mu \right ) =[T−1(x−μ)]−1Λ−1T′(x−μ)
= y ′ Λ − 1 y ={y}'\Lambda ^{-1}y =y′Λ−1y
= y 1 2 λ 1 + y 2 2 λ 2 + ⋯ + y p 2 λ p =\frac{y_{1}^{2}}{\lambda_{1}}+\frac{y_{2}^{2}}{\lambda_{2}}+\cdots +\frac{y_{p}^{2}}{\lambda_{p}} =λ1y12+λ2y22+⋯+λpyp2
当 Σ = σ 2 I \Sigma =\sigma ^{2}I Σ=σ2I时,(2.3.6)式是圆或者圆球面或者超圆球面。
设 x 1 , x 2 x_{1},x_{2} x1,x2是从均值为 μ \mu μ,协方差矩阵为 Σ \Sigma Σ(>0)的总体 π \pi π中抽取的两个样本( p p p维),则存在正交矩阵T和对角线元素皆为正的对角矩阵 。令y= T ′ x {T}'x T′x= ( y 1 , y 2 , ⋯ , y p ) ′ {\left( y_{1}, y_{2},\cdots , y_{p} \right )}' (y1,y2,⋯,yp)′,也就是几何上对原p维坐标轴作一正交旋转,于是 y 1 = T ′ x 1 = ( y 11 , y 12 , ⋯ , y 1 p ) ′ y_{1}={T}'x_{1}={\left ( y_{11}, y_{12},\cdots , y_{1p} \right )}' y1=T′x1=(y11,y12,⋯,y1p)′和 y 2 = T ′ x 2 = ( y 21 , y 22 , ⋯ , y 2 p ) ′ y_{2}={T}'x_{2}={\left ( y_{21}, y_{22},\cdots , y_{2p} \right )}' y2=T′x2=(y21,y22,⋯,y2p)′为两个样品的新坐标。
由于
V ( y ) = T ′ Λ T = Λ V\left( y \right )= {T}'\Lambda T=\Lambda V(y)=T′ΛT=Λ
故正交旋转后的新坐标 y 1 , y 2 , ⋯ , y p y_{1}, y_{2},\cdots , y_{p} y1,y2,⋯,yp是两两不相关的,这样就可在无变量间相关性的影响下计算欧氏距离。为进一步消除 y 1 , y 2 , ⋯ , y p y_{1}, y_{2},\cdots , y_{p} y1,y2,⋯,yp这件的方差差异影响,计算
y 1 与 y 2 y_{1}与y_{2} y1与y2这件经各分量标准化之后的平方欧式距离,即为
( y 11 − y 21 λ 1 ) 2 + ( y 12 − y 22 λ 2 ) 2 + ⋯ + ( y 1 p − y 2 p λ p ) 2 \left ( \frac{y_{11}-y_{21}}{\sqrt{\lambda _{1}}} \right )^{2}+\left ( \frac{y_{12}-y_{22}}{\sqrt{\lambda _{2}}} \right)^{2}+\cdots +\left ( \frac{y_{1p}-y_{2p}}{\sqrt{\lambda _{p}}} \right)^{2} (λ1y11−y21)2+(λ2y12−y22)2+⋯+(λpy1p−y2p)2
= ( y 1 − y 2 ) ′ Λ − 1 ( y 1 − y 2 ) ={\left ( y_{1}-y_{2} \right )}'\Lambda ^{-1}\left ( y_{1}-y_{2} \right) =(y1−y2)′Λ−1(y1−y2)
= ( T ′ x 1 − T ′ x 2 ) ′ Λ − 1 ( T ′ x 1 − T ′ x 2 ) ={\left ( {T}'x_{1}-{T}'x_{2} \right )}'\Lambda ^{-1}\left ( {T}'x_{1}-{T}'x_{2}\right ) =(T′x1−T′x2)′Λ−1(T′x1−T′x2)
= ( x 1 − x 2 ) ′ Σ − 1 ( x 1 − x 2 ) ={\left ( x_{1}-x_{2} \right )}'\Sigma ^{-1}\left ( x_{1}-x_{2} \right ) =(x1−x2)′Σ−1(x1−x2)
因此设x,y为总体 π \pi π中的两个样品,该总体的均值和协方差矩阵分别为 μ 和 Σ ( > 0 ) \mu和 \Sigma(>0) μ和Σ(>0),则x和y之间的平方马氏距离定义为 d 2 ( x , y ) = ( x − y ) ′ Σ − 1 ( x − y ) d^{2}\left ( x,y \right )={\left ( x-y \right )}'\Sigma ^{-1}\left ( x-y \right ) d2(x,y)=(x−y)′Σ−1(x−y)
X到总体 π \pi π的平方马氏距离定义为
d 2 ( x , π ) = ( x − π ) ′ Σ − 1 ( x − π ) d^{2}\left ( x,\pi \right )={\left ( x-\pi \right )}'\Sigma^{-1}\left ( x-\pi \right ) d2(x,π)=(x−π)′Σ−1(x−π)
总结:这篇文章要用到挺多的LateX公式编辑的,过程中有过放弃,坚持的动力来源于去年参加数学建模比赛的时候认识了LateX公式编辑,真的比Word的公式编辑方便简单美观,第一次编写CSDN文章,最终终于编写完了,有什么不正确的希望可以指正。