椭球方程的矩阵形式

为了简便起见,这里的椭球指的是椭球面,如果还要包含椭球内部,则将等于号改为小于等于即可。

标准椭球方程的几何意义

考虑一个二维平面上的椭球方程(此时就是一个椭圆方程)是其在坐标轴上的半轴分别是。事实上,椭圆(椭球)可以被看作是一个单位圆(单位球)在坐标轴上进行伸缩后得到的几何图形:假设我们对坐标单位进行拉伸,坐标轴上的单位长度从分别改成,由此形成一个新的矩形坐标系,新坐标系的坐标在原坐标系的坐标是,于是,上面的椭圆方程实际上就是新坐标系中的一个单位圆
对于空间中的一个标准直角坐标系的椭球同样可以视作是一个新坐标系下的单位球,这个坐标系是将原标准直角坐标系的三个坐标轴的单位长度从分别改成而得到的。

现在我们给出一个空间中在标准直角坐标系的一个标准椭球的方程,其在坐标轴方向的半轴长是:若记对角矩阵和坐标向量分别是则上面的标准椭球方程是但是该椭球方程仅仅表示中心点在原点、伸缩方向沿标准直角坐标系的坐标轴的椭球,要表示一个任意的椭球,需要使用坐标系的变换 。

正交矩阵和坐标系旋转

考虑的标准单位正交基,现在将这个坐标系按原点进行任意旋转,得到一个新的坐标系。设原来的单位正交向量经旋转变为,则可以得到新坐标系的单位标准正交基。我们可以用将表示出来或者使用矩阵形式写出也即设空间中任意一个点,它在和这两个坐标系中的坐标分别是和,因为无论如何选取坐标系,点在空间的位置是不会发生变化的,于是就应该有因为且是可逆矩阵,因此有如果将矩阵写成列向量形式,则有。因为彼此单位正交,这就意味着则\begin{split} A^TA&=\begin{bmatrix}a^T_1\\a^T_2\\\vdots\\a^T_n\end{bmatrix}[a_1,a_2,\dotsc,a_n]\\ &=\begin{bmatrix}a_1^Ta_1&a_1^Ta_2&\cdots&a_1^Ta_n\\ a_2^Ta_1&a_2^Ta_2&\cdots&a_2^Ta_n\\ \vdots&\vdots&\ddots&\vdots\\ a_n^Ta_1&a_n^Ta_2&\cdots&a_n^Ta_n \end{bmatrix}\\ &=\begin{bmatrix}1&0&\cdots&0\\0&1&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&1\end{bmatrix}=E_n \end{split}即是可逆矩阵,且,可见是正交矩阵(同样也是正交矩阵)。于是我们有这个等式的意义是,将一个标准直角坐标系绕原点任意旋转后,坐标从变为,两个坐标之间的关系。如果将标准直角坐标系任意旋转,得到两个坐标系,对应的正交矩阵是,则在标准直角坐标系下坐标为的点在两个坐标系的下的坐标分别是,应当满足关系消去,就有易证明,两个正交矩阵的乘积仍然是正交矩阵,于是我们得出结论:空间中任意单位正交坐标系绕原点旋转后形成新的坐标系,同一个点在两个坐标系下的坐标可以使用一个正交矩阵来联系

任意椭球的矩阵方程

我们讨论的椭球方程是以标准直角坐标系为参考系的。维空间中的任意椭球可以通过如下步骤得到:

  1. 在标准直角坐标系中构造一个中心点在原点的维单位超球
  2. 将该超球在各个坐标轴方向进行伸缩,得到一个正规的椭球
  3. 将该椭球绕原点进行旋转,使得它与给定的椭球方向一致
  4. 将该椭球平移至给定椭球的位置

正规椭球的矩阵方程已知是现在将该椭球绕原点进行旋转,但是这等价于将坐标系绕原点旋转,然后在新坐标系中构造出一个正规椭球,设新坐标系中椭球的坐标为,于是该新坐标系中的正规椭球方程是现在,根据上一节的结论,我们知道如果该旋转后的椭球在原坐标系下的坐标为,那么存在一个正交矩阵使得,于是旋转后的椭球在原坐标系下的方程是现在假设所求椭球的中心坐标是,我们只需要将椭球平移至该中心点即可,于是我们得到了任意椭球的方程我们现在来关注核心的矩阵其中是正交矩阵,根据上一节和本节的推导,我们知道的列向量代表了旋转后椭圆的各个伸缩方向的单位矢量,而,显然是的特征值,从而就是对应方向的伸缩系数。

首先,易得是一个对称矩阵:。
此外,若是正交矩阵的第i个列向量,是对角阵的第行列元素(因此也是第个特征值),我们断言:是关于特征向量的特征值。为了证明这一点,我们有
因为其中是Kronecker符号。因此此处表示矩阵的第个列向量,但显然根据定义的第个列向量为,从而,由此可知从而命题可证。

现在,我们已经知道对角矩阵的对角线元素就是的特征值,但是显然特征值都是正值,因此是一个正定矩阵,又因为还是对称是,因此是一个对称正定矩阵。如果我们规定是一个实对称正定矩阵,那么在线性代数中有如下定理:

实对称正定矩阵一定可以相似对角化。

换句话说,给定一个阶实对称正定矩阵,方程就对应维欧几里得空间中的一个椭球。我们对一定可以相似对角化,于是得到个单位正交特征向量,向量代表了椭球伸缩的方向,而对应的特征值的平方根倒数就是该方向的伸缩系数。而给定一个椭球,我们也可以按照上面的构造方法构造出一个实对称正定矩阵。因此我们得到了椭球方程的矩阵形式。

当时,此时椭球退化为一个球。

考虑一个例子,我们希望求得一个椭圆,其中心位于点,半长轴为,半短轴为,长轴沿角的方向,从而短轴沿着的方向,现在想求得该椭圆的方程。我们选取长轴和短轴方向的单位向量以及,显然它们彼此正交;在这两个方向上的缩放系数分别是,于是可以构造矩阵于是就有P=A\Lambda^{-1}A^T=\begin{bmatrix}\frac{\cos^2\theta}{a^2}+\frac{\sin^2\theta}{b^2}&\frac{\sin\theta\cos\theta}{a^2}-\frac{\sin\theta\cos\theta}{b^2}\\\frac{\sin\theta\cos\theta}{a^2}-\frac{\sin\theta\cos\theta}{b^2}&\frac{\sin^2\theta}{a^2}+\frac{\cos^2\theta}{b^2}\end{bmatrix}所以该椭圆的方程是\begin{bmatrix}x-x_c\\y-y_c\end{bmatrix}^T\begin{bmatrix}\frac{\cos^2\theta}{a^2}+\frac{\sin^2\theta}{b^2}&\frac{\sin\theta\cos\theta}{a^2}-\frac{\sin\theta\cos\theta}{b^2}\\\frac{\sin\theta\cos\theta}{a^2}-\frac{\sin\theta\cos\theta}{b^2}&\frac{\sin^2\theta}{a^2}+\frac{\cos^2\theta}{b^2}\end{bmatrix}\begin{bmatrix}x-x_c\\y-y_c\end{bmatrix}=1拆解开就是\begin{split}&\left(\frac{\cos^2\theta}{a^2}+\frac{\sin^2\theta}{b^2}\right)(x-x_c)^2+\left(\frac{\sin^2\theta}{a^2}+\frac{\cos^2\theta}{b^2}\right)(y-y_c)^2+\\\cdots&\;\;2\left(\frac{\sin\theta\cos\theta}{a^2}-\frac{\sin\theta\cos\theta}{b^2}\right)(x-x_c)(y-y_c)=1\end{split}

椭球是一个凸集

如果是一个实对称正定矩阵,那么可以对角化分解为,其中的正交矩阵(),其列向量是的特征向量,而则是由对应特征值组成的对角矩阵。因为是正定矩阵,因此对角阵的对角线元素必然是正值。于是我们可以定义的开方为其中。这样的定义是合理的,因为

此外定义其中容易验证我们已经知道空间中的任意椭球的方程是现在将其进行变换\begin{split} K(x)&=(x-x_c)^T(P^{\frac{1}{2}}P^{\frac{1}{2}})(x-x_c)\\ &=(x-x_c)^T((P^{\frac{1}{2}})^TP^{\frac{1}{2}})(x-x_c)\\ &=[P^{\frac{1}{2}}(x-x_c)]^T[P^{\frac{1}{2}}(x-x_c)]\\ &=u^Tu=B(u)\leqslant 1 \end{split}其中进一步得到我们现在来看,集合表示一个单位球,定义映射我们有因此,给定一个这样的映射,它可以将一个圆心在原点的单位球唯一映射为一个椭球。因为是一个凸集,如果是一个仿射映射,那么根据凸优化理论,的象也是一个凸集。

一个映射是一个仿射映射,如果可以写为,其中是一个常量,而是一个线性函数(即)。显然是一个仿射函数,因此椭球就是一个凸集。

椭球矩阵正定性和椭圆包含关系

椭球球心在原点的一个任意椭球的方程已知是,其中,表示是一个阶对称正定矩阵。设椭球和椭球(),我们断言:

其中表示所有对称半正定矩阵的集合,它是一个半正定锥。

我们的证明通过如下过程
\begin{array}{rlr} \mathcal{A}\subseteq\mathcal{B}&\iff \forall x\in\mathcal{A}\Rightarrow x\in\mathcal{B}&(1)\\ &\iff x^TAx\leqslant1\Rightarrow x^TBx\leqslant1&(2)\\ &\iff x^TBx\leqslant x^TAx&(3)\\ &\iff x^T(A-B)x\geqslant0&(4)\\ &\iff (A-B)\in S^n_{+}&(5)\\ &\iff B^{-1}-A^{-1}\in S^n_+&(6) \end{array}
我们首先来看:其中是显然成立的。为了证明,也就证明:如果能推出,那么就有,我们使用反证法,假设存在一个,满足,注意到是对称正定矩阵,即二次型是一个正实数,即,于是我们就有,但是,因为的逆否命题是,这就意味着,进而有,这显然是不可能的,所以这样的是不存在的,命题可证。

我们接下来说明。我们依次证明下面的命题:

  • 如果是对称可逆矩阵,那么也是对称可逆矩阵:从而
  • 如果是对称(半)正定/(半)负定矩阵,那么也是对称(半)正定/(半)负定矩阵。这是因为 :
  • 称合同,如果存在可逆矩阵使得。我们说,合同变换不改变矩阵的(半)正定/(半)负定性。这是因为 :
  • 两个(半)正定矩阵(或两个(半)负定矩阵)的和仍然是(半)正定矩阵(或(半)负定矩阵),其证明是显然的。

一般的,我们有由于都是对称正定矩阵,从而也是对称正定矩阵,是对称矩阵,于是如果是半正定矩阵,那么两个矩阵合同,故而是半正定矩阵;此外,是可逆矩阵,因此合同,从而正定。于是可得是半正定的。同理,如果半正定,那么也半正定。

你可能感兴趣的:(椭球方程的矩阵形式)