原来,实对称矩阵对角化是为解决解析几何中二次曲面是何类型而提出的,因为二次曲面的方程可以写成
( x , y , z ) A ( x y z ) (x,y,z)A\begin{pmatrix}x\\y\\z\end{pmatrix} (x,y,z)A⎝⎛xyz⎠⎞的形式,而这里的A就是一个实对称矩阵,为了更好的看出曲线的类型,需要把二次项给消掉,使得变成
( x ∗ , y ∗ , z ∗ ) T − 1 A T ( x ∗ y ∗ z ∗ ) (x^*,y^*,z^*)T^{-1}AT\begin{pmatrix}x^*\\y^*\\z^*\end{pmatrix} (x∗,y∗,z∗)T−1AT⎝⎛x∗y∗z∗⎠⎞的形式,而
T − 1 A T T^{-1}AT T−1AT是一个对角矩阵。
不过为什么这里的T一定是正交矩阵?虽然后面证明了能将实对称矩阵对角化的可逆矩阵一定是正交矩阵,不过这里好像还有一个从几何上证明的定理??
实对称矩阵是指:实数域上的对称矩阵
正交相似
- 大概就是对于矩阵 A , B A,B A,B,若存在一正交矩阵 T T T使得 T − 1 A T = B T^{-1}AT=B T−1AT=B就说 A A A正交相似于 B B B
- 正交相似是 n n n级实矩阵组成的集合的一个等价关系,拥有以下三个性质
定理1
实对称矩阵的特征多项式的每一个复根都是实数,从而它们都是特征值。
证明
- 设 λ 0 \lambda_0 λ0是 n n n级实对称矩阵A的任一复根,只需证明 λ 0 ˉ = λ 0 \bar{\lambda_0}=\lambda_0 λ0ˉ=λ0,便能证明其为实数
- 把A看成复矩阵,从而 ∃ α ∈ C n , 且 α ≠ 0 \exist\alpha\in C^n,且\alpha\ne 0 ∃α∈Cn,且α̸=0,有 (1) A α = λ 0 α A\alpha=\lambda_0\alpha\tag{1} Aα=λ0α(1)
- 由于A是实矩阵,所以 λ 0 ˉ \bar{\lambda_0} λ0ˉ也是A的一个特征值, α ˉ \bar{\alpha} αˉ是 λ 0 ˉ \bar{\lambda_0} λ0ˉ的一个特征向量( P 273 例 2 P_{273}例2 P273例2: A A A是复数域上的n级实矩阵,若虚数 λ 0 \lambda_0 λ0是A的属于 λ 0 \lambda_0 λ0的一个特征向量,那么 λ 0 ˉ \bar{\lambda_0} λ0ˉ也是A的一个特征值,且特征向量为 α ˉ \bar{\alpha} αˉ)
- 所以就有 A α ˉ = λ 0 ˉ α ˉ A\bar{\alpha}=\bar{\lambda_0}\bar{\alpha} Aαˉ=λ0ˉαˉ对其转置有 α ˉ ′ A ′ = λ 0 ˉ α ˉ ′ \bar{\alpha}'A'=\bar{\lambda_0}\bar{\alpha}' αˉ′A′=λ0ˉαˉ′在上式右乘 α \alpha α,得 (2) α ˉ ′ A ′ α = λ 0 ˉ α ˉ ′ α \bar{\alpha}'A'\alpha=\bar{\lambda_0}\bar{\alpha}'\alpha\tag{2} αˉ′A′α=λ0ˉαˉ′α(2)
- 在(1)式左边乘上 α ˉ ′ \bar{\alpha}' αˉ′,得 (3) α ˉ ′ A α = λ 0 α ˉ ′ α \bar{\alpha}'A\alpha=\lambda_0\bar{\alpha}'\alpha\tag{3} αˉ′Aα=λ0αˉ′α(3)
- (2)=(3) ⇒ \Rightarrow ⇒ ( λ 0 ˉ − λ 0 ) α ˉ ′ α = 0 (\bar{\lambda_0}-\lambda_0)\bar{\alpha}'\alpha=0 (λ0ˉ−λ0)αˉ′α=0 α ˉ ′ α ≠ 0 \bar{\alpha}'\alpha\ne0 αˉ′α̸=0,So, λ 0 ˉ = λ 0 \bar{\lambda_0}=\lambda_0 λ0ˉ=λ0
定理2
实对称矩阵的不同特征值的特征向量是正交的
证明
- 设 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2分别是A的两个不同的特征值, α , β \alpha,\beta α,β分别是它们 的一个特征向量 (1) A α = λ 1 α A\alpha=\lambda_1\alpha\tag{1} Aα=λ1α(1) (2) A β = λ 2 β A\beta=\lambda_2\beta\tag{2} Aβ=λ2β(2)要证 α ′ β = 0 \alpha'\beta=0 α′β=0
- 让(1)转置,得 α ′ A = λ 1 α ′ \alpha'A=\lambda_1\alpha' α′A=λ1α′右乘 β \beta β,得 α ′ A β = λ 2 α ′ β = λ 1 α ′ β \alpha'A\beta=\lambda_2\alpha'\beta=\lambda_1\alpha'\beta α′Aβ=λ2α′β=λ1α′β ⇒ \Rightarrow ⇒ α ′ β = 0 \alpha'\beta=0 α′β=0
是不是觉得哪里有点奇怪, α ′ A β = λ 2 α ′ β \alpha'A\beta=\lambda_2\alpha'\beta α′Aβ=λ2α′β这样可以吗,不是矩阵相乘才有结合律吗?
啧啧啧,一看就是矩阵运算没有学好,刚刚翻到 P 143 P_{143} P143矩阵的运算,第一个性质就是说的矩阵的结合律!
- 设 A = ( a i j ) s × n , B = ( b i j ) n × m , C = ( c i j ) m × r A=(a_{ij})_{s×n},B=(b_{ij})_{n×m},C=(c_{ij})_{m×r} A=(aij)s×n,B=(bij)n×m,C=(cij)m×r,则满足 ( A B ) C = A ( B C ) (AB)C=A(BC) (AB)C=A(BC)
定理3
实对称矩阵一定正交相似于对角矩阵
这表明 ⇒ \Rightarrow ⇒实对称矩阵一定可对角化(真是上帝的宠儿,一出生就自带可对角化的光环)
证明
这个证明有难度了,从一开始就意想不到
- 首先,这里用的是数学归纳法
- n = 1 n=1 n=1时, ( 1 ) − 1 ( a ) ( 1 ) = ( a ) (1)^{-1}(a)(1)=(a) (1)−1(a)(1)=(a),命题真
- 假设对 n − 1 n-1 n−1级矩阵都满足以上命题,现在看 n n n级实对称矩阵A
- 由定理1得,实对称矩阵必有特征值,故取A的一个特征值 λ 1 \lambda_1 λ1,再取 λ 1 \lambda_1 λ1的一个特征向量 η 1 \eta_1 η1,取的 η 1 \eta_1 η1要满足 ∣ η 1 ∣ = 1 |\eta_1|=1 ∣η1∣=1
- 然后!!把 η 1 \eta_1 η1扩充为 R n R^n Rn的一个基,经过施密特正交化和标准化,得到 R n R^n Rn的一组标准正交鸡 η 1 , η 2 , . . . , η n \eta_1,\eta_2,...,\eta_n η1,η2,...,ηn,令 T 1 = ( η 1 , η 2 , . . . , η n ) T_1=(\eta_1,\eta_2,...,\eta_n) T1=(η1,η2,...,ηn)则 T 1 T_1 T1是正交矩阵
- 于是 T 1 − 1 A T 1 = T 1 − 1 ( A η 1 , A η 2 , . . . , A η n ) T_1^{-1}AT_1=T_1^{-1}(A\eta_1,A\eta_2,...,A\eta_n) T1−1AT1=T1−1(Aη1,Aη2,...,Aηn) = ( λ 1 T 1 − 1 η 1 , T 1 − 1 A η 2 , . . . , T 1 − 1 A η n ) =(\lambda_1T_1^{-1}\eta_1,T_1^{-1}A\eta_2,...,T_1^{-1}A\eta_n) =(λ1T1−1η1,T1−1Aη2,...,T1−1Aηn)由于正交矩阵有 T ′ = T − 1 T'=T^{-1} T′=T−1,所以 T 1 − 1 = T 1 ′ = ( η 1 ′ η 2 ′ . . . η n ′ ) T_1^{-1}=T_1'=\begin{pmatrix}\eta_1'\\\eta_2'\\...\\\eta_n'\end{pmatrix} T1−1=T1′=⎝⎜⎜⎛η1′η2′...ηn′⎠⎟⎟⎞ 所以 T 1 − 1 η 1 = ( 1 0 . . . 0 ) = ε 1 T_1^{-1}\eta_1=\begin{pmatrix}1\\0\\...\\0\end{pmatrix}=\varepsilon_1 T1−1η1=⎝⎜⎜⎛10...0⎠⎟⎟⎞=ε1
- 所以 T 1 − 1 A T 1 = ( λ 1 α 0 B ) T_1^{-1}AT_1=\begin{pmatrix}\lambda_1&\alpha\\0&B\end{pmatrix} T1−1AT1=(λ10αB)由于A是实对称,则 T 1 − 1 A T 1 T_1^{-1}AT_1 T1−1AT1也是实对称(正交矩阵节 P 218 P_{218} P218第一题就证明的是这个!!) ⇒ α = 0 \Rightarrow \alpha=0 ⇒α=0,所以 T 1 − 1 A T 1 = ( λ 1 0 0 B ) T_1^{-1}AT_1=\begin{pmatrix}\lambda_1&0\\0&B\end{pmatrix} T1−1AT1=(λ100B)B也是实对称矩阵
- 由设,得 ∃ 正 交 矩 阵 T 2 \exist 正交矩阵T_2 ∃正交矩阵T2,使得 T 2 − 1 B T 2 = d i a g { λ 2 , . . . , λ n } T_2^{-1}BT_2=diag\{\lambda_2,...,\lambda_n\} T2−1BT2=diag{λ2,...,λn}
- 所以,只需令 T = T 1 ( 1 0 0 T 2 ) T=T_1\begin{pmatrix}1&0\\0&T_2\end{pmatrix} T=T1(100T2)就有 T − 1 A T = d i a g { λ 1 , λ 2 , . . . , λ n } T^{-1}AT=diag\{\lambda_1,\lambda_2,...,\lambda_n\} T−1AT=diag{λ1,λ2,...,λn}
命题1
- 若矩阵A是 n n n阶实矩阵
- 且A正交相似于一个对角矩阵D
- ⇒ \Rightarrow ⇒A绝对是实对称矩阵
所以只有实对称矩阵才有正交相似的权利,非常霸道了
(有一个蒙面人说,我是实的且能正交相似,你们知道我是谁吗?)
(众人:哎哟你可拉到吧!还蒙面呢,只有实对称矩阵才能这样,你肯定是实对称矩阵家族的!)
命题2
A , B A,B A,B是两个实对称矩阵,则
A , B 相 似 ⇔ A , B 正 交 相 似 A,B相似\Leftrightarrow A,B正交相似 A,B相似⇔A,B正交相似