\qquad 本文限于讨论规模 n × n n\times n n×n的方阵 A A A.
\qquad 我们知道方阵也可以看做是一个映射: R n → R n R^n \rightarrow R^n Rn→Rn.而如果一个 R n R^n Rn空间的子空间 T T T满足: ∀ x ∈ T , A x ∈ T \forall x\in T,Ax\in T ∀x∈T,Ax∈T,我们就称T是A的一个不变子空间. 不变子空间是矩阵化简的一个利器.
\qquad 设 R n R^n Rn可以分解 s s s个不变子空间的直和:
R n = W 1 ⊕ W 2 ⊕ ⋯ ⊕ W s R^n=W_1\oplus W_2\oplus \cdots \oplus W_s Rn=W1⊕W2⊕⋯⊕Ws \qquad 而 W i , i = 1 , 2 , ⋯   , s W_i,i=1,2,\cdots,s Wi,i=1,2,⋯,s是不变子空间,不妨设 W i W_i Wi的一组基是 x i 1 , x i 2 , ⋯   , x i r i x_{i1},x_{i2},\cdots,x_{ir_i} xi1,xi2,⋯,xiri,那么就有:
A [ x i 1 , x i 2 , ⋯   , x i r i ] = [ x i 1 , x i 2 , ⋯   , x i r i ] A i A[x_{i1},x_{i2},\cdots,x_{ir_i}]=[x_{i1},x_{i2},\cdots,x_{ir_i}]A_i A[xi1,xi2,⋯,xiri]=[xi1,xi2,⋯,xiri]Ai \qquad 其中 A i A_i Ai是一个 r i × r i r_i\times r_i ri×ri的方阵。这是因为 A x i 1 , A x i 2 , ⋯   , A x i r i Ax_{i1},Ax_{i2},\cdots,Ax_{ir_i} Axi1,Axi2,⋯,Axiri仍在 W W W中,所以它们都可以被基 x i 1 , x i 2 , ⋯   , x i r i x_{i1},x_{i2},\cdots,x_{ir_i} xi1,xi2,⋯,xiri线性表出。
\qquad 另一方面, x 11 , x 12 , ⋯   , x 1 r 1 , ⋯   , x s 1 , x s 2 , ⋯   , x s r s x_{11},x_{12},\cdots,x_{1r_1},\cdots,x_{s1},x_{s2},\cdots,x_{sr_s} x11,x12,⋯,x1r1,⋯,xs1,xs2,⋯,xsrs是 R n R^n Rn的一组基,在这组基下有: A [ x 11 , x 12 , ⋯   , x 1 r 1 , ⋯   , x s 1 , x s 2 , ⋯   , x s r s ] = [ x 11 , x 12 , ⋯   , x 1 r 1 , ⋯   , x s 1 , x s 2 , ⋯   , x s r s ] [ A 1 A 2 ⋱ A s ] A[x_{11},x_{12},\cdots,x_{1r_1},\cdots,x_{s1},x_{s2},\cdots,x_{sr_s}]\\=[x_{11},x_{12},\cdots,x_{1r_1},\cdots,x_{s1},x_{s2},\cdots,x_{sr_s}]\begin{bmatrix}A_1&\quad&\quad&\quad\\\quad&A_2&\quad&\quad\\\quad&\quad&\ddots&\quad\\\quad&\quad&\quad&A_s\end{bmatrix} A[x11,x12,⋯,x1r1,⋯,xs1,xs2,⋯,xsrs]=[x11,x12,⋯,x1r1,⋯,xs1,xs2,⋯,xsrs]⎣⎢⎢⎡A1A2⋱As⎦⎥⎥⎤ \quad 或者将上式简写为: A X = X [ A 1 A 2 ⋱ A s ] AX=X\begin{bmatrix}A_1&\quad&\quad&\quad\\\quad&A_2&\quad&\quad\\\quad&\quad&\ddots&\quad\\\quad&\quad&\quad&A_s\end{bmatrix} AX=X⎣⎢⎢⎡A1A2⋱As⎦⎥⎥⎤
\quad 于是便有: X − 1 A X = [ A 1 A 2 ⋱ A s ] X^{-1}AX=\begin{bmatrix}A_1&\quad&\quad&\quad\\\quad&A_2&\quad&\quad\\\quad&\quad&\ddots&\quad\\\quad&\quad&\quad&A_s\end{bmatrix} X−1AX=⎣⎢⎢⎡A1A2⋱As⎦⎥⎥⎤
\quad 综上,如果 R n R^n Rn可以分解多个A不变子空间的直和,就可以通过上述构造的相似变换,将A相似变换为一个块对角矩阵。这就是不变子空间直和分解和矩阵化简的关系。