矩阵论——线性空间与线性映射

一、线性空间
  给定非空集合 V \bm{V} V和域 F \bm{F} F,若存在映射
σ : V × V → V        ( V 1 , V 2 ) ↦ σ ( V 1 , V 2 ) \begin{aligned} & \bm{σ} : \bm{V} × \bm{V} \rightarrow \bm{V}\\ & \ \ \ \ \ \ (V_1, V_2)\mapsto\bm{σ}(V_1, V_2) \end{aligned} σ:V×VV      (V1,V2)σ(V1,V2)则称 σ \bm{σ} σ V \bm{V} V上的加法。
  其中 V × V \bm{V} × \bm{V} V×V的运算称为集合的卡氏积【Cartesian product】,又名笛卡尔积,形如 S 1 × S 2 = { ( s 1 , s 2 ) ∣ s 1 ∈ S 1 , s 2 ∈ S 2 } \bm{S_1} × \bm{S_2} = \{(s_1, s_2)|s_1\in \bm{S_1},s_2\in \bm{ S_2}\} S1×S2={(s1,s2)s1S1,s2S2}这些有序对的全体构成了新的集合,称为其卡氏积。
  在一个运算系统中,如果该系统是封闭的,则称该系统为一个域。典型的有有理数域,实数域与复数域,而自然数等集合无法完全进行基本运算,并非封闭,不能成为域。
  先回顾通常的运算规则,包括加法的交换律 v 1 + v 2 = v 2 + v 1 v_1 + v_2 = v_2 + v_1 v1+v2=v2+v1加法的结合律 ( v 1 + v 2 ) + v 3 = v 1 + ( v 2 + v 3 ) (v_1 + v_2) + v_3 = v_1 + (v_2 + v_3) (v1+v2)+v3=v1+(v2+v3)加法的有零元 ∃ e ∈ V , e + v = v \exists e\in \bm{V}, e + v = v eV,e+v=v加法的有负元 ∀ v ∈ V , ∃ a ∈ V , v + a = e \forall v\in \bm{V}, \exists a\in \bm{V}, v + a = e vV,aV,v+a=e a = − v a = - v a=v。以及数乘法的向量与数分配律 ( v 1 + v 2 ) k = v 1 k + v 2 k (v_1 + v_2)k = v_1k + v_2k (v1+v2)k=v1k+v2k v ( k 1 + k 2 ) = v k 1 + v k 2 v(k_1 + k_2) = vk_1 + vk_2 v(k1+k2)=vk1+vk2数乘法的结合律 v ( k l ) = ( v k ) l v(kl) = (vk)l v(kl)=(vk)l其中 k k k l l l是域 F \bm{F} F的任意数。乘法的1元 v 1 = v v1 = v v1=v其中在数乘中,若向量为列向量,数乘法的数写在右侧;反之亦然,如此这般可以将数化为1×1的向量,由此等效为矩阵乘法。
  给定非空集合 V \bm{V} V和域 F \bm{F} F,在集合 V \bm{V} V的元素之间定义加法与数乘法,若满足以上四条加法法则与四条数乘法法则,则称集合 V \bm{V} V为域 F \bm{F} F线性空间
  将几何空间作为线性空间,来理解线性空间。定义 V \bm{V} V为有向线段的全体, F \bm{F} F为实数域,考察加法为平行四边形法则,数乘法为正反向伸缩,并考察八条运算规律。
  再考虑函数空间,以一定区间 X X X为定义域,具有n个分量的n维向量值函数,将该向量作为一个元素,则所有这些函数的集合称为函数空间,记 F ( X , R n ) = { f ∣ f = [ f 1 ( x ) , . . . , f n ( x ) ] T , x ∈ X } F(X, \bm{R}^n) = \{ \bm{f}|\bm{f} = [f_1(x), ..., f_n(x)]^T, x\in X \} F(X,Rn)={ff=[f1(x),...,fn(x)]T,xX}并考虑向量加法与数乘法,以考察八条运算规则。

二、向量空间与线性相关性
  定义向量组,由p个元素排列组成的有限序列 a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p} a1,a2,...,ap及向量组运算得到的抽象矩阵 ( a 1 , a 2 , . . . , a p ) \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) (a1,a2,...,ap),并定义若 ∃ k = [ k 1 , k 2 , . . . , k p ] T ≠ 0 , k ∈ F p \exists \bm{k} = [k_1, k_2 , ..., k_p]^T \ne \bm{0}, \bm{k} \in \bm{F}^p k=[k1,k2,...,kp]T=0,kFp,使得 ( a 1 , a 2 , . . . , a p ) k = 0 \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \bm{k} = \bm{0} (a1,a2,...,ap)k=0则称向量组 a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p} a1,a2,...,ap为线性相关;若向量组 a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p} a1,a2,...,ap不是线性相关的,则成为线性无关。再考虑线性相关性的矩阵描述,即方程组 ( a 1 , a 2 , . . . , a p ) ( x 1 , x 2 , . . . , x p ) T = 0 \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \left( \begin{matrix}x_1, x_2, ..., x_p \end{matrix} \right )^T = \bm{0} (a1,a2,...,ap)(x1,x2,...,xp)T=0当向量组 a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p} a1,a2,...,ap线性相关时,该方程组有非零解;反之,则仅有零解。
  考虑两个向量组 a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p} a1,a2,...,ap b 1 , b 2 , . . . , b q \bm{b_1}, \bm{b_2}, ..., \bm{b_q} b1,b2,...,bq,以及向量 b \bm{b} b,若 ∃ k = [ k 1 , k 2 , . . . , k p ] T , k ∈ F p \exists \bm{k} = [k_1, k_2 , ..., k_p]^T, \bm{k} \in \bm{F}^p k=[k1,k2,...,kp]T,kFp,使得 ( a 1 , a 2 , . . . , a p ) k = b \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \bm{k} = \bm{b} (a1,a2,...,ap)k=b则称 b \bm{b} b可由 a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p} a1,a2,...,ap线性表示。而每个 b i \bm{b_i} bi都可以由 a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p} a1,a2,...,ap线性表示,则称 b 1 , b 2 , . . . , b q \bm{b_1}, \bm{b_2}, ..., \bm{b_q} b1,b2,...,bq可由 a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p} a1,a2,...,ap线性表示。矩阵表示为 ( a 1 , a 2 , . . . , a p ) ( x 1 , x 2 , . . . , x p ) T = b \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \left( \begin{matrix}x_1, x_2, ..., x_p \end{matrix} \right )^T = \bm{b} (a1,a2,...,ap)(x1,x2,...,xp)T=b b \bm{b} b可由 a i \bm{a_i} ai线性表示时,该非齐次线性方程组有解。同样,向量组之间的线性关系由矩阵表示为 A X p × q = B \bm{A}\bm{X}_{p×q} = \bm{B} AXp×q=B当向量组之间线性相关时,该矩阵方程组有解。
  线性表示关系具有传递性。考虑三个向量组 { a i } , { b j } , { c k } \{\bm{a_i}\}, \{\bm{b_j}\}, \{\bm{c_k}\} {ai},{bj},{ck},记当 A \bm{A} A可由 B \bm{B} B组合为 A ≤ l i n B \bm{A} \le_{lin} \bm{B} AlinB则有若 b j ≤ l i n a i , c k ≤ l i n b j \bm{b_j} \le_{lin} \bm{a_i}, \bm{c_k} \le_{lin} \bm{b_j} bjlinai,cklinbj,则 c k ≤ l i n a i \bm{c_k} \le_{lin} \bm{a_i} cklinai,其矩阵方程的表示为 A X = B B Y = C \bm{A}\bm{X} = \bm{B} \\ \bm{B}\bm{Y} = \bm{C} AX=BBY=C有解,则 A Z = C \bm{A}\bm{Z} = \bm{C} AZ=C自然有解 Z = X Y \bm{Z} = \bm{X}\bm{Y} Z=XY  从母序列中挑出一个子序列构成向量组,这个子序列构成的向量组为原来母序列的子组。取 { a i } \{\bm{a_i}\} {ai}的子组 { b j } \{\bm{b_j}\} {bj},若 { b j } \{\bm{b_j}\} {bj}线性无关,且当满足 { a i } \{\bm{a_i}\} {ai}的子组 { c k } \{\bm{c_k}\} {ck} { b j } \{\bm{b_j}\} {bj}也是 { c k } \{\bm{c_k}\} {ck}的子组时,若对于 s < t s < t s<t,其中 s , t s, t s,t是两向量组 { b j } \{\bm{b_j}\} {bj} { c k } \{\bm{c_k}\} {ck}的维度,都有 { c k } \{\bm{c_k}\} {ck}线性相关,则此时称 { b j } \{\bm{b_j}\} {bj} { a i } \{\bm{a_i}\} {ai}的最大无关组。母组可由其极大线性无关组线性表示。极大线性无关组具有无关性与表示性,即组向量之间线性无关,并且母序列的任意向量组可由极大线性无关组线性表示。
  极大线性无关组的向量是不唯一的,但向量数是唯一的。考虑母序列 A = { a i } \bm{A} = \{\bm{a_i}\} A={ai}的极大线性无关组 B = { b j } \bm{B} = \{\bm{b_j}\} B={bj} C = { c k } \bm{C} = \{\bm{c_k}\} C={ck},其维度分别为 s , t s, t s,t,有 B X = A A Y = C \bm{B}\bm{X} = \bm{A} \\ \bm{A}\bm{Y} = \bm{C} BX=AAY=C有解,于是 B Z = C \bm{B}\bm{Z} = \bm{C} BZ=C有解,解为 Z s × t \bm{Z}_{s×t} Zs×t,考虑严格的 s < t s < t s<t,则 Z s × t \bm{Z}_{s×t} Zs×t可以看成不定方程,即方程数小于未知数个数的方程的系数矩阵。而易证不定方程有无数的非零解。考虑矩阵方程 Z W = 0 \bm{Z}\bm{W} = \bm{0} ZW=0显然,该方程有非零解。带入上述方程,有 B Z W = C W \bm{B}\bm{Z}\bm{W} = \bm{C}\bm{W} BZW=CW可以得到 C W = 0 \bm{C}\bm{W} = \bm{0} CW=0有非零解。然而 C = { c k } \bm{C} = \{\bm{c_k}\} C={ck}是一个线性无关组, C W = 0 \bm{C}\bm{W} = \bm{0} CW=0不存在非零解,故矛盾,而 s > t s > t s>t亦然,证毕。
  向量组的极大线性无关组所含向量的个数称为向量组的秩【Rank】。秩是向量组的内在性质,不随极大线性无关组的选择而改变。

三、基与坐标
  取域 F \bm{F} F上的线性空间 V \bm{V} V,如果有正整数 N \bm{N} N V \bm{V} V中的向量组 A = { a i } \bm{A} = \{\bm{a_i}\} A={ai},使得 A \bm{A} A线性无关,并且 ∀ a ∈ V \forall \bm{a} \in \bm{V} aV都可以由 { a i } \{\bm{a_i}\} {ai}线性表示,即 a = A n × n k n × 1 \bm{a} = \bm{A}_{n×n}\bm{k}_{n×1} a=An×nkn×1则称 V \bm{V} V是n维线性空间。则 { a i } \{\bm{a_i}\} {ai}称为 V \bm{V} V的一个基向量。而 k ∈ F n \bm{k} \in \bm{F}^n kFn称为 a ∈ V \bm{a} \in \bm{V} aV沿着该基的坐标向量。 一个空间的不同基向量的个数是相同的,因为基都是该空间的极大线性无关组,即空间的维度是固定的。
  基或坐标系实现了抽象线性空间到标准线性空间之间的一一对应,即 ∀ τ : S 1 → S 2 \forall τ:S_1\rightarrow S_2 τ:S1S2 ∃ ρ : S 2 → S 1 \exists ρ:S_2\rightarrow S_1 ρ:S2S1,使得 τ ρ τρ τρ S 1 S_1 S1的恒等映射,而 ρ τ ρτ ρτ S 2 S_2 S2的恒等映射。这就认为这两个抽象集合是重构的。
  考虑n维空间 V \bm{V} V的基 { a i } \{\bm{a_i}\} {ai},与该基下的坐标 k \bm{k} k,则抽象空间 V \bm{V} V与标准线性空间 F n \bm{F}^n Fn的映射关系,即 v ∈ V \bm{v} \in \bm{V} vV可以映射为 k \bm{k} k ∀ k ∈ F n \forall \bm{k} \in \bm{F}^n kFn,其在 V \bm{V} V的映射为 v = a k = [ a 1 , . . . , a n ] [ k 1 , . . . , k n ] T \bm{v} = \bm{a}\bm{k} = [\bm{a}_1, ..., \bm{a}_n][k_1, ..., k_n]^T v=ak=[a1,...,an][k1,...,kn]T;对应的,若 v \bm{v} v v ′ \bm{v}' v的映射均为 k \bm{k} k,则有 v ′ = [ a 1 , . . . , a n ] [ k 1 ′ , . . . , k n ′ ] T \bm{v}' = [\bm{a}_1, ..., \bm{a}_n][k_1', ..., k_n']^T v=[a1,...,an][k1,...,kn]T,由于线性无关性,有 [ a 1 , . . . , a n ] [ k 1 ′ − k 1 , . . . , k n ′ − k n ] T = 0 [\bm{a}_1, ..., \bm{a}_n][k_1'-k_1, ..., k_n'-k_n]^T = 0 [a1,...,an][k1k1,...,knkn]T=0,故 v ′ = [ a 1 , . . . , a n ] [ k 1 ′ , . . . , k n ′ ] T = [ a 1 , . . . , a n ] [ k 1 , . . . , k n ] T \bm{v}' = [\bm{a}_1, ..., \bm{a}_n][k_1', ..., k_n']^T = [\bm{a}_1, ..., \bm{a}_n][k_1, ..., k_n]^T v=[a1,...,an][k1,...,kn]T=[a1,...,an][k1,...,kn]T,即 v = v ′ \bm{v} = \bm{v}' v=v
  标准线性空间的基称为标准基,标准基组成的基矩阵称为单位矩阵,单位矩阵的列向量组是标准基向量组。再考虑任意的线性空间的基。所谓基者,就是一个无关向量组。对于n维空间,其秩为n,即线性无关。而对于表示性,即对任意的线性无关向量组 A \bm{A} A A x = b \bm{A}\bm{x} = \bm{b} Ax=b一定有解,这显然成立。而该方程组亦可以看作 b \bm{b} b沿着基向量 A \bm{A} A展开的问题。
  考虑理解无限维空间, 定义 F n [ x ] F_n[x] Fn[x]是以x为未知项的小于n次的多项式的函数空间,则 F n [ x ] F_n[x] Fn[x]的维度为n,其基为 [ 1 , x , . . . , x n − 1 ] [1, x, ..., x^{n-1}] [1,x,...,xn1],其中 1 ∈ F n [ x ] 1 \in F_n[x] 1Fn[x],是一个函数。则任意多项式可以由该基表示。其线性无关性,考虑证明 [ 1 , . . . , x n − 1 ] [ a 1 , . . . , a n ] T = 0 [1, ..., x^{n-1}][a_1, ..., a_n]^T = 0 [1,...,xn1][a1,...,an]T=0,则 a i = 0 a_i=0 ai=0。其中 0 ∈ F n [ x ] 0 \in F_n[x] 0Fn[x]。分别令 x = 1 , 2 , . . . , n x = 1, 2, ..., n x=1,2,...,n,对于 [ x 0 , . . . , x n − 1 ] [ a 1 , . . . , a n ] T = 0 [x^0, ..., x^{n-1}][a_1, ..., a_n]^T = 0 [x0,...,xn1][a1,...,an]T=0,有 ( 1 0 1 1 . . . 1 n − 1 2 0 2 1 . . . 2 n − 1 . . . n 0 n 1 . . . n n − 1 ) ( a 1 a 2 . . . a n ) = ( 0 0 . . . 0 ) \left( \begin{matrix}1^0 & 1^1 & ... & 1^{n-1} \\ 2^0 & 2^1 & ... & 2^{n-1} \\... & & & \\n^0 & n^1 & ... & n^{n-1} \end{matrix} \right )\left( \begin{matrix}a_1 \\ a_2 \\...\\a_{n} \end{matrix} \right ) = \left( \begin{matrix} 0 \\ 0 \\...\\ 0 \end{matrix} \right ) 1020...n01121n1.........1n12n1nn1a1a2...an=00...0考虑范德蒙行列式,则 a i = 0 a_i=0 ai=0。而考虑 F ∞ [ x ] F_\infty[x] F[x],其不是有限维的,任意有限个向量都不是其基。考虑n维基与n次项,考虑表示性,有 [ x 0 , . . . , x n − 1 ] [ a 1 , . . . , a n ] T = x n [x^0, ..., x^{n-1}][a_1, ..., a_n]^T = x^{n} [x0,...,xn1][a1,...,an]T=xn,即 [ x 0 , . . . , x n − 1 , x n ] [ a 1 , . . . , a n , − 1 ] T = 0 [x^0, ..., x^{n-1}, x^n][a_1, ..., a_n, -1]^T = 0 [x0,...,xn1,xn][a1,...,an,1]T=0,再考虑无关性,有 [ x 0 , . . . , x n − 1 , x n ] [ a 1 , . . . , a n , a n + 1 ] T = 0 [x^0, ..., x^{n-1}, x^n][a_1, ..., a_n, a_{n+1}]^T = 0 [x0,...,xn1,xn][a1,...,an,an+1]T=0,得到解为 a n + 1 = − 1 a_{n+1} = -1 an+1=1,这与线性无关组的条件 a i = 0 a_i = 0 ai=0矛盾,显然不是线性无关组。于是该n维不是一个基,即没有有限维基,即该空间不是一个有限维空间。

四、子空间
  考虑线性空间 V \bm{V} V,以及 V \bm{V} V的非空子集 W \bm{W} W,其对加法封闭,即 ∀ a , b ∈ W , a + b ∈ W \forall a,b \in \bm{W}, a+b \in \bm{W} a,bW,a+bW;以及对数乘法封闭, ∀ a ∈ W , ∀ k ∈ R , k a ∈ W \forall a \in \bm{W}, \forall k \in \bm{R}, ka \in \bm{W} aW,kRkaW,则称 W \bm{W} W V \bm{V} V的子空间。 W \bm{W} W也是线性空间。
  考虑线性空间 V \bm{V} V,取向量组为 { a p } \{\bm{a}_p\} {ap},取集合 s p a n { a p } = { a 1 c 1 + . . . + a p c p ∣ c i ∈ F } span\{\bm{a}_p\} = \{\bm{a}_1c_1 + ... +\bm{a}_pc_p|c_i \in \bm{F}\} span{ap}={a1c1+...+apcpciF},则 s p a n { a p } span\{\bm{a}_p\} span{ap} V \bm{V} V的一个子空间,并称为 { a p } \{\bm{a}_p\} {ap}的生成子空间。反而言之,对于 V \bm{V} V的子空间 W \bm{W} W { a p } \{\bm{a}_p\} {ap},有 W = s p a n { a p } \bm{W} = span\{\bm{a}_p\} W=span{ap},则 { a p } \{\bm{a}_p\} {ap} W \bm{W} W的一个生成组。生成组提供了子空间的一种表现方式。
  考虑矩阵 A ∈ R m × n \bm{A} \in \bm{R}^{m×n} ARm×n,则 { x ∣ A x = 0 , x ∈ F n } \{\bm{x}|\bm{A}\bm{x} = \bm{0}, \bm{x}\in \bm{F}^n\} {xAx=0,xFn} F n \bm{F}^n Fn的子空间,其封闭性易证。即齐次方程组的解集合是 F n \bm{F}^n Fn的子空间。定义 k e r A = { x ∣ A x = 0 , x ∈ F n } ker \bm{A} = \{\bm{x}|\bm{A}\bm{x} = \bm{0},\bm{x}\in \bm{F}^n\} kerA={xAx=0,xFn},称为 A \bm{A} A的核,用来代表以 A \bm{A} A为系数矩阵的线性方程组的解空间。再考虑 { A x ∣ x ∈ F n } \{\bm{A}\bm{x}|\bm{x}\in \bm{F}^n\} {AxxFn},其是 F m \bm{F}^m Fm的子空间。定义 i m A im \bm{A} imA,称为 A \bm{A} A的像,表示 A \bm{A} A的列向量组以 x \bm{x} x为系数的线性组合,即 A \bm{A} A的列向量组的生成子空间。
  考虑线性空间 V \bm{V} V的子空间 W \bm{W} W U \bm{U} U,则 W \bm{W} W U \bm{U} U的交集也是子空间, W \bm{W} W U \bm{U} U的和也是子空间。

五、线性映射
   V 1 \bm{V_1} V1 V 2 \bm{V_2} V2 R \bm{R} R上的线性空间,对于映射 σ : V 1 → V 2 σ:\bm{V_1}\rightarrow\bm{V_2} σ:V1V2,若有 σ ( e 1 + e 2 ) = σ ( e 1 ) + σ ( e 2 ) σ(\bm{e}_1 + \bm{e}_2) = σ(\bm{e}_1) + σ(\bm{e}_2) σ(e1+e2)=σ(e1)+σ(e2)的保加性,与 σ ( e k ) = k σ ( e ) σ(\bm{e}k) = kσ(\bm{e}) σ(ek)=kσ(e)的保数乘性,则称该映射为 V 1 \bm{V_1} V1 V 2 \bm{V_2} V2的线性映射。当 V 1 = V 2 = V \bm{V_1} = \bm{V_2} = \bm{V} V1=V2=V时,则称为 V \bm{V} V上的线性变换。
  若线性映射 σ σ σ是可逆映射,则称 σ σ σ为线性同构。即任一元素存在像且像唯一,任一像都有原像且原像唯一,则该两个线性空间的结构完全相同。有限维的线性空间即与同维的标准线性空间同构。
  考虑矩阵与标准线性空间之间的线性映射,两者之间的等同性,即取矩阵 A ∈ F m × n \bm{A}\in\bm{F}^{m×n} AFm×n,则线性映射可表示为 A : F n → F m x ↦ y = A x \begin{aligned} \bm{A}:&\bm{F}^{n}\rightarrow\bm{F}^{m} \\ &\bm{x} \mapsto\bm{y} = \bm{A}\bm{x}\end{aligned} A:FnFmxy=Ax反之,记 F n \bm{F}^{n} Fn的标准基 e 1 , . . . , e n \bm{e}_1, ..., \bm{e}_n e1,...,en,则对于线性映射 A \bm{A} A,考虑矩阵 A = ( A ( e 1 ) , . . . , A ( e n ) ) \bm{A} = (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n)) A=(A(e1),...,A(en)),则任取 x ∈ F n \bm{x} \in \bm{F}^n xFn,有 x = I x = e 1 x 1 + . . . + e n x n \begin{aligned} \bm{x} &= \bm{I}\bm{x} \\ &= \bm{e}_1x_1 + ... + \bm{e}_nx_n \end{aligned} x=Ix=e1x1+...+enxn x \bm{x} x的映射 A ( x ) = A ( e 1 x 1 ) + . . . + A ( e n x n ) = x 1 A ( e 1 ) + . . . + x n A ( e n ) = ( A ( e 1 ) , . . . , A ( e n ) ) x = A x \begin{aligned} \bm{A}(\bm{x}) &= \bm{A}(\bm{e}_1x_1) + ... + \bm{A}(\bm{e}_nx_n) \\ &= x_1\bm{A}(\bm{e}_1) + ... + x_n\bm{A}(\bm{e}_n) \\ &= (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))\bm{x} \\ &= \bm{A}\bm{x} \end{aligned} A(x)=A(e1x1)+...+A(enxn)=x1A(e1)+...+xnA(en)=(A(e1),...,A(en))x=Ax即任一抽象的线性映射都可由矩阵实现。
  再考虑线性映射的矩阵表示,给定线性映射 A : V → W , d i m ( V ) = n , d i m ( W ) = m \bm{A}:\bm{V}\rightarrow\bm{W},dim(\bm{V}) = n, dim(\bm{W}) = m A:VW,dim(V)=n,dim(W)=m V \bm{V} V的基 e 1 , . . . , e n \bm{e}_1, ..., \bm{e}_n e1,...,en,称其为入口基;与 W \bm{W} W的基 η 1 , . . . , η m \bm{η}_1, ..., \bm{η}_m η1,...,ηm,称为出口基。记第j个入口基向量 e j \bm{e}_j ej的像 A ( e j ) \bm{A}(\bm{e}_j) A(ej)在出口基下的坐标为 ( a 1 j , . . . , a m j ) T (a_{1j}, ...,a_{mj})^T (a1j,...,amj)T,则 A ( e j ) = ( η 1 , . . . , η m ) ( a 1 j , . . . , a m j ) T \bm{A}(\bm{e}_j) = (\bm{η}_1, ..., \bm{η}_m)(a_{1j}, ...,a_{mj})^T A(ej)=(η1,...,ηm)(a1j,...,amj)T共考虑n个原像向量,则 A = ( a 11 . . . a 1 n . . . . . . a m 1 . . . a m n ) \bm{A} = \left( \begin{matrix}a_{11} & ... & a_{1n} \\ ...&&...\\a_{m1} &...& a_{mn} \end{matrix} \right ) A=a11...am1......a1n...amn则称矩阵 A \bm{A} A为映射 A \bm{A} A的矩阵表示,有 A ( ( e 1 , . . . , e n ) ) = ( η 1 , . . . , η m ) A \bm{A}((\bm{e}_1, ..., \bm{e}_n)) = (\bm{η}_1, ..., \bm{η}_m)\bm{A} A((e1,...,en))=(η1,...,ηm)A对于入口基坐标下的 x \bm{x} x,其映射在出口基的坐标为 A x \bm{A}\bm{x} Ax,即 A ( x ) = A ( ( e 1 , . . . , e n ) x ) = ( A ( e 1 ) , . . . , A ( e n ) ) x = ( η 1 , . . . , η m ) A x = ( η 1 , . . . , η m ) ( A x ) \begin{aligned} \bm{A}(\bm{x}) &= \bm{A}((\bm{e}_1, ..., \bm{e}_n)\bm{x}) \\ &= (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))\bm{x} \\ &= (\bm{η}_1, ..., \bm{η}_m)\bm{A}\bm{x} \\&= (\bm{η}_1, ..., \bm{η}_m)(\bm{A}\bm{x}) \end{aligned} A(x)=A((e1,...,en)x)=(A(e1),...,A(en))x=(η1,...,ηm)Ax=(η1,...,ηm)(Ax)  考虑矩阵分析表示几何空间的旋转,其角度为 θ θ θ,其出口基与入口基均是3维空间,将轴的正向定义为 e 3 \bm{e}_3 e3,其他为 e 1 , e 2 \bm{e}_1, \bm{e}_2 e1,e2,则旋转映射 B = ( e 1 , e 2 , e 3 ) ( c o s ( θ ) − s i n ( θ ) 0 s i n ( θ ) c o s ( θ ) 0 0 0 1 ) \bm{B} = (\bm{e}_1, \bm{e}_2, \bm{e}_3)\left( \begin{matrix}cos(θ) & -sin(θ) & 0 \\ sin(θ) & cos(θ) & 0 \\0 &0& 1 \end{matrix} \right ) B=(e1,e2,e3)cos(θ)sin(θ)0sin(θ)cos(θ)0001  考虑矩阵论表示几何空间的反射,将镜面的正法向定义为 e 3 \bm{e}_3 e3,其他为 e 1 , e 2 \bm{e}_1, \bm{e}_2 e1,e2,则镜面映射 C = ( e 1 , e 2 , e 3 ) ( 1 0 0 0 1 0 0 0 − 1 ) \bm{C} = (\bm{e}_1, \bm{e}_2, \bm{e}_3)\left( \begin{matrix}1 & 0 & 0 \\ 0 & 1 & 0 \\0 &0& -1 \end{matrix} \right ) C=(e1,e2,e3)100010001

六、矩阵等价与相似
  对于 A , B ∈ F m × n \bm{A}, \bm{B}\in\bm{F}^{m×n} A,BFm×n,存在可逆矩阵 P ∈ F n × n \bm{P}\in\bm{F}^{n×n} PFn×n Q ∈ F m × m \bm{Q}\in\bm{F}^{m×m} QFm×m,使得 A P = Q B \bm{A}\bm{P}=\bm{Q}\bm{B} AP=QB则称 A \bm{A} A B \bm{B} B等价。在线性代数中,等价描述为 T A S = B \bm{T}\bm{A}\bm{S}=\bm{B} TAS=B,以刻画初等行列变换,即 A \bm{A} A可由初等变换得到 B \bm{B} B。而从矩阵分析考虑,有 A ( P 1 , . . . , P n ) = ( Q 1 , . . . , Q m ) B \bm{A}(\bm{P}_1, ...,\bm{P}_n) = (\bm{Q}_1, ...,\bm{Q}_m)\bm{B} A(P1,...,Pn)=(Q1,...,Qm)B将矩阵 A \bm{A} A视为线性映射 A : x ↦ y = A x \bm{A}:\bm{x}\mapsto\bm{y} = \bm{A}\bm{x} A:xy=Ax,满秩矩阵 P \bm{P} P的列向量为n维空间的一般基,满秩矩阵 Q \bm{Q} Q的列向量为m维空间的一般基,则有线性映射 A \bm{A} A在入口基 P \bm{P} P与出口基 Q \bm{Q} Q下的矩阵表示是 B \bm{B} B
  考虑选择基以最简表示,即 A P = Q ( I r 0 0 0 ) \bm{A}\bm{P} = \bm{Q}\left( \begin{matrix}\bm{I}_r & \bm{0} \\ \bm{0} & \bm{0} \end{matrix} \right ) AP=Q(Ir000) A P 1 = Q 1 . . . A P r = Q r A P r + 1 = 0 . . . A P n = 0 \bm{A}\bm{P}_1 = \bm{Q_1} \\ ... \\ \bm{A}\bm{P}_r = \bm{Q_r} \\ \bm{A}\bm{P}_{r+1} = \bm{0}\\... \\ \bm{A}\bm{P}_n = \bm{0} AP1=Q1...APr=QrAPr+1=0...APn=0在标准基 I n \bm{I}_n In I m \bm{I}_m Im下, A : x ↦ y = A x \bm{A}:\bm{x} \mapsto \bm{y} = \bm{Ax} A:xy=Ax;但在基 P \bm{P} P Q \bm{Q} Q下, B : x ′ ↦ y ′ = B x ′ \bm{B}:\bm{x}' \mapsto \bm{y}' = \bm{Bx}' B:xy=Bx,其中 B \bm{B} B是最简表示,则有 y 1 ′ = x 1 ′ . . . y r ′ = x r ′ y r + 1 ′ = 0 . . . y m ′ = 0 \bm{y}'_1 =\bm{x}'_1\\ ...\\ \bm{y}'_r =\bm{x}'_r\\ \bm{y}'_{r+1} = \bm{0}\\ ...\\ \bm{y}'_{m} = \bm{0} y1=x1...yr=xryr+1=0...ym=0使得分量完全解耦。
  对于 A , B ∈ F n × n \bm{A}, \bm{B}\in\bm{F}^{n×n} A,BFn×n,若存在n阶可逆矩阵 P \bm{P} P使得 A P = P B \bm{AP} = \bm{PB} AP=PB则称 A \bm{A} A B \bm{B} B相似。将矩阵 A \bm{A} A视为线性变换 A : x ↦ y = A x \bm{A}:\bm{x}\mapsto\bm{y} = \bm{A}\bm{x} A:xy=Ax,满秩矩阵 P \bm{P} P的列向量为n维空间的一般基,则有线性变换 A \bm{A} A在入口基与出口基 P \bm{P} P下的矩阵表示是 B \bm{B} B
  首先定义方阵的不变子空间,若 A ∈ F n × n \bm{A}\in\bm{F}^{n×n} AFn×n W ∈ F n \bm{W}\in\bm{F}^n WFn F n \bm{F}^n Fn的子空间,若 A ( W ) ⊆ W \bm{A}(\bm{W}) \subseteq \bm{W} A(W)W,则称 W \bm{W} W A \bm{A} A的不变子空间。
  考虑不变子空间与相似最简化的等价性,对于 A P = P B \bm{AP} = \bm{PB} AP=PB,令 P = ( P 1 , P 2 ) \bm{P} = (\bm{P}_1, \bm{P}_2) P=(P1,P2),相应的, B = ( B 11 B 12 B 21 B 22 ) \bm{B} = \left( \begin{matrix}\bm{B}_{11} & \bm{B}_{12} \\ \bm{B}_{21} & \bm{B}_{22} \end{matrix} \right ) B=(B11B21B12B22) B 21 = 0 \bm{B}_{21} = \bm{0} B21=0,则 i m P 1 im\bm{P}_1 imP1 A \bm{A} A的不变子空间,而 B 12 = 0 \bm{B}_{12} = \bm{0} B12=0,则 i m P 2 im\bm{P}_2 imP2 A \bm{A} A的不变子空间。证明如下 A P 1 = ( P 1 , P 2 ) ( B 11 , B 21 ) T A P 2 = ( P 1 , P 2 ) ( B 12 , B 22 ) T \bm{AP}_1 = (\bm{P}_1, \bm{P}_2)(\bm{B}_{11}, \bm{B}_{21})^T \\ \bm{AP}_2 = (\bm{P}_1, \bm{P}_2)(\bm{B}_{12}, \bm{B}_{22})^T AP1=(P1,P2)(B11,B21)TAP2=(P1,P2)(B12,B22)T要证, i m P 1 im\bm{P}_1 imP1 A \bm{A} A的不变子空间,则 A i m P 1 ⊆ i m P 1 \bm{A}im\bm{P}_1 \subseteq im\bm{P}_1 AimP1imP1,其中 i m P 1 im \bm{P}_1 imP1 P 1 \bm{P}_1 P1列向量的线性组合。当 B 21 = 0 \bm{B}_{21} = \bm{0} B21=0,有 A P 1 = ( p 1 , . . . , p n ) B = P 1 B , A p j ∈ i m P 1 , j = 1 , . . . , n \bm{AP}_1 = (\bm{p}_1, ... , \bm{p}_n)\bm{B}= \bm{P}_1\bm{B}, \bm{Ap}_j \in im \bm{P}_1, j = 1, ..., n AP1=(p1,...,pn)B=P1B,ApjimP1,j=1,...,n显然成立。 B 12 = 0 \bm{B}_{12} = \bm{0} B12=0同理。
  反之,若有不变子空间,就一定有可以三角化的矩阵。考虑 A \bm{A} A的不变子空间 W = s p a n { v 1 , . . . , v t } \bm{W} = span\{\bm{v}_1, ... , \bm{v}_t\} W=span{v1,...,vt},则有可逆矩阵 P \bm{P} P使得 A \bm{A} A三角化为 B \bm{B} B,即 P 1 = ( v 1 , . . . , v t ) , P 2 = ( u 1 , . . . , u n − t ) \bm{P}_1 = (\bm{v}_1, ... , \bm{v}_t), \bm{P}_2 = (\bm{u}_1, ... , \bm{u}_{n - t}) P1=(v1,...,vt),P2=(u1,...,unt) P = ( P 1 , P 2 ) \bm{P} = (\bm{P}_1, \bm{P}_2) P=(P1,P2),则 A P \bm{A}\bm{P} AP就是一个三角矩阵。其中 P 2 \bm{P}_2 P2是一个扩充矩阵,其使得 P \bm{P} P是一个可逆方阵。
  考虑相似对角化的条件。取 A P = P Λ \bm{AP} = \bm{PΛ} AP=PΛ,则 P \bm{P} P的每一维度向量张成的空间 i m p j im\bm{p}_j impj都是 A \bm{A} A的不变子空间。由此,定义特征值与特征向量,考虑 A p = p λ \bm{Ap} = \bm{p}λ Ap=pλ,则称 λ λ λ是矩阵的一个特征值,而 p \bm{p} p是其相应的一个特征向量。其意义为一维不变子空间的映射仍在该子空间,即一维向量的线性组合。那么, P \bm{P} P的每一维度向量张成的空间 i m p j im\bm{p}_j impj都是 A \bm{A} A的不变子空间,等效为 A \bm{A} A可以相似,等价于存在有n个线性无关的向量。

你可能感兴趣的:(数学)