Th 3.1 矩阵的 k k k 阶顺主子式: 取矩阵的前 k k k 行、前 k k k 列得到的行列式.
Th 3.1: A ∈ F n × n A\in F^{n\times n} A∈Fn×n 有唯一 LDV 分解 ⟺ A A A 的顺主子式 ∣ A k ∣ ≠ 0 , k = 1 , 2 , . . . , n − 1 |A_k|\neq 0, k=1,2,...,n-1 ∣Ak∣=0,k=1,2,...,n−1, ∣ A 0 ∣ = 1 |A_0|=1 ∣A0∣=1. 其中 D = d i a g ( d 1 , d 2 , … , d n ) , d k = ∣ A k ∣ ∣ A k − 1 ∣ , k = 1 , … , n D = diag(d_1,d_2,…,d_n), d_k = \frac{|A_k|}{|A_{k-1}|}, k=1, …, n D=diag(d1,d2,…,dn),dk=∣Ak−1∣∣Ak∣,k=1,…,n.
LU 分解:
LDV 分解:
A X = b ⇒ { L Y = b U X = Y AX=b\Rightarrow \begin{cases}LY=b\\UX=Y\end{cases} AX=b⇒{LY=bUX=Y
A X = b ⇒ { L Z = b D Y = Z V X = Y AX=b\Rightarrow \begin{cases}LZ=b\\DY=Z\\VX=Y\end{cases} AX=b⇒⎩⎪⎨⎪⎧LZ=bDY=ZVX=Y
Def 3.2: 设 A ∈ F m × n , r a n k ( A ) = r A\in F^{m\times n}, rank(A)=r A∈Fm×n,rank(A)=r, 若存在秩为 r r r 的矩阵 B ∈ F m × r B\in F^{m\times r} B∈Fm×r(列满秩, 瘦高矩阵), C ∈ F r × n C\in F^{r\times n} C∈Fr×n(行满秩, 矮胖矩阵), 使得 A = B C A=BC A=BC, 则称此式为 A A A 的满秩分解.
Th 3.3 任何非零矩阵 A ∈ F m × n A\in F^{m\times n} A∈Fm×n 都有满秩分解.
求矩阵列的极大无关组
举例:
A = [ 1 1 2 0 2 2 1 0 1 ] → [ 1 0 1 0 1 1 0 0 0 ] A=\begin{bmatrix} 1&1&2\\ 0&2&2\\ 1&0&1 \end{bmatrix}\rightarrow\begin{bmatrix} 1&0&1\\ 0&1&1\\ 0&0&0 \end{bmatrix} A=⎣⎡101120221⎦⎤→⎣⎡100010110⎦⎤
C = [ 1 0 1 0 1 1 ] , B = [ 1 1 0 2 1 0 ] C=\begin{bmatrix} 1&0&1\\ 0&1&1 \end{bmatrix}, B=\begin{bmatrix} 1&1\\ 0&2\\ 1&0 \end{bmatrix} C=[100111],B=⎣⎡101120⎦⎤
矩阵的谱: 矩阵 A A A 互异的特征值的集合 { λ 1 , λ 2 , . . . , λ s } \{\lambda_1,\lambda_2,...,\lambda_s\} {λ1,λ2,...,λs}.
矩阵的谱分解:
A = P ( λ 1 [ I r 1 0 ⋱ 0 ] + λ 2 [ 0 I r 2 ⋱ 0 ] + ⋯ + λ s [ 0 0 ⋱ λ s ] ) P − 1 = P ( λ 1 Q 1 + λ 2 Q 2 + ⋯ + λ s Q s ) P − 1 = P ( ∑ i = 1 s λ i Q i ) P − 1 = ∑ i = 1 s λ i P Q i P − 1 = = = = = = = = d e f P i = P Q i P − 1 ∑ i = 1 s λ i P i \begin{aligned} A&=P(\lambda_1\begin{bmatrix} I_{r_1}& & & \\ &0& & \\ & &\ddots& \\ & & &0\\ \end{bmatrix}+\lambda_2\begin{bmatrix} 0& & & \\ &I_{r_2}& & \\ & &\ddots& \\ & & &0\\ \end{bmatrix}+\cdots+\lambda_s\begin{bmatrix} 0& & & \\ &0& & \\ & &\ddots& \\ & & &\lambda_s\\ \end{bmatrix})P^{-1}\\ &=P(\lambda_1Q_1+\lambda_2Q_2+\cdots+\lambda_sQ_s)P^{-1}\\ &=P(\sum_{i=1}^s\lambda_iQ_i)P^{-1}=\sum_{i=1}^s\lambda_iPQ_iP^{-1}\\ &\overset{def\ P_i=PQ_iP^{-1}}{=\!=\!=\!=\!=\!=\!=\!=}\sum_{i=1}^s\lambda_iP_i \end{aligned} A=P(λ1⎣⎢⎢⎡Ir10⋱0⎦⎥⎥⎤+λ2⎣⎢⎢⎡0Ir2⋱0⎦⎥⎥⎤+⋯+λs⎣⎢⎢⎡00⋱λs⎦⎥⎥⎤)P−1=P(λ1Q1+λ2Q2+⋯+λsQs)P−1=P(i=1∑sλiQi)P−1=i=1∑sλiPQiP−1========def Pi=PQiP−1i=1∑sλiPi
Q i , P i Q_i,P_i Qi,Pi 性质:
Th 3.5: 矩阵可对角化 ⟺ 矩阵有谱分解 A = ∑ i = 1 s λ i P i A=\sum_{i=1}^s\lambda_iP_i A=∑i=1sλiPi, 其中 P i P_i Pi 满足上述 3 条性质.
幂等矩阵性质: P ∈ F n × n , P 2 = P P\in F^{n\times n},P^2=P P∈Fn×n,P2=P
欧式空间: 实对称矩阵 A ( A T = A ) A(A^T=A) A(AT=A) 相似于对角矩阵. 存在正交矩阵 C ( C C T = C T C = I ) C\ (CC^T=C^TC=I) C (CCT=CTC=I):
C T A C = C − 1 A C = [ λ 1 λ 2 ⋱ λ n ] C^TAC=C^{-1}AC=\begin{bmatrix} \lambda_1& & & \\ &\lambda_2& & \\ & &\ddots& \\ & & &\lambda_n \end{bmatrix} CTAC=C−1AC=⎣⎢⎢⎡λ1λ2⋱λn⎦⎥⎥⎤
酉空间: Hermite 矩阵 A ( A H = A ) A(A^H=A) A(AH=A) 相似于对角矩阵. 存在酉矩阵 U ( U U H = U H U = I ) U\ (UU^H=U^HU=I) U (UUH=UHU=I):
U H A U = U − 1 A U = [ λ 1 λ 2 ⋱ λ n ] U^HAU=U^{-1}AU=\begin{bmatrix} \lambda_1& & & \\ &\lambda_2& & \\ & &\ddots& \\ & & &\lambda_n \end{bmatrix} UHAU=U−1AU=⎣⎢⎢⎡λ1λ2⋱λn⎦⎥⎥⎤
Th 3.7 可逆矩阵的 UR (酉)分解:
A ∈ C n × n A\in C^{n\times n} A∈Cn×n 为可逆矩阵, 则存在酉矩阵(正交矩阵) U U U 和主对角线上元素皆正的上三角矩阵 R R R, 使得 A = U R A=UR A=UR.
Th 3.8 列满秩矩阵(列线性无关, 瘦高矩阵)的 QR 分解:
矩阵 A ∈ C n × r A\in C^{n\times r} A∈Cn×r 是列满秩的矩阵, 则矩阵 A A A 可以分解为 A = Q R A=QR A=QR, 其中 Q ∈ C n × r Q\in C^{n\times r} Q∈Cn×r 的列向量是标准正交的向量组, R ∈ C r × r R\in C^{r\times r} R∈Cr×r 是主对角线上元素皆正的上三角形矩阵.
思路: 将矩阵 A A A 的列向量(均线性无关)视作矩阵列空间中的一组基 A = ( α 1 , . . . , α r ) A=(\alpha_1,...,\alpha_r) A=(α1,...,αr), 使用 Schmidt 正交化方法对其求标准正交基.
( α 1 , α 2 , . . . , α r ) = ( ϵ 1 , ϵ 2 . . . , ϵ r ) [ ∣ ∣ β 1 ∣ ∣ ( α 2 , ϵ 1 ) ⋯ ( α r , ϵ 1 ) ∣ ∣ β 2 ∣ ∣ ⋯ ( α r , ϵ 2 ) ⋱ ⋮ ∣ ∣ β r ∣ ∣ ] (\alpha_1,\alpha_2,...,\alpha_r)=(\epsilon_1,\epsilon_2...,\epsilon_r)\begin{bmatrix} ||\beta_1||&(\alpha_2,\epsilon_1)&\cdots&(\alpha_r,\epsilon_1)\\ &||\beta_2||&\cdots&(\alpha_r,\epsilon_2)\\ & &\ddots&\vdots\\ & & &||\beta_r|| \end{bmatrix} (α1,α2,...,αr)=(ϵ1,ϵ2...,ϵr)⎣⎢⎢⎢⎡∣∣β1∣∣(α2,ϵ1)∣∣β2∣∣⋯⋯⋱(αr,ϵ1)(αr,ϵ2)⋮∣∣βr∣∣⎦⎥⎥⎥⎤
Th 3.9 Schur 分解: 对矩阵 A ∈ C n × n A\in C^{n\times n} A∈Cn×n, 存在酉矩阵 U U U 和上三角矩阵 T T T, 使得:
U H A U = T = [ λ 1 ∗ ∗ ∗ λ 2 ⋱ ∗ ⋱ ∗ λ n ] U^HAU=T=\begin{bmatrix} \lambda_1&*&*&*\\ &\lambda_2&\ddots&*\\ & &\ddots&*\\ & & &\lambda_n \end{bmatrix} UHAU=T=⎣⎢⎢⎡λ1∗λ2∗⋱⋱∗∗∗λn⎦⎥⎥⎤
Def’ 3.3: 方阵 A A A 是正规矩阵 ⟺ A H A = A A H A^HA=AA^H AHA=AAH
常见的正规矩阵:
正规矩阵特性:
Th 3.10: A ∈ C n × n A\in C^{n\times n} A∈Cn×n 是正规矩阵 ⟺ A A A 酉相似于对角矩阵 ("正规"是"酉相似"的不变性质).
⟺ A A A 有 n n n 个标准正交的特征向量.
⟺ (推论) A A A 有 n n n 个标准正交的特征向量构成空间 C n C^n Cn 的标准正交基. 即
理解: 正规矩阵关键在"酉相似于"对角矩阵. "相似"是线性变换从一组基到另一组基的坐标变换; 而"酉相似"是线性变换从一组标准正交基到另一组标准正交基的坐标变换.
⟺ A A A 有谱分解: A = ∑ i = 1 s λ i P i A=\sum_{i=1}^s\lambda_iP_i A=∑i=1sλiPi. P P P 满足: P i 2 = P i , P i H = P i P_i^2=P_i,P_i^H=P_i Pi2=Pi,PiH=Pi; P i P j = 0 , i ≠ j P_iP_j=0,i\neq j PiPj=0,i=j; ∑ i = 1 s P i = I \sum_{i=1}^sP_i=I ∑i=1sPi=I. (即满足谱分解矩阵 P i P_i Pi 的性质外还需要满足 Hermite 性, P i = P Q i P − 1 ⟶ 正 规 矩 阵 P i = U Q i U H P_i=PQ_iP^{-1}\overset{正规矩阵}{\longrightarrow}P_i=UQ_iU^H Pi=PQiP−1⟶正规矩阵Pi=UQiUH)
Hermite 矩阵: A H = A A^H=A AH=A
基本性质:
Hermite 矩阵谱分解:
设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n 是秩为 k k k 的半正定的 Hermite 矩阵, 则 A A A 可以分解为下列半正定矩阵的和:
A = v 1 v 1 H + v 2 v 2 H + . . . + v k v k H A=v_1v_1^H+v_2v_2^H+...+v_kv_k^H A=v1v1H+v2v2H+...+vkvkH
其中, { v 1 , v 2 , … , v k } \{v_1, v_2, …,v_k\} {v1,v2,…,vk} 是 F n F^n Fn 中的正交向量组, 且秩为 1.
A ∈ C m × n A\in C^{m\times n} A∈Cm×n, A H A ∈ C n × n , A A H ∈ C m × m A^HA\in C^{n\times n},AA^H\in C^{m\times m} AHA∈Cn×n,AAH∈Cm×m 为 Hermite 矩阵, 从而也为正规矩阵.
Th 3.12
Def’ 3.4: A ∈ C m × n , r a n k ( A ) = r A\in C^{m\times n}, rank(A) = r A∈Cm×n,rank(A)=r, 设 A H A A^HA AHA 的特征值 λ 1 ≥ λ 2 ≥ . . . ≥ λ r > 0 , λ r + 1 = . . . = λ n = 0 \lambda_1\geq\lambda_2\geq...\geq\lambda_r > 0, \lambda_{r+1}=...=\lambda_n=0 λ1≥λ2≥...≥λr>0,λr+1=...=λn=0, 则矩阵 A A A 的奇异值:
σ i = λ i , i = 1 , 2 , . . . , r \sigma_i=\sqrt{\lambda_i},i=1,2,...,r σi=λi,i=1,2,...,r
注: 此处的 λ i \lambda_i λi 是矩阵 A H A A^HA AHA 的特征值, 奇异值为正(实)数
Th 3.13 奇异值性质:
Th 3.14 奇异值分解: 设矩阵 A ∈ C m × n , r a n k ( A ) = r A\in C^{m\times n}, rank(A)=r A∈Cm×n,rank(A)=r. σ 1 ≥ σ 2 ≥ . . . ≥ σ r > 0 \sigma_1\geq\sigma_2\geq...\geq\sigma_r > 0 σ1≥σ2≥...≥σr>0 是矩阵 A A A 的奇异值, 则存在酉矩阵 U ∈ C m × m , V ∈ C n × n U\in C^{m\times m}, V\in C^{n\times n} U∈Cm×m,V∈Cn×n, 分块矩阵 Σ = [ Δ 0 0 0 ] ∈ C m × n \Sigma=\begin{bmatrix}\Delta&0\\0&0\end{bmatrix}\in C^{m\times n} Σ=[Δ000]∈Cm×n, 使
A = U Σ V H = U [ Δ 0 0 0 ] V H A=U\Sigma V^H=U\begin{bmatrix}\Delta&0\\0&0\end{bmatrix}V^H A=UΣVH=U[Δ000]VH
其中, Δ = d i a g ( σ 1 , σ 2 , . . . , σ r ) \Delta=diag(\sigma_1,\sigma_2,...,\sigma_r) Δ=diag(σ1,σ2,...,σr)
目标: 求矩阵 A m × n A_{m\times n} Am×n 的奇异值分解 U Σ V H U\Sigma V^H UΣVH
A m × n , r a n k ( A ) = r A^{m\times n},rank(A)=r Am×n,rank(A)=r
V = ( v 1 , . . . , v r ∣ v r + 1 , . . . , v n ) = ( V 1 ∣ V 2 ) V=(v_1,...,v_r|v_{r+1},...,v_n)=(V_1|V_2) V=(v1,...,vr∣vr+1,...,vn)=(V1∣V2), v i v_i vi 为右奇异向量
U = ( u 1 , . . . , u r ∣ u r + 1 , . . . , u m ) = ( U 1 ∣ U 2 ) U=(u_1,...,u_r|u_{r+1},...,u_m)=(U_1|U_2) U=(u1,...,ur∣ur+1,...,um)=(U1∣U2), u i u_i ui 为左奇异向量
奇异值展开式:
A = σ 1 u 1 v 1 H + σ 2 u 2 v 2 H + . . . + σ r u r v r H A=\sigma_1u_1v_1^H+\sigma_2u_2v_2^H+...+\sigma_ru_rv_r^H A=σ1u1v1H+σ2u2v2H+...+σrurvrH
矩阵 A ∈ C m × n A\in C^{m\times n} A∈Cm×n 可定义线性变换 T A : C n → C m T_A:C^n\rightarrow C^m TA:Cn→Cm.
A A A 有奇异值分解 A = U Σ V H A=U\Sigma V^H A=UΣVH, 取 U U U 和 V V V 的列向量分别作 C n C^n Cn 和 C m C^m Cm 的标准正交基, 则线性变换 T A T_A TA 对应的变换矩阵为 Σ \Sigma Σ.
∀ α = V X ∈ C n \forall\alpha=VX\in C^n ∀α=VX∈Cn:
T A ( α ) = A α = ( U Σ V H ) V X = U ( Σ X ) = U [ σ 1 x 1 ⋮ σ r x r 0 ⋮ 0 ] T_A(\alpha)=A\alpha=(U\Sigma V^H)VX=U(\Sigma X)=U\begin{bmatrix} \sigma_1x_1\\ \vdots\\ \sigma_rx_r\\ 0\\ \vdots\\ 0 \end{bmatrix} TA(α)=Aα=(UΣVH)VX=U(ΣX)=U⎣⎢⎢⎢⎢⎢⎢⎢⎢⎡σ1x1⋮σrxr0⋮0⎦⎥⎥⎥⎥⎥⎥⎥⎥⎤
即原像 α \alpha α 的像在基 { u 1 , . . . , u m } \{u_1,...,u_m\} {u1,...,um} 的坐标为 ( σ 1 x 1 , . . . , σ r x r , 0 , . . . , 0 ) T (\sigma_1x_1,...,\sigma_rx_r,0,...,0)^T (σ1x1,...,σrxr,0,...,0)T.
Th 3.16 对实矩阵 A m × n A_{m\times n} Am×n, R n R_n Rn 中单位球面在线性变换 T A T_A TA 下像的集合是 R m R^m Rm:
A ∈ C n × n , r a n k ( A ) = r A\in C^{n\times n}, rank(A)=r A∈Cn×n,rank(A)=r, A A A 有极分解:
A = P Q = ( U Σ U H ) ( U V H ) A=PQ=(U\Sigma U^H)(UV^H) A=PQ=(UΣUH)(UVH)
其中: