【矩阵分析】期末复习急救包

文章目录

    • 写在前面
    • 第零章
      • 主要的矩阵类型
      • 一点点小知识
        • 第零章再看看特殊矩阵,其他全靠上学期啃老本(克拉默啥的)…
    • 第一章 特征值,特征向量,相似性
      • 相似性与特征值啃老本
      • 比较有用or需要注意的定理(因为有些定理太难了…)
    • 第二章 酉相似与酉等价
      • 我觉得比较重要的…
        • 酉矩阵与QR分解
        • 酉相似
        • 酉三角化,Schur化
        • 正规矩阵
        • 酉等价与奇异值分解(应该不会详细考,但AI未来很有用,所以就写的详细)
        • CS分解
    • 第四章 Hermite矩阵,对称矩阵以及相合
        • 一些重要定理
        • Hermite矩阵特征值的不等式
        • 酉相合与复对称矩阵
        • 相合以及对角化
        • 共轭相似以及共轭三角化
    • 第五章 向量的范数(norm)和矩阵的范数
        • 范数定义与内积定义
        • 范数的例子与内积的例子
        • 范数的代数性质
        • 范数的解析性质
        • 范数的对偶以及几何性质
        • 矩阵范数
        • 矩阵上的向量范数
        • 条件数
    • 写在最后

写在前面

​ 这里是AI20级学弱DoubleS,因为还有两天就要考菊粉了,然鹅还没怎么学(实则是想好好学可惜英语水平不足)因此有了这个小PDF来整理一下。本文叫做菊粉急救包,如果你还在上矩阵分析这门课或是认真听过老师讲课的同学,那么建议右上角关闭此文来节省时间,好好听课,都来得及。本文建议矩阵分析结课后再看,因为救急(还有两天考试),所以只节选了自己认为比较重要的结论,其中很多定理都只给了个证明思路,甚至很多都没有证明过程,因此作用仅为应对考试。我们这一届按老师说法,第三章不考,即使涉及第三章知识点也可以用其他章方法解决。除了本文之外,备考还需要做好课后习题,看下PPT!学好菊粉,对未来的AI学习有很大的帮助,线代是起点,菊粉yyds!最后,大家以后还要了解矩阵分析的知识,请翻阅 M a t r i x   A n a l y s i s Matrix\ Analysis Matrix Analysis.本文图片来自知乎,CSDN,PPT

第零章

主要的矩阵类型

  • 对称矩阵 A T = A A^T=A AT=A

  • 斜对称矩阵 A T = − A A^T=-A AT=A

  • 正交的(orthogonal) A T A = I A^TA=I ATA=I

  • 酉矩阵 A A ∗ = I AA*=I AA=I

  • Hermitian矩阵 A = A ∗ A=A^* A=A

  • 斜Hermitian矩阵 A = − A ∗ A A=-A^*A A=AA

  • 正规矩阵 A A ∗ = A ∗ A AA^*=A^*A AA=AA

一点点小知识

  • σ ( A ) \sigma(A) σ(A)为A所有特征值 λ \lambda λ的集合

    • 谱半径 ρ ( A ) = m a x { ∣ λ ∣ : λ ∈ σ ( A ) } \rho(A)=max\{|\lambda|:\lambda\in \sigma(A)\} ρ(A)=max{λ:λσ(A)}
  • 奇异:线代中的可逆,当且仅当 0 ∈ σ ( A ) 0\in \sigma(A) 0σ(A).

  • t r A A ∗ = 0 ↔ A = 0 trAA^*=0\leftrightarrow A=0 trAA=0A=0(A的所有元素平方和为0)

  • t r ( A B ) = t r ( B A ) tr(AB)=tr(BA) tr(AB)=tr(BA)(利用 ∑ \sum 可交换性)

  • < x , y > = y ∗ x =y^*x <x,y>=yx Euclid内积 纯量积

  • ∣ ∣ x ∣ ∣ 2 = < x , x > 1 2 = ( x ∗ x ) 1 2 ||x||_2=^{\frac{1}{2}}=(x^*x)^{\frac{1}{2}} x2=<x,x>21=(xx)21 Euclid范数 ∣ ∣ α x ∣ ∣ 2 = ∣ α ∣ ∣ ∣ x ∣ ∣ 2 ||\alpha x||_2=|\alpha|||x||_2 αx2=αx2

  • < x , y > = 0 =0 <x,y>=0,则x,y正交

  • 施密特标准正交化:(与线代描述不同,正交化同时标准化):

    y 1 = x 1 y_1=x_1 y1=x1

    z 1 = y 1 ∣ ∣ y 1 ∣ ∣ 2 z_1=\frac{y_1}{||y_1||_2} z1=y12y1

    y k = x k − < x k , z k − 1 > z k − 1 − < x k , z k − 2 > z k − 2 − … − < x k , z 1 > z 1 y_k=x_k-z_{k-1}-z_{k-2}-…-z_1 yk=xk<xk,zk1>zk1<xk,zk2>zk2<xk,z1>z1

    z k = y k ∣ ∣ y k ∣ ∣ 2 z_k=\frac{y_k}{||y_k||_2} zk=yk2yk 最后所有 z 1 , … , z k z_1,…,z_k z1,,zk为标准正交向量组

第零章再看看特殊矩阵,其他全靠上学期啃老本(克拉默啥的)…

第一章 特征值,特征向量,相似性

相似性与特征值啃老本

比较有用or需要注意的定理(因为有些定理太难了…)

  • 定理1.3.12:设 A , B ∈ M n A,B\in M_n A,BMn是可对角化的.那么A与B可交换,当且仅当它们是可同时对角化的.

    • 证明可将A,B转化为对角矩阵,再利用对角矩阵可交换性即可.
  • 定理1.3.22:假设 A , B ∈ M m , n ( m ≤ n ) A,B\in M_{m,n}(m\le n) A,BMm,n(mn)那么 B A BA BA n n n个特征值是 A B AB AB m m m个特征值加上 n − m n-m nm个0,也就是说, p B A ( t ) = t n − m p A B ( t ) p_{BA}(t)=t^{n-m}p_{AB}(t) pBA(t)=tnmpAB(t).如果 m = n m=n m=n A A A B B B中至少有一个非奇异,那么 A B AB AB B A BA BA相似.

  • 定理1.3.31 ( M i r s k y ) (Mirsky) (Mirsky):存在一个 A ∈ M n A\in M_n AMn,其特征值为 λ 1 , … , λ n \lambda_1,…,\lambda_n λ1,,λn,而主对角元素为 d 1 , … , d n d_1,…,d_n d1,,dn的充分必要条件是 ∑ i = 1 n λ i = ∑ i = 1 n d i \sum_{i=1}^n\lambda _i=\sum_{i=1}^n d_i i=1nλi=i=1ndi.

    • 利用 t r A = E 1 ( A ) = S 1 ( A ) trA=E_1(A)=S_1(A) trA=E1(A)=S1(A)证明.
  • 定理1.4.3 证明:算术重数不小于几何重数

    • 证明方法利用证明定理1.2.18: r a n k ( A − λ I ) ≥ n − k rank(A-\lambda I)\ge n-k rank(AλI)nk.

      A与其k重特征值 λ \lambda λ,令 B = A − λ I B=A-\lambda I B=AλI,所以0为B的k重特征值,从而 p B ( k ) ( 0 ) ≠ 0 p_B^{(k)}(0)\neq 0 pB(k)(0)=0(1.2.17),但 p B ( k ) ( 0 ) = k ! ( − 1 ) n − k E n − k ( B ) p_B^{(k)}(0)=k!(-1)^{n-k}E_{n-k}(B) pB(k)(0)=k!(1)nkEnk(B)(1.2.10),所以 E n − k ( B ) ≠ 0 E_{n-k}(B)\neq0 Enk(B)=0(B的n-k阶主子式之和),因此B的某个n-k阶主子式不为0,从而 r a n k ( B ) = r a n k ( A − λ I ) ≥ n − k rank(B)=rank(A-\lambda I)\ge n-k rank(B)=rank(AλI)nk(rank的定义),得证

  • 定义1.4.6:左特征向量 y ∗ A = λ y ∗ y^*A=\lambda y^* yA=λy

    • 结论1.4.6a:假设 A x = λ x Ax=\lambda x Ax=λx,如果 x ∗ A = μ x ∗ x^*A=\mu x^* xA=μx,那么 λ = μ \lambda=\mu λ=μ.

    • x为A右特征向量,y为左特征向量,若对应特征值不同,那么 y ∗ x = 0 y^*x=0 yx=0.(双正交定理)

    • 定理1.4.12:x为A特征向量,y为A左特征向量

      (a)如果 λ \lambda λ的代数重数为1,那么 y ∗ x ≠ 0 y^*x\neq 0 yx=0.

      (b)如果 λ \lambda λ的几何重数为1,那么它的代数重数为1,当且仅当 y ∗ x ≠ 0 y^*x\neq 0 yx=0.

第二章 酉相似与酉等价

我觉得比较重要的…

酉矩阵与QR分解
  • 定理2.1.2:每个标准正交的向量组都是线性无关的.
    • 先假设其线性相关找矛盾.
  • 定义2.1.3:酉矩阵U: U ∗ U = I U^*U=I UU=I,如果 U T U = I U^TU=I UTU=I,那么U是实正交矩阵.
  • 定理2.1.4:性质串:
    • U是酉矩阵
    • U是非奇异的,且 U ∗ = U − 1 U^*=U^{-1} U=U1
    • U ∗ U = I U^*U=I UU=I
    • U ∗ U^* U是酉矩阵
    • U的列、行分别标准正交
    • ∣ ∣ x ∣ ∣ 2 = ∣ ∣ U x ∣ ∣ 2 ||x||_2=||Ux||_2 x2=Ux2,x与Ux有相同Euclid范数
  • Euclid空间的封闭有界子集是紧集(闭且有界),因此酉矩阵的集合也是紧的
  • 定理2.1.14 QR分解 A m , n A_{m,n} Am,n(利用 U ( y , x ) U(y,x) U(y,x))(实际操作可参考施密特正交化过程)
    • 如果 n ≥ m n\ge m nm,则存在一个具有标准正交列向量的 Q ∈ M m , n Q\in M_{m,n} QMm,n以及一个具有非负主对角元素的上三角矩阵 R ∈ M m , n R\in M_{m,n} RMm,n,使得 A = Q R A=QR A=QR.
    • r a n k A = m rankA=m rankA=m,则Q和R就唯一确定,且R主对角元素全为正数.
    • 若m=n,则Q为酉矩阵.
    • 存在Q为酉矩阵,R为非负对角元素的上三角矩阵,使得 A = Q R A=QR A=QR.
    • 若A是实的,则Q与R也是实的.
酉相似

A = U B U ∗ A=UBU^* A=UBU

酉对角化:与一个对角矩阵酉相似.

A,B酉相似, ∑ i , j = 1 n , m ∣ b i j ∣ 2 = ∑ i , j = 1 n , m ∣ a i j ∣ 2 \sum_{i,j=1}^{n,m}|b_{ij}|^2=\sum_{i,j=1}^{n,m}|a_{ij}|^2 i,j=1n,mbij2=i,j=1n,maij2,即 t r B ∗ B = t r A ∗ A trB^*B=trA^*A trBB=trAA.

酉三角化,Schur化
  • 定理2.3.1(Schur型;Schur三角化):设 A ∈ M n A\in M_n AMn有特征值 λ 1 \lambda_1 λ1, λ 2 \lambda_2 λ2,…, λ n \lambda_n λn,它们以任意指定次序排列,设 A x = λ 1 x Ax=\lambda_1x Ax=λ1x的单位向量

    • 存在酉矩阵 U = [ x   u 2   …   u n ] ∈ M n U=[x\ u_2\ …\ u_n]\in M_n U=[x u2  un]Mn,使得 U ∗ A U = T = [ t i j ] U^*AU=T=[t_{ij}] UAU=T=[tij]是以 t i i = λ i t_{ii}=\lambda_i tii=λi,为对角元素的上三角矩阵.
    • 如果A仅有实特征值,那么x为实的,且存在实正交矩阵 Q = [ x   q 2   …   q n ] Q=[x\ q_2\ …\ q_n] Q=[x q2  qn]使得 Q T A Q = T = [ t i j ] Q^TAQ=T=[t_{ij}] QTAQ=T=[tij]是以 t i i = λ i t_{ii}=\lambda_i tii=λi为对角元素的上三角矩阵.
  • 推论

    • t r T = ∑ i = 1 n t i i trT=\sum_{i=1}^nt_{ii} trT=i=1ntii d e t T = ∏ i = 1 n t i i detT=\prod_{i=1}^nt_{ii} detT=i=1ntii
    • 2.4.3 C a y l e y − H a m i l t o n Cayley-Hamilton CayleyHamilton定理:设 p A ( t ) p_A(t) pA(t)是A的特征多项式,那么 p A ( A ) = 0 p_A(A)=0 pA(A)=0.
      • 重要应用1: A k A^k Ak可写成 I , A , A 2 , … , A n − 1 I,A,A^2,…,A^{n-1} I,A,A2,,An1的线性组合
      • 重要应用2:求逆矩阵(用伟哥的话来说就是必考)
        【矩阵分析】期末复习急救包_第1张图片
    • 2.4.4 关于线性矩阵的 S y l v e s t e r Sylvester Sylvester定理
      • 引理:如果 A X − X B = 0 AX-XB=0 AXXB=0,那么任何多项式 g ( t ) g(t) g(t)而言,都有 g ( A ) X − X g ( B ) = 0 g(A)X-Xg(B)=0 g(A)XXg(B)=0.
      • S y l v e s t e r Sylvester Sylvester定理: A X − X B = 0 AX-XB=0 AXXB=0有唯一解,当且仅当 σ ( A ) ∩ σ ( B ) = ∅ \sigma(A)\cap \sigma(B)=\varnothing σ(A)σ(B)=,此时 X = 0 X=0 X=0.
    • 每一个矩阵都可以分块对角化,每个方阵都是几乎可以对角化的
  • 2.4.8 交换族以及同时三角化

    • A,B可交换,那么存在一个A的特征值序列 α 1 , … , α n \alpha_1,…,\alpha_n α1,,αn,B的特征值序列 β 1 , … , β n \beta_1,…,\beta_n β1,,βn,使得A+B特征值为 α 1 + β 1 , … , α n + β n \alpha_1+\beta_1,…,\alpha_n+\beta_n α1+β1,,αn+βn,且AB特征值为 α 1 β 1 , … , α n β n \alpha_1\beta_1,…,\alpha_n\beta_n α1β1,,αnβn.特别地, σ ( A + B ) ⊆ σ ( A ) + σ ( B ) \sigma(A+B)\subseteq\sigma(A)+\sigma(B) σ(A+B)σ(A)+σ(B), σ ( A B ) ⊆ σ ( A ) σ ( B ) \sigma(AB)\subseteq\sigma(A)\sigma(B) σ(AB)σ(A)σ(B).(仅充分)
    • 谱半径对于可交换矩阵有次加性次积性.
    • A,B可交换,对于所有 α i ≠ β j \alpha_i\neq\beta_j αi=βj,那么A+B非奇异.
  • 2.4.10 rank-one摄动的特征值

    • A有特征值 λ 1 , … , λ n \lambda_1,…,\lambda_n λ1,λn,有 A x = λ 1 x Ax=\lambda_1 x Ax=λ1x,则对任意v, A + x v ∗ A+xv^* A+xv的特征值是 λ 1 + v ∗ x , λ 2 , … , λ n \lambda_1+v^*x,\lambda_2,…,\lambda_n λ1+vx,λ2,,λn.
正规矩阵

A A ∗ = A ∗ A AA^*=A^*A AA=AA

上三角矩阵若正规,必然为对角矩阵

  • 一系列等价命题

    • A是正规矩阵
    • A可以酉对角化: A = U Λ U ∗ A=U\Lambda U^* A=UΛU 谱分解
    • ∑ i , j = 1 n ∣ a i j ∣ 2 = ∑ i = 1 n ∣ λ i ∣ 2 \sum_{i,j=1}^n|a_{ij}|^2=\sum_{i=1}^n|\lambda_i|^2 i,j=1naij2=i=1nλi2
    • A有n个标准正交的特征向量
  • Hermite矩阵谱定理:设A是Hermite矩阵,特征值 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,…,\lambda_n λ1,λ2,,λn, Λ \Lambda Λ为特征值的对角矩阵

    • λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,…,\lambda_n λ1,λ2,,λn为实数
    • A可以酉对角化
    • 存在酉矩阵,使得 A = U Λ U ∗ A=U\Lambda U^* A=UΛU
  • 定理2.5.16(Fuglede-Putnam):

    • A,B正规, A X = X B AX=XB AX=XB,当且仅当 A ∗ X = X B ∗ A^*X=XB^* AX=XB

      (利用正规矩阵谱分解证明)

酉等价与奇异值分解(应该不会详细考,但AI未来很有用,所以就写的详细)

任何矩阵都可以通过酉等价来对角化

奇异值: A ∗ A A^*A AA非负特征值的算术平方根

【矩阵分析】期末复习急救包_第2张图片

σ 1 , σ 2 , … σ r \sigma_1,\sigma_2,…\sigma_r σ1,σ2,σr按照递减顺序排列

CS分解

【矩阵分析】期末复习急救包_第3张图片

Typora里面太难打了,直接上ppt(只有两天就考试了orz,应该记住形式就行)

第二章终于结束了,好累,喝口水继续第四章

第四章 Hermite矩阵,对称矩阵以及相合

Hermite矩阵: A = A ∗ A=A^* A=A

斜Hermite矩阵: A = − A ∗ A=-A^* A=A

  • Hermite矩阵的一些性质:

【矩阵分析】期末复习急救包_第4张图片

一些重要定理
  • 定理4.1.2(Toeplitz分解):每个A可写成 A = H + i K A=H+iK A=H+iK,均为Hermite矩阵或者A=H+S,H为Hermite矩阵,S为斜Hermite矩阵

  • 定理4.1.3 A为Hermite矩阵

    • x ∗ A x x^*Ax xAx对所有x都是实的(直接取共轭证明)
    • A的特征值是实的( λ = λ x ∗ x = x ∗ A x \lambda=\lambda x^*x=x^*Ax λ=λxx=xAx, x x ∗ = 1 xx^*=1 xx=1)
    • S ∗ A S S^*AS SAS是Hermite的(直接取*证明)
  • 定理4.1.4 Hermite矩阵判定(符合一条就是):

    • x ∗ A x x^*Ax xAx是实的
    • A是正规的且只有实特征值
    • S ∗ A S S^*AS SAS是Hermite矩阵
  • 定理4.1.8 x ∗ A x x^*Ax xAx是正实数的充要条件为A是Hermite矩阵且所有特征值为正

  • 4.2 Rayleigh

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tPUvxd6F-1624808339652)(C:\Users\Double S\AppData\Roaming\Typora\typora-user-images\image-20210627000549193.png)]

【矩阵分析】期末复习急救包_第5张图片

Hermite矩阵特征值的不等式
  • 定理4.3.1 Weyl 特征值同样按照从小到大排列

    λ i ( A + B ) ≤ λ i + j ( A ) + λ n − j ( B ) ⇔ A x = λ i + j ( A ) x , B x = λ n − j ( B ) x , ( A + B ) x = λ i ( A + B ) x \lambda_i(A+B)\le \lambda_{i+j}(A)+\lambda_{n-j}(B)\Leftrightarrow Ax=\lambda_{i+j}(A)x,Bx=\lambda_{n-j}(B)x,(A+B)x=\lambda_i(A+B)x λi(A+B)λi+j(A)+λnj(B)Ax=λi+j(A)x,Bx=λnj(B)x,(A+B)x=λi(A+B)x

    λ i − j + 1 ( A ) + λ j ( B ) ≤ λ i ( A + B ) ⇔ A x = λ i − j + 1 ( A ) x , B x = λ j ( B ) x , ( A + B ) x = λ i ( A + B ) x \lambda_{i-j+1}(A)+\lambda_j(B)\le \lambda_i(A+B)\Leftrightarrow Ax=\lambda_{i-j+1}(A)x,Bx=\lambda_{j}(B)x,(A+B)x=\lambda_i(A+B)x λij+1(A)+λj(B)λi(A+B)Ax=λij+1(A)x,Bx=λj(B)x,(A+B)x=λi(A+B)x

    • 有超级多推论,可以说Weyl是万恶之源,当赌狗赌他一手不重点考

    • 交错定理:A是Hermite矩阵,z为非零向量

      • λ i ( A ) ≤ λ i ( A + z z ∗ ) ≤ λ i + 1 ( A ) \lambda_i(A)\le\lambda_i(A+zz^*)\le\lambda_{i+1}(A) λi(A)λi(A+zz)λi+1(A)
      • λ n ( A ) ≤ λ n ( A + z z ∗ ) \lambda_n(A)\le\lambda_n(A+zz^*) λn(A)λn(A+zz)
    • 单调定理:A,B是Hermite矩阵,并假设B半正定(若正定,严格小于)

      • λ i ( A ) ≤ λ i ( A + B ) \lambda_i(A)\le\lambda_i(A+B) λi(A)λi(A+B),等式成立条件:B是奇异的,有非零向量x,使得 A x = λ i ( A ) x , B x = 0 , ( A + B ) x = λ i ( A + B ) x Ax=\lambda_i(A)x,Bx=0,(A+B)x=\lambda_i(A+B)x Ax=λi(A)x,Bx=0,(A+B)x=λi(A+B)x
      • λ i ( A ) + λ 1 ( B ) ≤ λ i ( A + B ) ≤ λ i ( A ) + λ n ( B ) \lambda_i(A)+\lambda_1(B)\le\lambda_i(A+B)\le\lambda_i(A)+\lambda_n(B) λi(A)+λ1(B)λi(A+B)λi(A)+λn(B),等式成立条件存在非零向量x是公共特征向量
    • Cauchy:B是Hermite矩阵,设 A = [ B y y ∗ a ] A = \left[ \begin{matrix} B & y\\ y^* & a\end{matrix} \right] A=[Byya],那么

      • λ 1 ( A ) ≤ λ 1 ( B ) ≤ λ 2 ( A ) ≤ … ≤ λ n ( A ) ≤ λ n ( B ) ≤ λ n + 1 A \lambda_1(A)\le\lambda_1(B)\le\lambda_2(A)\le…\le\lambda_n(A)\le\lambda_n(B)\le\lambda_{n+1}A λ1(A)λ1(B)λ2(A)λn(A)λn(B)λn+1A
      • 等号成立条件:存在非零向量z,为A,B对应特征值的公共特征向量,且 y ∗ z = 0 y*z=0 yz=0
      • 可以利用Cauchy与已知的特征值交错顺序反构造 A = [ Λ y y T a ] A = \left[ \begin{matrix} \Lambda & y\\ y^T & a \end{matrix}\right] A=[ΛyTya]
    • Poincare分离定理:A是Hermite矩阵, u 1 , … , u m u_1,…,u_m u1,,um是标准正交,设 B = [ u i ∗ A u j ] i , j = 1 m B =[u_i^*Au_j]_{i,j=1}^{m} B=[uiAuj]i,j=1m

      • λ i ( A ) ≤ λ i ( B ) ≤ λ i + n − m ( A ) \lambda_i(A)\le\lambda_i(B)\le\lambda_{i+n-m}(A) λi(A)λi(B)λi+nm(A)
酉相合与复对称矩阵

Youla是真的看不懂给跪了

【矩阵分析】期末复习急救包_第6张图片

  • 定义4.4.14:如果 A A ∗ = A ∗ A ‾ AA^*=\overline{A^*A} AA=AA,则 A A A是共轭正规的

    • A = [ A 11 A 12 0 A 22 ] A = \left[ \begin{matrix} A_{11} & A_{12}\\ 0 & A_{22}\end{matrix} \right] A=[A110A12A22],若A共轭正规,当且仅当 A 11 , A 12 A_{11},A_{12} A11,A12共轭正规(方阵)
  • 定理4.4.24:每一个A都与一个复对称矩阵相似(蕴含每一个复矩阵相似于它的转置,且可以写成两个 复对称矩阵的乘积) A = B C A=BC A=BC,B,C是对称矩阵且可以非奇异

  • 定理4.4.27:A是对称的,A可对角化的充要条件为它可以复正交对角化

相合以及对角化
  • 定义4.5.4:存在非奇异矩阵S(以下均为等价关系)

    • B = S A S ∗ B=SAS^* B=SAS,那么B与A是*相合的
    • B = S A S T B=SAS^T B=SAST,那么B与A是相合的
  • 定义4.5.6:A是Hermite矩阵 A的惯性指数(inertia)有序三数组

    • i ( A ) = ( i + ( A ) , i − ( A ) , i 0 ( A ) ) i(A)=(i_+(A),i_-(A),i_0(A)) i(A)=(i+(A),i(A),i0(A))
    • r a n k A = i + ( A ) + i − ( A ) rankA=i_+(A)+i_-(A) rankA=i+(A)+i(A)
  • 定理4.5.7:每一个Hermite矩阵都与它的惯性矩阵*相合

    • 惯性矩阵: I ( A ) = I i + ( A ) ⊕ I i − ( A ) ⊕ 0 i 0 ( A ) I(A)=I_{i_+(A)}\oplus I_{i_-(A)}\oplus 0_{i_0(A)} I(A)=Ii+(A)Ii(A)0i0(A)
  • 定理4.5.8(Sylvester惯性定律)(传递性,都*相合惯性矩阵)

    Herimite矩阵A,B,*相合,当且仅当它们正特征值个数与负特征值个数都相同

  • 定理4.5.9(Ostrowski)

    A是Hermite矩阵,S是非奇异矩阵,存在正实数 θ k ∈ [ σ n 2 , σ 1 2 ] \theta_k\in[\sigma_n^2,\sigma_1^2] θk[σn2,σ12], σ \sigma σ是S的奇异值,使得
    λ k ( S A S ∗ ) = θ k λ k ( A ) \lambda_k(SAS^*)=\theta_k\lambda_k(A) λk(SAS)=θkλk(A)
    利用Weyl(4.3.2a,4.3.2b)以及奇异值定义证明

  • 定理4.5.12

    A,B是对称矩阵,存在非奇异S,使得 A = S B S T A=SBS^T A=SBST的充要条件是 r a n k A = r a n k B rankA=rankB rankA=rankB

  • 定义4.5.16

    矩阵A被称为可共轭对角化的,如果存在非奇异S,以及一个对角矩阵 Λ \Lambda Λ,使得 A = S Λ S ‾ − 1 A=S\Lambda\overline{S}^{-1} A=SΛS1

共轭相似以及共轭三角化
  • 定义4.6.1:A,B是共轭相似的,如果存在非奇异S,使得 A = S B S ‾ − 1 A=SB\overline{S}^{-1} A=SBS1

  • 定义4.6.2:A是可共轭三角化的,如果存在非奇异S,使得 S − 1 A S ‾ S^{-1}A\overline{S} S1AS是上三角的

    • 可共轭对角化,可共轭酉三角化,可共轭酉对角化(酉相合)同理
  • 定理4.6.3:下列命题等价

    • A可共轭三角化
    • A可共轭酉三角化
    • A A ‾ A\overline{A} AA的每个特征值都是非负实数
  • 定理4.6.4:矩阵A是可以共轭酉三角化的,当且仅当它是对称的

  • 定义4.6.5: A x ‾ = λ x A\overline{x}=\lambda x Ax=λx,x为共轭特征向量, λ \lambda λ为共轭特征值

  • 定理4.6.11:A是可共轭三角化的,当且仅当 A A ‾ A\overline{A} AA可以相似对角化, A A ‾ A\overline{A} AA每个特征值都是非负实数,且 r a n k A = r a n k A A ‾ rankA=rankA\overline{A} rankA=rankAA.

第五章 向量的范数(norm)和矩阵的范数

该章为计算题集中营,重点关注

范数定义与内积定义
  • 定义5.1.1:函数 ∣ ∣ ∙ ∣ ∣ ||\bullet|| 称为范数,也称向量范数

    • ∣ ∣ x ∣ ∣ ≥ 0 ||x||\ge 0 x0 非负性
    • ∣ ∣ x ∣ ∣ = 0 ||x||=0 x=0当且仅当x=0 正性(1a)
    • ∣ ∣ c x ∣ ∣ = ∣ c ∣ ∣ ∣ x ∣ ∣ ||cx||=|c|||x|| cx=cx 齐性
    • ∣ ∣ x + y ∣ ∣ ≤ ∣ ∣ x ∣ ∣ + ∣ ∣ y ∣ ∣ ||x+y||\le||x||+||y|| x+yx+y 三角不等式(次加性)
    • 不满足(1a)而满足其他性质的函数 ∣ ∣ ∙ ∣ ∣ ||\bullet|| 称为半范数,非零向量的半范数可能为0
  • 引理5.1.2 半向量范数有 ∣ ∥ x ∥ − ∥ y ∥ ∣ ≤ ∥ x − y ∥ |\parallel x\parallel-\parallel y\parallel|\le\parallel x-y\parallel xyxy

  • 定义5.1.3 < ∙ , ∙ > <\bullet,\bullet> <,>内积

    • < x , x > ≥ 0 \ge0 <x,x>0 非负性
    • < x , x > = 0 =0 <x,x>=0当且仅当 x = 0 x=0 x=0 正性(1a)
    • < x + y , z > = < x , z > + < y , z > =+ <x+y,z>=<x,z>+<y,z> 加性
    • < c x , y > = c < x , y > =c <cx,y>=c<x,y> 齐性
    • < x , y > = < y , x > ‾ =\overline{} <x,y>=<y,x> Hermite性质
  • 定理5.1.4(Cauchy-Schwarz不等式)
    ∣ < x , y > ∣ 2 ≤ < x , x > < y , y > ||^2\le <x,y>2<x,x><y,y>
    等号成立条件是x,y线性相关

  • 推论5.1.7:内积定义的范数 ∥ x ∥ = < x , x > 1 2 \parallel x\parallel=^{\frac{1}{2}} x=<x,x>21

范数的例子与内积的例子
  • Euclid范数( l 2 l_2 l2范数)

    ∥ x ∥ 2 = ( ∣ x 1 ∣ 2 + … + ∣ x n ∣ 2 ) 1 2 \parallel x\parallel_2=(|x_1|^2+…+|x_n|^2)^\frac{1}{2} x2=(x12++xn2)21

    它由Euclid内积导出的

    它是酉不变的, ∥ U x ∥ 2 = ∥ x ∥ 2 \parallel Ux\parallel_2=\parallel x\parallel_2 Ux2=x2

  • 和范数( l 1 l_1 l1范数)(也是矩阵范数)

    ∥ x ∥ 1 = ∣ x 1 ∣ + … + ∣ x n ∣ \parallel x\parallel_1=|x_1|+…+|x_n| x1=x1++xn

    又称曼哈顿范数,也称出租车范数

  • 最大值范数( l ∞ l_\infty l范数)(纯量倍数是矩阵范数)

    ∥ x ∥ ∞ = m a x { ∣ x 1 ∣ , … , ∣ x n ∣ } \parallel x\parallel_\infty=max\{|x_1|,…,|x_n|\} x=max{x1,,xn}

  • l p l_p lp范数

    ∥ x ∥ p = ( ∣ x 1 ∣ p + … + ∣ x n ∣ p ) 1 p , p ≥ 1 \parallel x\parallel_p=(|x_1|^p+…+|x_n|^p)^\frac{1}{p},p\ge1 xp=(x1p++xnp)p1,p1

  • k范数(最大元素的绝对值非增顺序排列,取前k个)

    ∥ x ∥ [ k ] = ∣ x i 1 ∣ + … + ∣ x i k ∣ \parallel x\parallel_{[k]}=|x_{i_1}|+…+|x_{i_k}| x[k]=xi1++xik

  • ∥ ∙ ∥ S \parallel \bullet\parallel_S S范数,S是 M m , n M_{m,n} Mm,n列满秩 m ≥ n m\ge n mn

    ∥ x ∥ S = ∥ S x ∥ \parallel x\parallel_S=\parallel Sx\parallel xS=Sx

  • Frobenius内积与Frobenius范数(也是矩阵范数)

    • Frobenius内积: < A , B > F = t r B ∗ A _F=trB^*A <A,B>F=trBA
    • Frobenius范数: ∥ A ∥ 2 = ( t r A ∗ A ) 1 2 \parallel A\parallel_2=(trA^*A)^\frac{1}{2} A2=(trAA)21
  • 无限维向量空间的情况(连续函数)

    【矩阵分析】期末复习急救包_第7张图片

范数的代数性质

从给定的范数出发,可以用若干种方法构造出新的范数

  • 定理5.3.1

    f ( x ) = ∥ [ ∥ x ∥ α 1 , ∥ x ∥ α 2 , … , ∥ x ∥ α m ] T ∥ f(x)=\parallel [\parallel x\parallel_{\alpha_1},\parallel x\parallel_{\alpha_2},…,\parallel x\parallel_{\alpha_m}]^T\parallel f(x)=[xα1,xα2,,xαm]T 所定义的函数 f ( x ) f(x) f(x)是一个范数

范数的解析性质
  • 定义5.4.1

    向量序列 { x ( k ) } \{x^{(k)}\} {x(k)}关于 ∥ ∙ ∥ \parallel \bullet\parallel 收敛,当且仅当 lim ⁡ k → ∞ ∥ x ( k ) − x ∥ = 0 \lim_{k\rightarrow\infty}\parallel x^{(k)}-x\parallel=0 limkx(k)x=0

    如果 { x ( k ) } \{x^{(k)}\} {x(k)}关于 ∥ ∙ ∥ \parallel\bullet\parallel 收敛于x,我们写成关于 ∥ ∙ ∥ \parallel\bullet\parallel lim ⁡ k → ∞ x ( k ) = x \lim_{k\rightarrow\infty}x^{(k)}=x limkx(k)=x

  • 定理5.4.4 准范数

    f 1 . f 2 f_1.f_2 f1.f2是V上实值函数,设 B = { x ( 1 ) , … , x ( n ) } \Beta=\{x^{(1)},…,x^{(n)}\} B={x(1),,x(n)}是V的基向量,又对所有 z = [ z 1 … z n ] T z=[z_1…z_n]^T z=[z1zn]T x ( z ) = z 1 x ( 1 ) + … + z n x ( n ) x(z)=z_1x^{(1)}+…+z_nx^{(n)} x(z)=z1x(1)++znx(n),假设 f 1 , f 2 f_1,f_2 f1,f2

    • 正的: f i ( x ) ≥ 0 f_i(x)\ge 0 fi(x)0,又 f i ( x ) = 0 f_i(x)=0 fi(x)=0当且仅当 x = 0 x=0 x=0
    • 齐性的: f i ( α x ) = ∣ α ∣ f i ( x ) f_i(\alpha x)=|\alpha|f_i(x) fi(αx)=αfi(x)
    • 连续的: f i ( x ( z ) ) f_i(x(z)) fi(x(z))关于Euclid范数是连续的

    那么存在有限正常数 C m , C n C_m,C_n Cm,Cn使得 C m f 1 ( x ) ≤ f 2 ( x ) ≤ C n f 1 ( x ) C_mf_1(x)\le f_2(x)\le C_nf_1(x) Cmf1(x)f2(x)Cnf1(x)

  • 定义5.4.7 两个给定的范数是等价的

    如果只要一个向量序列 { x ( k ) } \{x^{(k)}\} {x(k)}关于其中一个范数收敛于一个向量x,那么它就关于另一个范数也收敛于x

  • 定义5.4.12 对偶范数

    f ( ∙ ) f(\bullet) f()是准范数,函数 f D ( y ) = m a x f ( x ) = 1 R e < x , y > = m a x f ( x ) = 1 R e y ∗ x f^D(y)=max_{f(x)=1}Re=max_{f(x)=1}Rey^*x fD(y)=maxf(x)=1Re<x,y>=maxf(x)=1Reyx称为 f f f的对偶范数

    另一种形式 f D ( y ) = m a x f ( x ) = 1 ∣ y ∗ x ∣ = m a x x ≠ 0 ∣ y ∗ x ∣ f ( x ) f^D(y)=max_{f(x)=1}|y^*x|=max_{x\neq 0}\frac{|y^*x|}{f(x)} fD(y)=maxf(x)=1yx=maxx=0f(x)yx

    • ∣ y ∗ x ∣ ≤ f ( x ) f D ( y ) |y^*x|\le f(x)f^D(y) yxf(x)fD(y)
    • ∣ y ∗ x ∣ ≤ f D ( x ) f ( y ) |y^*x|\le f^D(x)f(y) yxfD(x)f(y)

【矩阵分析】期末复习急救包_第8张图片

  • 定义5.4.18
    • 单调的: ∣ x ∣ ≤ ∣ y ∣ |x|\le|y| xy蕴含 ∥ x ∥ ≤ ∥ y ∥ \parallel x\parallel\le\parallel y\parallel xy
    • 绝对的: ∥ x ∥ = ∥ ∣ x ∣ ∥ \parallel x\parallel=\parallel |x|\parallel x=x
范数的对偶以及几何性质

我实在看不懂

随便写点概念,看形式

  • 球的定义: B ∥ ∙ ∥ ( r ; x ) = { y ∈ V : ∥ y − x ∥ ≤ r } B_{\parallel\bullet\parallel}(r;x)=\{y\in V:\parallel y-x\parallel\le r\} B(r;x)={yV:yxr}

  • 单位球, r = 1 , x = 0 r=1,x=0 r=1,x=0

  • 平衡的:x在单位球内, ∣ α ∣ = 1 |\alpha|=1 α=1 α x \alpha x αx也在球内

  • 凸的:若 ∣ ∣ x ∣ ∣ , ∣ ∣ y ∣ ∣ ≤ 1 ||x||,||y||\le 1 x,y1

    ∥ α x + ( 1 − α ) y ∥ ≤ ∥ α x ∥ + ∥ ( 1 − a ) y ∥ = α ∥ x ∥ + ( 1 − α ) ∥ y ∥ ≤ α + ( 1 − α ) = 1 \parallel \alpha x+(1-\alpha)y\parallel\le \parallel\alpha x\parallel+\parallel(1-a)y\parallel=\alpha\parallel x \parallel+(1-\alpha)\parallel y\parallel\le\alpha+(1-\alpha)=1 αx+(1α)yαx+(1a)y=αx+(1α)yα+(1α)=1

  • Co(S),S的凸包,包含S的最小凸集

矩阵范数

这一节看好是要算三道杠还是两道杠,别算错辽

  • 矩阵范数 ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet|||

    • ∣ ∣ ∣ A ∣ ∣ ∣ ≥ 0 |||A|||\ge 0 A0 非负性
    • ∣ ∣ ∣ A ∣ ∣ ∣ = 0 |||A|||=0 A=0当且仅当 A = 0 A=0 A=0 正性(1a)
    • ∣ ∣ ∣ c A ∣ ∣ ∣ = ∣ c ∣ ∣ ∣ ∣ A ∣ ∣ ∣ |||cA|||=|c||||A||| cA=cA 齐性
    • ∣ ∣ ∣ A + B ∣ ∣ ∣ ≤ ∣ ∣ ∣ A ∣ ∣ ∣ + ∣ ∣ ∣ B ∣ ∣ ∣ |||A+B|||\le |||A|||+|||B||| A+BA+B 三角不等式
    • ∣ ∣ ∣ A B ∣ ∣ ∣ ≤ ∣ ∣ ∣ A ∣ ∣ ∣ ∣ ∣ ∣ B ∣ ∣ ∣ |||AB|||\le|||A||||||B||| ABAB 次积性(不满足这一条的称为矩阵上的向量范数)
  • Frobenius范数的另一形式: ∣ ∣ A 2 ∣ ∣ = σ 1 ( A ) 2 + … + σ n ( A ) 2 ||A_2||=\sqrt{\sigma_1(A)^2+…+\sigma_n(A)^2} A2=σ1(A)2++σn(A)2

    因为 t r A A ∗ trAA^* trAA A A ∗ AA^* AA特征值之和

  • 向量范数诱导矩阵范数(算子范数,最小上界(Lub)范数): ∣ ∣ ∣ A ∣ ∣ ∣ = m a x ∣ ∣ x ∣ ∣ = 1 ∣ ∣ A x ∣ ∣ |||A|||=max_{||x||=1}||Ax|| A=maxx=1Ax

    • ∣ ∣ ∣ I ∣ ∣ ∣ = 1 |||I|||=1 I=1
    • ∣ ∣ A y ∣ ∣ ≤ ∣ ∣ ∣ A ∣ ∣ ∣ ∣ ∣ y ∣ ∣ ||Ay||\le|||A|||||y|| AyAy(相容的)
    • ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| 是矩阵范数
    • ∣ ∣ ∣ A ∣ ∣ ∣ = m a x ∣ ∣ x ∣ ∣ = ∣ ∣ y ∣ ∣ D = 1 ∣ y ∗ A x ∣ |||A|||=max_{||x||=||y||^D=1}|y^*Ax| A=maxx=yD=1yAx
  • 算子范数的例子

    • ∣ ∣ ∣ ∙ ∣ ∣ ∣ 1 |||\bullet|||_1 1称为最大列和矩阵范数

      ∣ ∣ ∣ A ∣ ∣ ∣ 1 = m a x 1 ≤ j ≤ n ∑ i = 1 n ∣ a i j ∣ |||A|||_1=max_{1\le j\le n}\sum_{i=1}^n|a_{ij}| A1=max1jni=1naij

    • ∣ ∣ ∣ ∙ ∣ ∣ ∣ ∞ |||\bullet|||_\infty 称为最大行和矩阵范数

      ∣ ∣ ∣ A ∣ ∣ ∣ ∞ = m a x 1 ≤ i ≤ n ∑ j = 1 n ∣ a i j ∣ |||A|||_\infty=max_{1\le i\le n}\sum_{j=1}^n|a_{ij}| A=max1inj=1naij

    • ∣ ∣ ∣ ∙ ∣ ∣ ∣ 2 |||\bullet|||_2 2称为谱范数

      ∣ ∣ ∣ A ∣ ∣ ∣ 2 = σ 1 ( A ) |||A|||_2=\sigma_1(A) A2=σ1(A)

    • ∣ ∣ ∣ ∙ ∣ ∣ ∣ S |||\bullet|||_S S

      ∣ ∣ ∣ A ∣ ∣ ∣ S = ∣ ∣ ∣ S A S − 1 ∣ ∣ ∣ |||A|||_S=|||SAS^{-1}||| AS=SAS1

  • 定理5.6.9: ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| 是一个矩阵范数

    • ∣ λ ∣ ≤ ρ ( A ) ≤ ∣ ∣ ∣ A ∣ ∣ ∣ |\lambda|\le \rho(A)\le |||A||| λρ(A)A
    • 如果A非奇异,那么 ρ ( A ) ≤ ∣ λ ∣ ≤ 1 ∣ ∣ ∣ A − 1 ∣ ∣ ∣ \rho(A)\le |\lambda|\le \frac{1}{|||A^{-1}|||} ρ(A)λA11
  • 引理5.6.10:存在 ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| 使得 ρ ( A ) ≤ ∣ ∣ ∣ A ∣ ∣ ∣ ≤ ρ ( A ) + ε \rho(A)\le |||A|||\le\rho(A)+\varepsilon ρ(A)Aρ(A)+ε

  • 引理5.6.11:若存在矩阵范数使得 ∣ ∣ ∣ A ∣ ∣ ∣ < 1 |||A|||<1 A<1,那么 lim ⁡ k → ∞ A k = 0 \lim_{k\rightarrow\infty}A^k=0 limkAk=0

    • 定理5.6.12: lim ⁡ k → ∞ A k = 0 \lim_{k\rightarrow\infty}A^k=0 limkAk=0,当且仅当 ρ ( A ) < 1 \rho(A)<1 ρ(A)<1
  • 推论5.6.13(Gelfand公式): ρ ( A ) = lim ⁡ k → ∞ ∣ ∣ ∣ A k ∣ ∣ ∣ 1 k \rho(A)=\lim_{k\rightarrow\infty}|||A^k|||^\frac{1}{k} ρ(A)=limkAkk1

  • 定理5.6.36 ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| 是矩阵范数,由 ∣ ∣ ∙ ∣ ∣ ||\bullet|| 诱导

    • ∣ ∣ ∙ ∣ ∣ ||\bullet|| 是绝对范数
    • ∣ ∣ ∙ ∣ ∣ ||\bullet|| 是单调范数
    • 如果 Λ = d i a g ( λ 1 , … , λ n ) \Lambda=diag(\lambda_1,…,\lambda_n) Λ=diag(λ1,,λn),那么 ∣ ∣ ∣ Λ ∣ ∣ ∣ = m a x 1 ≤ i ≤ n ∣ λ i ∣ |||\Lambda|||=max_{1\le i\le n}|\lambda_i| Λ=max1inλi
  • 定义5.6.38 对偶范数

    ∣ ∣ A ∣ ∣ D = m a x ∣ ∣ B ∣ ∣ = 1 R e < A , B > F = m a x ∣ ∣ B ∣ ∣ = 1 R e   t r B ∗ A ||A||^D=max_{||B||=1}Re_F=max_{||B||=1}Re\ trB^*A AD=maxB=1Re<A,B>F=maxB=1Re trBA

  • 定理5.6.42:绝对范数 ∣ ∣ ∙ ∣ ∣ ||\bullet|| 诱导的矩阵范数 ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| ,设 ∣ ∣ ∣ ∙ ∣ ∣ ∣ D |||\bullet|||^D D是其对偶范数,有 Λ = d i a g ( λ 1 , … , λ n ) \Lambda=diag(\lambda_1,…,\lambda_n) Λ=diag(λ1,,λn)那么

    • ∣ ∣ ∣ ∙ ∣ ∣ ∣ D |||\bullet|||^D D是矩阵范数
    • ∣ ∣ ∣ Λ ∣ ∣ ∣ = ∣ λ 1 ∣ + … + ∣ λ n ∣ |||\Lambda|||=|\lambda_1|+…+|\lambda_n| Λ=λ1++λn
矩阵上的向量范数
  • 如果 G ( ∙ ) G(\bullet) G()是范数,若S,T是非奇异,那么 G S , T ( A ) = G ( S A T ) G_{S,T}(A)=G(SAT) GS,T(A)=G(SAT)

    即使 G ( ∙ ) G(\bullet) G()是矩阵范数, G S , T ( ∙ ) G_{S,T}(\bullet) GS,T()也不一定次积性,除非 T = S − 1 T=S^{-1} T=S1

条件数

【矩阵分析】期末复习急救包_第9张图片

【矩阵分析】期末复习急救包_第10张图片

写在最后

本文算是结束了吧,推荐大家保存好Horn这本好书,以后可以当作参考资料来翻阅。明天就要考菊粉了,明早起来看一下,应该差不多了。怎么那么紧啊!

【矩阵分析】期末复习急救包_第11张图片

最后祝大家都能考好!

DoubleS 2021.6.27

你可能感兴趣的:(期末复习,矩阵)