这里是AI20级学弱DoubleS,因为还有两天就要考菊粉了,然鹅还没怎么学(实则是想好好学可惜英语水平不足)因此有了这个小PDF来整理一下。本文叫做菊粉急救包,如果你还在上矩阵分析这门课或是认真听过老师讲课的同学,那么建议右上角关闭此文来节省时间,好好听课,都来得及。本文建议矩阵分析结课后再看,因为救急(还有两天考试),所以只节选了自己认为比较重要的结论,其中很多定理都只给了个证明思路,甚至很多都没有证明过程,因此作用仅为应对考试。我们这一届按老师说法,第三章不考,即使涉及第三章知识点也可以用其他章方法解决。除了本文之外,备考还需要做好课后习题,看下PPT!学好菊粉,对未来的AI学习有很大的帮助,线代是起点,菊粉yyds!最后,大家以后还要了解矩阵分析的知识,请翻阅 M a t r i x A n a l y s i s Matrix\ Analysis Matrix Analysis.本文图片来自知乎,CSDN,PPT
对称矩阵 A T = A A^T=A AT=A
斜对称矩阵 A T = − A A^T=-A AT=−A
正交的(orthogonal) A T A = I A^TA=I ATA=I
酉矩阵 A A ∗ = I AA*=I AA∗=I
Hermitian矩阵 A = A ∗ A=A^* A=A∗
斜Hermitian矩阵 A = − A ∗ A A=-A^*A A=−A∗A
正规矩阵 A A ∗ = A ∗ A AA^*=A^*A AA∗=A∗A
谱 σ ( A ) \sigma(A) σ(A)为A所有特征值 λ \lambda λ的集合
奇异:线代中的可逆,当且仅当 0 ∈ σ ( A ) 0\in \sigma(A) 0∈σ(A).
t r A A ∗ = 0 ↔ A = 0 trAA^*=0\leftrightarrow A=0 trAA∗=0↔A=0(A的所有元素平方和为0)
t r ( A B ) = t r ( B A ) tr(AB)=tr(BA) tr(AB)=tr(BA)(利用 ∑ \sum ∑可交换性)
< x , y > = y ∗ x
∣ ∣ x ∣ ∣ 2 = < x , x > 1 2 = ( x ∗ x ) 1 2 ||x||_2=
若 < x , y > = 0
施密特标准正交化:(与线代描述不同,正交化同时标准化):
y 1 = x 1 y_1=x_1 y1=x1
z 1 = y 1 ∣ ∣ y 1 ∣ ∣ 2 z_1=\frac{y_1}{||y_1||_2} z1=∣∣y1∣∣2y1
y k = x k − < x k , z k − 1 > z k − 1 − < x k , z k − 2 > z k − 2 − … − < x k , z 1 > z 1 y_k=x_k-
z k = y k ∣ ∣ y k ∣ ∣ 2 z_k=\frac{y_k}{||y_k||_2} zk=∣∣yk∣∣2yk 最后所有 z 1 , … , z k z_1,…,z_k z1,…,zk为标准正交向量组
定理1.3.12:设 A , B ∈ M n A,B\in M_n A,B∈Mn是可对角化的.那么A与B可交换,当且仅当它们是可同时对角化的.
定理1.3.22:假设 A , B ∈ M m , n ( m ≤ n ) A,B\in M_{m,n}(m\le n) A,B∈Mm,n(m≤n)那么 B A BA BA的 n n n个特征值是 A B AB AB的 m m m个特征值加上 n − m n-m n−m个0,也就是说, p B A ( t ) = t n − m p A B ( t ) p_{BA}(t)=t^{n-m}p_{AB}(t) pBA(t)=tn−mpAB(t).如果 m = n m=n m=n且 A A A与 B B B中至少有一个非奇异,那么 A B AB AB与 B A BA BA相似.
定理1.3.31 ( M i r s k y ) (Mirsky) (Mirsky):存在一个 A ∈ M n A\in M_n A∈Mn,其特征值为 λ 1 , … , λ n \lambda_1,…,\lambda_n λ1,…,λn,而主对角元素为 d 1 , … , d n d_1,…,d_n d1,…,dn的充分必要条件是 ∑ i = 1 n λ i = ∑ i = 1 n d i \sum_{i=1}^n\lambda _i=\sum_{i=1}^n d_i ∑i=1nλi=∑i=1ndi.
定理1.4.3 证明:算术重数不小于几何重数
证明方法利用证明定理1.2.18: r a n k ( A − λ I ) ≥ n − k rank(A-\lambda I)\ge n-k rank(A−λI)≥n−k.
A与其k重特征值 λ \lambda λ,令 B = A − λ I B=A-\lambda I B=A−λI,所以0为B的k重特征值,从而 p B ( k ) ( 0 ) ≠ 0 p_B^{(k)}(0)\neq 0 pB(k)(0)=0(1.2.17),但 p B ( k ) ( 0 ) = k ! ( − 1 ) n − k E n − k ( B ) p_B^{(k)}(0)=k!(-1)^{n-k}E_{n-k}(B) pB(k)(0)=k!(−1)n−kEn−k(B)(1.2.10),所以 E n − k ( B ) ≠ 0 E_{n-k}(B)\neq0 En−k(B)=0(B的n-k阶主子式之和),因此B的某个n-k阶主子式不为0,从而 r a n k ( B ) = r a n k ( A − λ I ) ≥ n − k rank(B)=rank(A-\lambda I)\ge n-k rank(B)=rank(A−λI)≥n−k(rank的定义),得证
定义1.4.6:左特征向量 y ∗ A = λ y ∗ y^*A=\lambda y^* y∗A=λy∗
结论1.4.6a:假设 A x = λ x Ax=\lambda x Ax=λx,如果 x ∗ A = μ x ∗ x^*A=\mu x^* x∗A=μx∗,那么 λ = μ \lambda=\mu λ=μ.
x为A右特征向量,y为左特征向量,若对应特征值不同,那么 y ∗ x = 0 y^*x=0 y∗x=0.(双正交定理)
定理1.4.12:x为A特征向量,y为A左特征向量
(a)如果 λ \lambda λ的代数重数为1,那么 y ∗ x ≠ 0 y^*x\neq 0 y∗x=0.
(b)如果 λ \lambda λ的几何重数为1,那么它的代数重数为1,当且仅当 y ∗ x ≠ 0 y^*x\neq 0 y∗x=0.
A = U B U ∗ A=UBU^* A=UBU∗
酉对角化:与一个对角矩阵酉相似.
A,B酉相似, ∑ i , j = 1 n , m ∣ b i j ∣ 2 = ∑ i , j = 1 n , m ∣ a i j ∣ 2 \sum_{i,j=1}^{n,m}|b_{ij}|^2=\sum_{i,j=1}^{n,m}|a_{ij}|^2 ∑i,j=1n,m∣bij∣2=∑i,j=1n,m∣aij∣2,即 t r B ∗ B = t r A ∗ A trB^*B=trA^*A trB∗B=trA∗A.
定理2.3.1(Schur型;Schur三角化):设 A ∈ M n A\in M_n A∈Mn有特征值 λ 1 \lambda_1 λ1, λ 2 \lambda_2 λ2,…, λ n \lambda_n λn,它们以任意指定次序排列,设 A x = λ 1 x Ax=\lambda_1x Ax=λ1x的单位向量
推论
2.4.8 交换族以及同时三角化
2.4.10 rank-one摄动的特征值
A A ∗ = A ∗ A AA^*=A^*A AA∗=A∗A
上三角矩阵若正规,必然为对角矩阵
一系列等价命题
Hermite矩阵谱定理:设A是Hermite矩阵,特征值 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,…,\lambda_n λ1,λ2,…,λn, Λ \Lambda Λ为特征值的对角矩阵
定理2.5.16(Fuglede-Putnam):
A,B正规, A X = X B AX=XB AX=XB,当且仅当 A ∗ X = X B ∗ A^*X=XB^* A∗X=XB∗
(利用正规矩阵谱分解证明)
任何矩阵都可以通过酉等价来对角化
奇异值: A ∗ A A^*A A∗A非负特征值的算术平方根
σ 1 , σ 2 , … σ r \sigma_1,\sigma_2,…\sigma_r σ1,σ2,…σr按照递减顺序排列
Typora里面太难打了,直接上ppt(只有两天就考试了orz,应该记住形式就行)
第二章终于结束了,好累,喝口水继续第四章
Hermite矩阵: A = A ∗ A=A^* A=A∗
斜Hermite矩阵: A = − A ∗ A=-A^* A=−A∗
定理4.1.2(Toeplitz分解):每个A可写成 A = H + i K A=H+iK A=H+iK,均为Hermite矩阵或者A=H+S,H为Hermite矩阵,S为斜Hermite矩阵
定理4.1.3 A为Hermite矩阵
定理4.1.4 Hermite矩阵判定(符合一条就是):
定理4.1.8 x ∗ A x x^*Ax x∗Ax是正实数的充要条件为A是Hermite矩阵且所有特征值为正
4.2 Rayleigh
定理4.3.1 Weyl 特征值同样按照从小到大排列
λ i ( A + B ) ≤ λ i + j ( A ) + λ n − j ( B ) ⇔ A x = λ i + j ( A ) x , B x = λ n − j ( B ) x , ( A + B ) x = λ i ( A + B ) x \lambda_i(A+B)\le \lambda_{i+j}(A)+\lambda_{n-j}(B)\Leftrightarrow Ax=\lambda_{i+j}(A)x,Bx=\lambda_{n-j}(B)x,(A+B)x=\lambda_i(A+B)x λi(A+B)≤λi+j(A)+λn−j(B)⇔Ax=λi+j(A)x,Bx=λn−j(B)x,(A+B)x=λi(A+B)x
λ i − j + 1 ( A ) + λ j ( B ) ≤ λ i ( A + B ) ⇔ A x = λ i − j + 1 ( A ) x , B x = λ j ( B ) x , ( A + B ) x = λ i ( A + B ) x \lambda_{i-j+1}(A)+\lambda_j(B)\le \lambda_i(A+B)\Leftrightarrow Ax=\lambda_{i-j+1}(A)x,Bx=\lambda_{j}(B)x,(A+B)x=\lambda_i(A+B)x λi−j+1(A)+λj(B)≤λi(A+B)⇔Ax=λi−j+1(A)x,Bx=λj(B)x,(A+B)x=λi(A+B)x
有超级多推论,可以说Weyl是万恶之源,当赌狗赌他一手不重点考
交错定理:A是Hermite矩阵,z为非零向量
单调定理:A,B是Hermite矩阵,并假设B半正定(若正定,严格小于)
Cauchy:B是Hermite矩阵,设 A = [ B y y ∗ a ] A = \left[ \begin{matrix} B & y\\ y^* & a\end{matrix} \right] A=[By∗ya],那么
Poincare分离定理:A是Hermite矩阵, u 1 , … , u m u_1,…,u_m u1,…,um是标准正交,设 B = [ u i ∗ A u j ] i , j = 1 m B =[u_i^*Au_j]_{i,j=1}^{m} B=[ui∗Auj]i,j=1m
Youla是真的看不懂给跪了
定义4.4.14:如果 A A ∗ = A ∗ A ‾ AA^*=\overline{A^*A} AA∗=A∗A,则 A A A是共轭正规的
定理4.4.24:每一个A都与一个复对称矩阵相似(蕴含每一个复矩阵相似于它的转置,且可以写成两个 复对称矩阵的乘积) A = B C A=BC A=BC,B,C是对称矩阵且可以非奇异
定理4.4.27:A是对称的,A可对角化的充要条件为它可以复正交对角化
定义4.5.4:存在非奇异矩阵S(以下均为等价关系)
定义4.5.6:A是Hermite矩阵 A的惯性指数(inertia)有序三数组
定理4.5.7:每一个Hermite矩阵都与它的惯性矩阵*相合
定理4.5.8(Sylvester惯性定律)(传递性,都*相合惯性矩阵)
Herimite矩阵A,B,*相合,当且仅当它们正特征值个数与负特征值个数都相同
定理4.5.9(Ostrowski)
A是Hermite矩阵,S是非奇异矩阵,存在正实数 θ k ∈ [ σ n 2 , σ 1 2 ] \theta_k\in[\sigma_n^2,\sigma_1^2] θk∈[σn2,σ12], σ \sigma σ是S的奇异值,使得
λ k ( S A S ∗ ) = θ k λ k ( A ) \lambda_k(SAS^*)=\theta_k\lambda_k(A) λk(SAS∗)=θkλk(A)
利用Weyl(4.3.2a,4.3.2b)以及奇异值定义证明
定理4.5.12
A,B是对称矩阵,存在非奇异S,使得 A = S B S T A=SBS^T A=SBST的充要条件是 r a n k A = r a n k B rankA=rankB rankA=rankB
定义4.5.16
矩阵A被称为可共轭对角化的,如果存在非奇异S,以及一个对角矩阵 Λ \Lambda Λ,使得 A = S Λ S ‾ − 1 A=S\Lambda\overline{S}^{-1} A=SΛS−1
定义4.6.1:A,B是共轭相似的,如果存在非奇异S,使得 A = S B S ‾ − 1 A=SB\overline{S}^{-1} A=SBS−1
定义4.6.2:A是可共轭三角化的,如果存在非奇异S,使得 S − 1 A S ‾ S^{-1}A\overline{S} S−1AS是上三角的
定理4.6.3:下列命题等价
定理4.6.4:矩阵A是可以共轭酉三角化的,当且仅当它是对称的
定义4.6.5: A x ‾ = λ x A\overline{x}=\lambda x Ax=λx,x为共轭特征向量, λ \lambda λ为共轭特征值
定理4.6.11:A是可共轭三角化的,当且仅当 A A ‾ A\overline{A} AA可以相似对角化, A A ‾ A\overline{A} AA每个特征值都是非负实数,且 r a n k A = r a n k A A ‾ rankA=rankA\overline{A} rankA=rankAA.
该章为计算题集中营,重点关注
定义5.1.1:函数 ∣ ∣ ∙ ∣ ∣ ||\bullet|| ∣∣∙∣∣称为范数,也称向量范数
引理5.1.2 半向量范数有 ∣ ∥ x ∥ − ∥ y ∥ ∣ ≤ ∥ x − y ∥ |\parallel x\parallel-\parallel y\parallel|\le\parallel x-y\parallel ∣∥x∥−∥y∥∣≤∥x−y∥
定义5.1.3 < ∙ , ∙ > <\bullet,\bullet> <∙,∙>内积
定理5.1.4(Cauchy-Schwarz不等式)
∣ < x , y > ∣ 2 ≤ < x , x > < y , y > |
等号成立条件是x,y线性相关
推论5.1.7:内积定义的范数 ∥ x ∥ = < x , x > 1 2 \parallel x\parallel=
Euclid范数( l 2 l_2 l2范数)
∥ x ∥ 2 = ( ∣ x 1 ∣ 2 + … + ∣ x n ∣ 2 ) 1 2 \parallel x\parallel_2=(|x_1|^2+…+|x_n|^2)^\frac{1}{2} ∥x∥2=(∣x1∣2+…+∣xn∣2)21
它由Euclid内积导出的
它是酉不变的, ∥ U x ∥ 2 = ∥ x ∥ 2 \parallel Ux\parallel_2=\parallel x\parallel_2 ∥Ux∥2=∥x∥2
和范数( l 1 l_1 l1范数)(也是矩阵范数)
∥ x ∥ 1 = ∣ x 1 ∣ + … + ∣ x n ∣ \parallel x\parallel_1=|x_1|+…+|x_n| ∥x∥1=∣x1∣+…+∣xn∣
又称曼哈顿范数,也称出租车范数
最大值范数( l ∞ l_\infty l∞范数)(纯量倍数是矩阵范数)
∥ x ∥ ∞ = m a x { ∣ x 1 ∣ , … , ∣ x n ∣ } \parallel x\parallel_\infty=max\{|x_1|,…,|x_n|\} ∥x∥∞=max{∣x1∣,…,∣xn∣}
l p l_p lp范数
∥ x ∥ p = ( ∣ x 1 ∣ p + … + ∣ x n ∣ p ) 1 p , p ≥ 1 \parallel x\parallel_p=(|x_1|^p+…+|x_n|^p)^\frac{1}{p},p\ge1 ∥x∥p=(∣x1∣p+…+∣xn∣p)p1,p≥1
k范数(最大元素的绝对值非增顺序排列,取前k个)
∥ x ∥ [ k ] = ∣ x i 1 ∣ + … + ∣ x i k ∣ \parallel x\parallel_{[k]}=|x_{i_1}|+…+|x_{i_k}| ∥x∥[k]=∣xi1∣+…+∣xik∣
∥ ∙ ∥ S \parallel \bullet\parallel_S ∥∙∥S范数,S是 M m , n M_{m,n} Mm,n列满秩 m ≥ n m\ge n m≥n
∥ x ∥ S = ∥ S x ∥ \parallel x\parallel_S=\parallel Sx\parallel ∥x∥S=∥Sx∥
Frobenius内积与Frobenius范数(也是矩阵范数)
无限维向量空间的情况(连续函数)
从给定的范数出发,可以用若干种方法构造出新的范数
定理5.3.1
f ( x ) = ∥ [ ∥ x ∥ α 1 , ∥ x ∥ α 2 , … , ∥ x ∥ α m ] T ∥ f(x)=\parallel [\parallel x\parallel_{\alpha_1},\parallel x\parallel_{\alpha_2},…,\parallel x\parallel_{\alpha_m}]^T\parallel f(x)=∥[∥x∥α1,∥x∥α2,…,∥x∥αm]T∥ 所定义的函数 f ( x ) f(x) f(x)是一个范数
定义5.4.1
向量序列 { x ( k ) } \{x^{(k)}\} {x(k)}关于 ∥ ∙ ∥ \parallel \bullet\parallel ∥∙∥收敛,当且仅当 lim k → ∞ ∥ x ( k ) − x ∥ = 0 \lim_{k\rightarrow\infty}\parallel x^{(k)}-x\parallel=0 limk→∞∥x(k)−x∥=0
如果 { x ( k ) } \{x^{(k)}\} {x(k)}关于 ∥ ∙ ∥ \parallel\bullet\parallel ∥∙∥收敛于x,我们写成关于 ∥ ∙ ∥ \parallel\bullet\parallel ∥∙∥有 lim k → ∞ x ( k ) = x \lim_{k\rightarrow\infty}x^{(k)}=x limk→∞x(k)=x
定理5.4.4 准范数
f 1 . f 2 f_1.f_2 f1.f2是V上实值函数,设 B = { x ( 1 ) , … , x ( n ) } \Beta=\{x^{(1)},…,x^{(n)}\} B={x(1),…,x(n)}是V的基向量,又对所有 z = [ z 1 … z n ] T z=[z_1…z_n]^T z=[z1…zn]T有 x ( z ) = z 1 x ( 1 ) + … + z n x ( n ) x(z)=z_1x^{(1)}+…+z_nx^{(n)} x(z)=z1x(1)+…+znx(n),假设 f 1 , f 2 f_1,f_2 f1,f2是
那么存在有限正常数 C m , C n C_m,C_n Cm,Cn使得 C m f 1 ( x ) ≤ f 2 ( x ) ≤ C n f 1 ( x ) C_mf_1(x)\le f_2(x)\le C_nf_1(x) Cmf1(x)≤f2(x)≤Cnf1(x)
定义5.4.7 两个给定的范数是等价的
如果只要一个向量序列 { x ( k ) } \{x^{(k)}\} {x(k)}关于其中一个范数收敛于一个向量x,那么它就关于另一个范数也收敛于x
定义5.4.12 对偶范数
设 f ( ∙ ) f(\bullet) f(∙)是准范数,函数 f D ( y ) = m a x f ( x ) = 1 R e < x , y > = m a x f ( x ) = 1 R e y ∗ x f^D(y)=max_{f(x)=1}Re
另一种形式 f D ( y ) = m a x f ( x ) = 1 ∣ y ∗ x ∣ = m a x x ≠ 0 ∣ y ∗ x ∣ f ( x ) f^D(y)=max_{f(x)=1}|y^*x|=max_{x\neq 0}\frac{|y^*x|}{f(x)} fD(y)=maxf(x)=1∣y∗x∣=maxx=0f(x)∣y∗x∣
我实在看不懂
随便写点概念,看形式
球的定义: B ∥ ∙ ∥ ( r ; x ) = { y ∈ V : ∥ y − x ∥ ≤ r } B_{\parallel\bullet\parallel}(r;x)=\{y\in V:\parallel y-x\parallel\le r\} B∥∙∥(r;x)={y∈V:∥y−x∥≤r}
单位球, r = 1 , x = 0 r=1,x=0 r=1,x=0
平衡的:x在单位球内, ∣ α ∣ = 1 |\alpha|=1 ∣α∣=1的 α x \alpha x αx也在球内
凸的:若 ∣ ∣ x ∣ ∣ , ∣ ∣ y ∣ ∣ ≤ 1 ||x||,||y||\le 1 ∣∣x∣∣,∣∣y∣∣≤1
∥ α x + ( 1 − α ) y ∥ ≤ ∥ α x ∥ + ∥ ( 1 − a ) y ∥ = α ∥ x ∥ + ( 1 − α ) ∥ y ∥ ≤ α + ( 1 − α ) = 1 \parallel \alpha x+(1-\alpha)y\parallel\le \parallel\alpha x\parallel+\parallel(1-a)y\parallel=\alpha\parallel x \parallel+(1-\alpha)\parallel y\parallel\le\alpha+(1-\alpha)=1 ∥αx+(1−α)y∥≤∥αx∥+∥(1−a)y∥=α∥x∥+(1−α)∥y∥≤α+(1−α)=1
Co(S),S的凸包,包含S的最小凸集
这一节看好是要算三道杠还是两道杠,别算错辽
矩阵范数 ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| ∣∣∣∙∣∣∣
Frobenius范数的另一形式: ∣ ∣ A 2 ∣ ∣ = σ 1 ( A ) 2 + … + σ n ( A ) 2 ||A_2||=\sqrt{\sigma_1(A)^2+…+\sigma_n(A)^2} ∣∣A2∣∣=σ1(A)2+…+σn(A)2
因为 t r A A ∗ trAA^* trAA∗是 A A ∗ AA^* AA∗特征值之和
向量范数诱导矩阵范数(算子范数,最小上界(Lub)范数): ∣ ∣ ∣ A ∣ ∣ ∣ = m a x ∣ ∣ x ∣ ∣ = 1 ∣ ∣ A x ∣ ∣ |||A|||=max_{||x||=1}||Ax|| ∣∣∣A∣∣∣=max∣∣x∣∣=1∣∣Ax∣∣
算子范数的例子
∣ ∣ ∣ ∙ ∣ ∣ ∣ 1 |||\bullet|||_1 ∣∣∣∙∣∣∣1称为最大列和矩阵范数
∣ ∣ ∣ A ∣ ∣ ∣ 1 = m a x 1 ≤ j ≤ n ∑ i = 1 n ∣ a i j ∣ |||A|||_1=max_{1\le j\le n}\sum_{i=1}^n|a_{ij}| ∣∣∣A∣∣∣1=max1≤j≤n∑i=1n∣aij∣
∣ ∣ ∣ ∙ ∣ ∣ ∣ ∞ |||\bullet|||_\infty ∣∣∣∙∣∣∣∞称为最大行和矩阵范数
∣ ∣ ∣ A ∣ ∣ ∣ ∞ = m a x 1 ≤ i ≤ n ∑ j = 1 n ∣ a i j ∣ |||A|||_\infty=max_{1\le i\le n}\sum_{j=1}^n|a_{ij}| ∣∣∣A∣∣∣∞=max1≤i≤n∑j=1n∣aij∣
∣ ∣ ∣ ∙ ∣ ∣ ∣ 2 |||\bullet|||_2 ∣∣∣∙∣∣∣2称为谱范数
∣ ∣ ∣ A ∣ ∣ ∣ 2 = σ 1 ( A ) |||A|||_2=\sigma_1(A) ∣∣∣A∣∣∣2=σ1(A)
∣ ∣ ∣ ∙ ∣ ∣ ∣ S |||\bullet|||_S ∣∣∣∙∣∣∣S
∣ ∣ ∣ A ∣ ∣ ∣ S = ∣ ∣ ∣ S A S − 1 ∣ ∣ ∣ |||A|||_S=|||SAS^{-1}||| ∣∣∣A∣∣∣S=∣∣∣SAS−1∣∣∣
定理5.6.9: ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| ∣∣∣∙∣∣∣是一个矩阵范数
引理5.6.10:存在 ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| ∣∣∣∙∣∣∣使得 ρ ( A ) ≤ ∣ ∣ ∣ A ∣ ∣ ∣ ≤ ρ ( A ) + ε \rho(A)\le |||A|||\le\rho(A)+\varepsilon ρ(A)≤∣∣∣A∣∣∣≤ρ(A)+ε
引理5.6.11:若存在矩阵范数使得 ∣ ∣ ∣ A ∣ ∣ ∣ < 1 |||A|||<1 ∣∣∣A∣∣∣<1,那么 lim k → ∞ A k = 0 \lim_{k\rightarrow\infty}A^k=0 limk→∞Ak=0
推论5.6.13(Gelfand公式): ρ ( A ) = lim k → ∞ ∣ ∣ ∣ A k ∣ ∣ ∣ 1 k \rho(A)=\lim_{k\rightarrow\infty}|||A^k|||^\frac{1}{k} ρ(A)=limk→∞∣∣∣Ak∣∣∣k1
定理5.6.36 ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| ∣∣∣∙∣∣∣是矩阵范数,由 ∣ ∣ ∙ ∣ ∣ ||\bullet|| ∣∣∙∣∣诱导
定义5.6.38 对偶范数
∣ ∣ A ∣ ∣ D = m a x ∣ ∣ B ∣ ∣ = 1 R e < A , B > F = m a x ∣ ∣ B ∣ ∣ = 1 R e t r B ∗ A ||A||^D=max_{||B||=1}Re_F=max_{||B||=1}Re\ trB^*A ∣∣A∣∣D=max∣∣B∣∣=1Re<A,B>F=max∣∣B∣∣=1Re trB∗A
定理5.6.42:绝对范数 ∣ ∣ ∙ ∣ ∣ ||\bullet|| ∣∣∙∣∣诱导的矩阵范数 ∣ ∣ ∣ ∙ ∣ ∣ ∣ |||\bullet||| ∣∣∣∙∣∣∣,设 ∣ ∣ ∣ ∙ ∣ ∣ ∣ D |||\bullet|||^D ∣∣∣∙∣∣∣D是其对偶范数,有 Λ = d i a g ( λ 1 , … , λ n ) \Lambda=diag(\lambda_1,…,\lambda_n) Λ=diag(λ1,…,λn)那么
如果 G ( ∙ ) G(\bullet) G(∙)是范数,若S,T是非奇异,那么 G S , T ( A ) = G ( S A T ) G_{S,T}(A)=G(SAT) GS,T(A)=G(SAT)
即使 G ( ∙ ) G(\bullet) G(∙)是矩阵范数, G S , T ( ∙ ) G_{S,T}(\bullet) GS,T(∙)也不一定次积性,除非 T = S − 1 T=S^{-1} T=S−1
本文算是结束了吧,推荐大家保存好Horn这本好书,以后可以当作参考资料来翻阅。明天就要考菊粉了,明早起来看一下,应该差不多了。怎么那么紧啊!
最后祝大家都能考好!
DoubleS 2021.6.27