Hermite矩阵的特征值估计——courant-fischer定理

Hermite矩阵的特征值估计——courant-fischer定理

一、courant-fischer定理(min-max定理)

将hermite矩阵的特征值表示为一系列最优化问题的解。

  1. 一个函数 R ( x ) = x H A x x H x R(x)=\frac{x^HAx}{x^Hx} R(x)=xHxxHAx,称为Rayleigh商,A是hermite矩阵
  2. λ m i n = min ⁡ x ≠ 0 R ( x ) \lambda_{min} = \min_{x\ne0} R(x) λmin=minx=0R(x)
  3. λ m a x = max ⁡ x ≠ 0 R ( x ) \lambda_{max} = \max_{x\ne0} R(x) λmax=maxx=0R(x)
  4. λ k = m i n d i m ( U ) = k max ⁡ x ∈ U , x ≠ 0 R ( x ) \lambda_{k} = min_{dim(U)=k} \max_{x\in U,x\ne0} R(x) λk=mindim(U)=kmaxxU,x=0R(x)
  5. λ k = m a x d i m ( U ) = n − k + 1 min ⁡ x ∈ U , x ≠ 0 R ( x ) \lambda_{k} = max_{dim(U)=n-k+1} \min_{x\in U,x\ne0} R(x) λk=maxdim(U)=nk+1minxU,x=0R(x)

该定理的2、3是容易证明和理解的。如果不能深入理解子空间的含义,将难以理解4、5。

首先给出4、5的另外一种表述:
λ 1 ≤ λ 2 ≤ ⋯ ≤ λ n , k = n , n − 1 , ⋯   , 1 λ k = min ⁡ w 1 , w 2 , ⋯   , w n − k ∈ C n max ⁡ x ≠ 0 , x ∈ C n , x ⊥ w 1 , w 2 , ⋯   , w n − k R ( x ) λ k = max ⁡ w 1 , w 2 , ⋯   , w k − 1 ∈ C n min ⁡ x ≠ 0 , x ∈ C n , x ⊥ w 1 , w 2 , ⋯   , w k − 1 R ( x ) \lambda_1 \le \lambda_2 \le \cdots \le \lambda_n,k=n,n-1,\cdots,1\\ \lambda_k = \min_{w_1,w_2,\cdots,w_{n-k}\in C^n} \max_{x\ne0,x\in C^n,\atop x\perp w_1,w_2,\cdots,w_{n-k}} R(x)\\ \lambda_k = \max_{w_1,w_2,\cdots,w_{k-1}\in C^n} \min_{x\ne0,x\in C^n,\atop x\perp w_1,w_2,\cdots,w_{k-1}} R(x) λ1λ2λn,k=n,n1,,1λk=w1,w2,,wnkCnminxw1,w2,,wnkx=0,xCn,maxR(x)λk=w1,w2,,wk1Cnmaxxw1,w2,,wk1x=0,xCn,minR(x)
关注4。

1️⃣当k=n时,U是n维复空间 V ( C n ) V(C^n) V(Cn),当x旋转到和 λ n \lambda_n λn的特征向量共线的时候, λ n = λ m a x \lambda_n=\lambda_{max} λn=λmax

2️⃣当k=n-1时,U是n-1维复空间, U ⊂ V ( C n ) U \subset V(C^n) UV(Cn),这样的子空间有无穷多个(可以想象,三维空间中有无穷多个二维平面)。当这个空间包含了 λ n \lambda_n λn的特征子空间的时候, max ⁡ x ∈ U , x ≠ 0 R ( x ) = λ m a x = λ n \max_{x\in U,x\ne0} R(x)=\lambda_{max}=\lambda_n maxxU,x=0R(x)=λmax=λn。注意,本定理名叫min-max定理,此时还仅仅只考虑极大那部分。

对于 m i n d i m ( U ) = k min_{dim(U)=k} mindim(U)=k,该min符号的含义是,在无穷个n-1维复空间中,要找到一个U,使得以U为可行域的函数 max ⁡ x ∈ U , x ≠ 0 R ( x ) \max_{x\in U,x\ne0} R(x) maxxU,x=0R(x)取得最小值。U的取法就是排除 λ n \lambda_n λn的特征子空间,也就是说 λ n \lambda_n λn的特征向量不属于U,或者说和U的基向量正交。

此时的max部分,由于U不包含 λ n \lambda_n λn的特征子空间,那么 max ⁡ x ∈ U , x ≠ 0 R ( x ) = m a x ( λ ( A ) − { λ n } ) = λ n − 1 \max_{x\in U,x\ne0} R(x)=max(\lambda(A)-\{\lambda_n\})=\lambda_{n-1} maxxU,x=0R(x)=max(λ(A){λn})=λn1

3️⃣对于k=n-2,是同样的理解方式,只不过取min的时候,要排除掉 λ n 和 λ n − 1 \lambda_n和\lambda_{n-1} λnλn1

关于该定理数学上的证明,可参考特征值的重要定理:Courant-Fischer min-max theorem 极大极小定理

二、韦尔定理(Weyl定理)

对于一个n阶Hermite矩阵A,受到一个n阶Hermite矩阵B的扰动,那么A+B的第k个特征值满足:
λ k ( A ) + λ m i n ( B ) ≤ λ k ( A + B ) ≤ λ k ( A ) + λ m a x ( B ) \lambda_k(A)+\lambda_{min}(B)\le\lambda_k(A+B)\le\lambda_k(A)+\lambda_{max}(B) λk(A)+λmin(B)λk(A+B)λk(A)+λmax(B)
证明,由min-max定理容易证得。

你可能感兴趣的:(矩阵,线性代数,Courant-Fischer)