将hermite矩阵的特征值表示为一系列最优化问题的解。
该定理的2、3是容易证明和理解的。如果不能深入理解子空间的含义,将难以理解4、5。
首先给出4、5的另外一种表述:
λ 1 ≤ λ 2 ≤ ⋯ ≤ λ n , k = n , n − 1 , ⋯ , 1 λ k = min w 1 , w 2 , ⋯ , w n − k ∈ C n max x ≠ 0 , x ∈ C n , x ⊥ w 1 , w 2 , ⋯ , w n − k R ( x ) λ k = max w 1 , w 2 , ⋯ , w k − 1 ∈ C n min x ≠ 0 , x ∈ C n , x ⊥ w 1 , w 2 , ⋯ , w k − 1 R ( x ) \lambda_1 \le \lambda_2 \le \cdots \le \lambda_n,k=n,n-1,\cdots,1\\ \lambda_k = \min_{w_1,w_2,\cdots,w_{n-k}\in C^n} \max_{x\ne0,x\in C^n,\atop x\perp w_1,w_2,\cdots,w_{n-k}} R(x)\\ \lambda_k = \max_{w_1,w_2,\cdots,w_{k-1}\in C^n} \min_{x\ne0,x\in C^n,\atop x\perp w_1,w_2,\cdots,w_{k-1}} R(x) λ1≤λ2≤⋯≤λn,k=n,n−1,⋯,1λk=w1,w2,⋯,wn−k∈Cnminx⊥w1,w2,⋯,wn−kx=0,x∈Cn,maxR(x)λk=w1,w2,⋯,wk−1∈Cnmaxx⊥w1,w2,⋯,wk−1x=0,x∈Cn,minR(x)
关注4。
1️⃣当k=n时,U是n维复空间 V ( C n ) V(C^n) V(Cn),当x旋转到和 λ n \lambda_n λn的特征向量共线的时候, λ n = λ m a x \lambda_n=\lambda_{max} λn=λmax。
2️⃣当k=n-1时,U是n-1维复空间, U ⊂ V ( C n ) U \subset V(C^n) U⊂V(Cn),这样的子空间有无穷多个(可以想象,三维空间中有无穷多个二维平面)。当这个空间包含了 λ n \lambda_n λn的特征子空间的时候, max x ∈ U , x ≠ 0 R ( x ) = λ m a x = λ n \max_{x\in U,x\ne0} R(x)=\lambda_{max}=\lambda_n maxx∈U,x=0R(x)=λmax=λn。注意,本定理名叫min-max定理,此时还仅仅只考虑极大那部分。
对于 m i n d i m ( U ) = k min_{dim(U)=k} mindim(U)=k,该min符号的含义是,在无穷个n-1维复空间中,要找到一个U,使得以U为可行域的函数 max x ∈ U , x ≠ 0 R ( x ) \max_{x\in U,x\ne0} R(x) maxx∈U,x=0R(x)取得最小值。U的取法就是排除 λ n \lambda_n λn的特征子空间,也就是说 λ n \lambda_n λn的特征向量不属于U,或者说和U的基向量正交。
此时的max部分,由于U不包含 λ n \lambda_n λn的特征子空间,那么 max x ∈ U , x ≠ 0 R ( x ) = m a x ( λ ( A ) − { λ n } ) = λ n − 1 \max_{x\in U,x\ne0} R(x)=max(\lambda(A)-\{\lambda_n\})=\lambda_{n-1} maxx∈U,x=0R(x)=max(λ(A)−{λn})=λn−1
3️⃣对于k=n-2,是同样的理解方式,只不过取min的时候,要排除掉 λ n 和 λ n − 1 \lambda_n和\lambda_{n-1} λn和λn−1。
关于该定理数学上的证明,可参考特征值的重要定理:Courant-Fischer min-max theorem 极大极小定理
二、韦尔定理(Weyl定理)
对于一个n阶Hermite矩阵A,受到一个n阶Hermite矩阵B的扰动,那么A+B的第k个特征值满足:
λ k ( A ) + λ m i n ( B ) ≤ λ k ( A + B ) ≤ λ k ( A ) + λ m a x ( B ) \lambda_k(A)+\lambda_{min}(B)\le\lambda_k(A+B)\le\lambda_k(A)+\lambda_{max}(B) λk(A)+λmin(B)≤λk(A+B)≤λk(A)+λmax(B)
证明,由min-max定理容易证得。