从特征值到特征向量,一种新的求解特征向量的方法. 由三位物理大佬 PETER B. DENTON, STEPHEN J. PARKE, XINING ZHANG共同发现, 由我们家喻户晓的大佬陶哲轩真神证明的.
论文链接:
https://arxiv.org/abs/1908.03795?context=math.RA
文中开头先给了一些定义,大致如下:
假设 A A A为一个 n × n n\times n n×n的矩阵, λ i ( A ) \lambda_{i}(A) λi(A)为矩阵 A A A的第 i i i个特征值,对应的第 i i i个特征向量为 v i v_{i} vi.
M j M_{j} Mj为矩阵删除第 j j j行以及第 j j j列后剩下的子矩阵,其实有点类似那个余子式. λ k ( M j ) \lambda_{k}(M_{j}) λk(Mj) 为其对应的特征值.(这边所说的特征值应该是指特征值集合)
原话是这样子的
Let A be a n × n Hermitian matrix with eigenvalues λi(A) and normed eigen- vectors vi. The elements of each eigenvector are denoted vi,j. Let Mj be the n − 1 × n − 1 submatrix of A that results from deleting the jth column and the jth row, with eigenvalues λk(Mj).
文中先是证明了一个Cauchy-Binet type formula, 应该是个引里,辅助之后证明用的吧.
然后放大招:
∣ v i , j ∣ 2 ∏ k = 1 , k ≠ i n ( λ i ( A ) − λ k ( A ) ) = ∏ k = 1 n − 1 ( λ i ( A ) − λ k ( M j ) ) \left | v_{i,j} \right |^{2}\prod_{k=1,k\neq i}^{n}( \lambda_{i}(A)-\lambda _{k}(A))=\prod_{k=1}^{n-1}(\lambda _{i}(A)-\lambda _{k}(M_{j})) ∣vi,j∣2k=1,k=i∏n(λi(A)−λk(A))=k=1∏n−1(λi(A)−λk(Mj))
解释一下公式 ∣ v i , j ∣ 2 \left | v_{i,j} \right |^{2} ∣vi,j∣2表示矩阵 A A A对应于特征值 λ i \lambda_{i} λi的特征向量的第 j j j个值. v i = ( v i 1 , v i 2 , ⋯ ) T , j = 1 , 2 , ⋯ v_{i}=(v_{i1},v_{i2}, \cdots)^{T},j=1,2,\cdots vi=(vi1,vi2,⋯)T,j=1,2,⋯
大致意思就是我们要求矩阵 A A A的特征值 v i v_{i} vi对应的特征向量, 可以直接通过矩阵A的特征值以及对应的余子式来求即可, 不需要像以前那样求完特征值, 然后再求齐次方程 ( A − λ E ) x = 0 (A-\lambda E)x=0 (A−λE)x=0 的解.
举个简单的例子吧:
假设矩阵
A = [ 1 2 2 2 1 2 2 2 1 ] A=\begin{bmatrix} 1 & 2 &2 \\ 2 & 1 &2 \\ 2 & 2 &1 \end{bmatrix} A=⎣⎡122212221⎦⎤
易知其特征值为 λ 1 = 5 , λ 2 = − 1 , λ 3 = − 1 \lambda_{1}=5,\lambda_{2}=-1,\lambda_{3}=-1 λ1=5,λ2=−1,λ3=−1.
我们可以利用上面的公式来求特征向量:
j = 1 j=1 j=1时,则 M 1 对 应 的 两 个 特 征 值 分 别 为 λ 1 = − 1 , λ 2 = 3 M_{1}对应的两个特征值分别为\lambda_{1}=-1,\lambda_{2}=3 M1对应的两个特征值分别为λ1=−1,λ2=3,然后有
j = 2 j=2 j=2时,则 M 2 对 应 的 两 个 特 征 值 分 别 为 λ 1 = − 1 , λ 2 = 3 M_{2}对应的两个特征值分别为\lambda_{1}=-1,\lambda_{2}=3 M2对应的两个特征值分别为λ1=−1,λ2=3,然后有
j = 3 j=3 j=3时,则 M 3 对 应 的 两 个 特 征 值 分 别 为 λ 1 = − 1 , λ 2 = 3 M_{3}对应的两个特征值分别为\lambda_{1}=-1,\lambda_{2}=3 M3对应的两个特征值分别为λ1=−1,λ2=3,然后有
v 11 2 ⋅ ( 5 + 1 ) ( 5 + 1 ) = ( 5 + 1 ) ( 5 − 3 ) = 1 3 v_{11}^{2} \cdot(5+1)(5+1)=(5+1)(5-3)=\frac{1}{3} v112⋅(5+1)(5+1)=(5+1)(5−3)=31
v 12 2 ⋅ ( 5 + 1 ) ( 5 + 1 ) = ( 5 + 1 ) ( 5 − 3 ) = 1 3 v_{12}^{2} \cdot(5+1)(5+1)=(5+1)(5-3)=\frac{1}{3} v122⋅(5+1)(5+1)=(5+1)(5−3)=31
v 13 2 ⋅ ( 5 + 1 ) ( 5 + 1 ) = ( 5 + 1 ) ( 5 − 3 ) = 1 3 v_{13}^{2} \cdot(5+1)(5+1)=(5+1)(5-3)=\frac{1}{3} v132⋅(5+1)(5+1)=(5+1)(5−3)=31
又可以求得矩阵 A A A对应于 λ 1 = 5 \lambda_{1}=5 λ1=5的一个特征向量为:
v 1 = [ − 1 3 − 1 3 1 3 ] v_{1}=\begin{bmatrix} \frac{-1}{ \sqrt{3} } \\ \frac{-1}{ \sqrt{3} } \\ \frac{1}{ \sqrt{3} } \end{bmatrix} v1=⎣⎢⎡3−13−131⎦⎥⎤
可以看出这个结果是正确的,只是开平方这里怎么处理,我也还没弄明白,目前想到的办法就是带结果进去验证;