矩阵的特征值(eigenvalue)和特征向量(eigenvector)在很多应用中都具有重要的数学和物理意义。Jacobi 旋转法是一种用于计算对称矩阵特征值和特征向量的迭代方法。
本文将详细介绍 Jacobi 旋转法的基本原理和步骤,通过一个具体的矩阵示例演示其应用过程,并给出其Python实现。
Jacobi 旋转法的每一次迭代中,需要选择一个非对角元素最大的位置,然后构造相应的旋转矩阵,进行相似变换,使得矩阵逐渐对角化。
Jacobi 旋转法的基本思想是通过一系列的相似变换,逐步将对称矩阵对角化,使得非对角元素趋于零。这个过程中,特征值逐渐浮现在对角线上,而相应的特征向量也被逐步找到。下面是 Jacobi 旋转法的基本步骤:
选择旋转角度: 选择一个旋转角度 θ,通常使得旋转矩阵中的非对角元素为零,从而实现对角化,通常选择非对角元素中绝对值最大的那个作为旋转的目标。
构造旋转矩阵: 构造一个旋转矩阵 J,该矩阵为单位矩阵,只有对应于选择的非对角元素的位置上有两个非零元素,其余位置上为零。这两个非零元素的值由旋转角度 θ 决定,例如,对于 2x2 矩阵,旋转矩阵可以表示为:
J = [ cos ( θ ) − sin ( θ ) sin ( θ ) cos ( θ ) ] J = \begin{bmatrix} \cos(\theta) & -\sin(\theta) \\ \sin(\theta) & \cos(\theta) \end{bmatrix} J=[cos(θ)sin(θ)−sin(θ)cos(θ)]
相似变换: 计算相似变换矩阵 P P P,即 P T A P P^TAP PTAP,其中 A A A 是原始矩阵, P P P 是旋转矩阵,计算过程如下:
P T A P = [ cos ( θ ) sin ( θ ) − sin ( θ ) cos ( θ ) ] T [ a 11 a 12 a 12 a 22 ] [ cos ( θ ) − sin ( θ ) sin ( θ ) cos ( θ ) ] P^TAP = \begin{bmatrix} \cos(\theta) & \sin(\theta) \\ -\sin(\theta) & \cos(\theta) \end{bmatrix}^T \begin{bmatrix} a_{11} & a_{12} \\ a_{12} & a_{22} \end{bmatrix} \begin{bmatrix} \cos(\theta) & -\sin(\theta) \\ \sin(\theta) & \cos(\theta) \end{bmatrix} PTAP=[cos(θ)−sin(θ)sin(θ)cos(θ)]T[a11a12a12a22][cos(θ)sin(θ)−sin(θ)cos(θ)]
通过矩阵相乘计算,我们可以得到 P T A P P^TAP PTAP 中的非对角元素,假设这两个元素分别位于矩阵的 (1,2) 和 (2,1) 的位置。令 a i j a_{ij} aij 为这两个元素,即 a i j = a 12 = a 21 a_{ij}= a_{12} = a_{21} aij=a12=a21。
接下来,我们希望通过选择合适的 θ \theta θ使得 a i j a_{ij} aij 变为零,从而达到对角化的目的,即 a 12 = a 21 a_{12} = a_{21} a12=a21,进一步可推导出
θ = 1 2 arctan ( 2 ⋅ a i j a i i − a j j ) \theta = \frac{1}{2} \arctan\left(\frac{2 \cdot a_{ij}}{a_{ii} - a_{jj}}\right) θ=21arctan(aii−ajj2⋅aij)
迭代: 重复步骤 1-3,直到矩阵 A 的非对角元素都趋于零或满足一定的精度要求。
提取特征值和特征向量: 对角线上的元素即为矩阵 A 的特征值,而 P 中的列向量即为对应于这些特征值的特征向量。
对于矩阵
A = [ 2 − 1 0 − 1 2 − 1 0 − 1 2 ] A = \begin{bmatrix} 2 & -1 & 0 \\ -1 & 2 & -1 \\ 0 & -1 & 2 \end{bmatrix} A= 2−10−12−10−12
我们首先找到非对角元素中绝对值最大的元素,这里我们以 (2,1) 为例,计算旋转角度和旋转矩阵。
选择旋转角度:
计算旋转角度 θ \theta θ公式:
θ = 1 2 arctan ( 2 ⋅ a i j a i i − a j j ) \theta = \frac{1}{2} \arctan\left(\frac{2 \cdot a_{ij}}{a_{ii} - a_{jj}}\right) θ=21arctan(aii−ajj2⋅aij)其中, a i i a_{ii} aii和 a j j a_{jj} ajj 分别是矩阵的对角元素,而 a i j a_{ij} aij 是非对角元素,即 a 21 a_{21} a21。 在这个例子中, a 21 = − 1 a_{21} = -1 a21=−1, a 11 = a 22 = 2 a_{11} = a_{22} = 2 a11=a22=2。
θ = 1 2 arctan ( − 2 0 ) = − π 4 \theta = \frac{1}{2} \arctan\left(\frac{-2}{0}\right) = -\frac{\pi}{4} θ=21arctan(0−2)=−4π
构造旋转矩阵:
J = [ cos ( θ ) − sin ( θ ) sin ( θ ) cos ( θ ) ] J = \begin{bmatrix} \cos(\theta) & -\sin(\theta) \\ \sin(\theta) & \cos(\theta) \end{bmatrix} J=[cos(θ)sin(θ)−sin(θ)cos(θ)]
对于 θ = − π 4 \theta = -\frac{\pi}{4} θ=−4π:
J = [ cos ( − π 4 ) − sin ( − π 4 ) sin ( − π 4 ) cos ( − π 4 ) ] J = \begin{bmatrix} \cos\left(-\frac{\pi}{4}\right) & -\sin\left(-\frac{\pi}{4}\right) \\ \sin\left(-\frac{\pi}{4}\right) & \cos\left(-\frac{\pi}{4}\right) \end{bmatrix} J=[cos(−4π)sin(−4π)−sin(−4π)cos(−4π)]
计算得:
J = [ 2 2 2 2 − 2 2 2 2 ] J = \begin{bmatrix} \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \\ -\frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{bmatrix} J=[22−222222]
相似变换:
计算相似变换矩阵 P P P:
P T A P P^T A P PTAP
在这里, P P P就是构造的旋转矩阵 J J J。
迭代:
重复上述步骤,直到矩阵足够接近对角矩阵。
这个过程会一步步地使矩阵趋近于对角矩阵,对角线上的元素就是矩阵的特征值,而相应的列向量就是对应的特征向量。由于计算较为繁琐,我在这里只展示了一个迭代的过程,实际应用中,需要进行多次迭代,直到满足精度的要求。
import numpy as np
def jacobi_rotation(A):
n = A.shape[0]
tolerance = 1e-10
max_iterations = 1000
eigenvectors = np.eye(n)
for _ in range(max_iterations):
# 寻找最大的非对角元素
max_off_diag = np.max(np.abs(np.triu(A, k=1)))
if max_off_diag < tolerance:
break # 达到收敛条件
# 找到最大元素的索引
indices = np.unravel_index(np.argmax(np.abs(np.triu(A, k=1))), A.shape)
i, j = indices
# 计算旋转角度
theta = 0.5 * np.arctan2(2 * A[i, j], A[i, i] - A[j, j])
# 构造旋转矩阵
J = np.eye(n)
J[i, i] = J[j, j] = np.cos(theta)
J[i, j] = -np.sin(theta)
J[j, i] = np.sin(theta)
# 执行相似变换
A = np.dot(np.dot(J.T, A), J)
# 更新特征向量
eigenvectors = np.dot(eigenvectors, J)
# 提取特征值
eigenvalues = np.diag(A)
return eigenvalues, eigenvectors
# 示例矩阵
A = np.array([[2, -1, 0],
[-1, 2, -1],
[0, -1, 2]])
# 执行 Jacobi 旋转
eigenvalues, eigenvectors = jacobi_rotation(A)
print("特征值:", eigenvalues)
print("特征向量:")
np.set_printoptions(precision=4, suppress=True)
print(eigenvectors)