特征值(特征向量)与相似对角化

什么是特征值/特征向量?

方阵的一个属性,描述方阵的“特征”

A u ⃗ = λ u ⃗ A\vec{u} = \lambda\vec{u} Au =λu

不改变方向,只伸缩

λ \lambda λ 称为矩阵A的特征值(eigenvalue)

u ⃗ \vec{u} u 称为A对应于 λ \lambda λ的特征向量(eigenvector)

  • 求解:特征方程

特征向量不考虑零向量(平凡解) → u ⃗ ≠ 0 \rightarrow \vec{u} \ne 0 u =0

( A − λ I ) u ⃗ = 0 (A - \lambda I)\vec{u} = 0 (AλI)u =0

有非零解 → \rightarrow 特征方程 d e t ( A − λ I ) = 0 det(A-\lambda I) = 0 det(AλI)=0

对每一个 λ \lambda λ 的特征向量不唯一

λ \lambda λ 对应的特征向量 u ⃗ , k u ⃗ . . . \vec{u}, k\vec{u} ... u ,ku ... 组成了 A − λ I A-\lambda I AλI 零空间(去除零向量)

λ \lambda λ 对应的特征空间: E λ = { O } ∪ { λ 的 特 征 向 量 } E_\lambda = \{O\} \cup \{\lambda的特征向量\} Eλ={ O}{ λ}

特征方程是一个关于 λ \lambda λ的n次方程

简单特征值:n个不同的实数

复杂特征值:可以规避掉

1)多重特征值:同根(重数)

2)复数特征值:实数范围无解,复数根

特征值和特征向量的性质

  • 与矩阵的逆关系:

0是A的特征值 ⇔ \Leftrightarrow A u ⃗ = 0 A\vec{u} = 0 Au =0 有非零解 ⇔ \Leftrightarrow A不可逆

  • 特殊矩阵

对角矩阵D的特征值就是对角线上的元素

本质: A ∼ d i a g ( λ 1 , λ 2 . . . λ n ) A \sim diag(\lambda_1, \lambda_2 ... \lambda_n) Adiag(λ1,λ2...λn)

推论: A m A^m Am的特征值是 λ m \lambda^m λm, A − 1 A^{-1} A1的特征值是 λ − 1 \lambda^{-1} λ1(数学归纳法

直观理解特征值和特征向量

  • 投影变换:

首先是一个线性变换(如果变换对应一个矩阵,这个变换是线性变换),投影变换是线性变换:

T(u + v) = T(u) + T(v)

T(cu) = cT(u), c ∈ \in R

由几何含义可得到两个特征值:垂直:0, 母线上:1

  • 翻转变换:

特征值:1(沿着翻转对称轴), -1(垂直翻转对称轴)

性质:不同特征向量对应的特征值线性无关(反证法

不简单的特征值

  • 旋转变换:

几何角度找不到特征向量(变换后没有方向不变的)

特征值: i, -i

  • 单位矩阵:

所有向量变换后都不变方向(都是自己)

特征值:1(n重)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-O0i6VYkT-1592446245660)(C:\Users\fjjnbb\AppData\Roaming\Typora\typora-user-images\image-20200609111818135.png)]

多重特征值的特征空间可能是高纬空间

n重特征值(代数重数):特征空间维度(几何重数) ≤ \le n (最多有n个线性无关的特征向量)

即:几何重数 ≤ \le 代数重数

实践 numpy 中的求特征值和特征向量

主要实现:求解 λ \lambda λ的n次方程

mian_eigen

矩阵相似型

引子:相似三角形 → \rightarrow 不同观察视角观察相同的内容

如果A, B满足: A = P − 1 B P A = P^{-1}BP A=P1BP,则称A和B相似,记为: A ∼ B A \sim B AB

P是一个坐标系,则A变换是在P坐标系下观察的B变换

B变换是在标准坐标系下,而A变换是在P坐标系下

  • 对于 B = P A P − 1 B = PAP^{-1} B=PAP1

B是标准坐标系下的一个变换,其在P坐标系中对应的变换为A

  • 证明:???

A [ x ⃗ ] P = P − 1 B P [ x ⃗ ] P A[\vec{x}]_P = P^{-1}BP[\vec{x}]_P A[x ]P=P1BP[x ]P

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1QvnJQmf-1592447491372)(C:\Users\fjjnbb\AppData\Roaming\Typora\typora-user-images\image-20200609134605326.png)]

【解释】:若 A ∼ B A \sim B AB

[ x ⃗ ] P [\vec{x}]_P [x ]P 在 P坐标系下进行A变换得到的结果 先转换为标准坐标系( [ x ⃗ ] ε [\vec{x}]_\varepsilon [x ]ε),再在标准坐标系下进行B变换,最后将结果转回P矩阵 相同

  • 性质:

A和B的特征方程相同 → \rightarrow 特征值相同

d e t ( A − λ I ) = d e t ( P − 1 B P − λ I ) =   . . .   = d e t ( B − λ I ) det(A - \lambda I) = det(P^{-1}BP - \lambda I) =\ ...\ = det(B - \lambda I) det(AλI)=det(P1BPλI)= ... =det(BλI)

相似对角化

最好的观察角度: A = P D P − 1 A = PDP^{-1} A=PDP1 (减少冗余)

D:每个维度自己伸缩的变换

D = ( λ 1 0 . . . 0 0 λ 2 . . . 0 . . . . . . . . . . . . 0 0 . . . λ n ) , P = ( ∣ ∣ ∣ u ⃗ 1 u ⃗ 2 . . . u ⃗ n ∣ ∣ ∣ ) D = \left( \begin{matrix} \lambda_1& 0 & ... & 0 \\ 0 & \lambda_2 & ... & 0 \\ ... & ... & ... & ...\\0&0&...&\lambda_n \end{matrix} \right), P = \left( \begin{matrix} | & | & &| \\ \vec{u}_1 & \vec{u}_2 & ... & \vec{u}_n \\ | & | & & | \end{matrix} \right) D=λ10...00λ2...0............00...λn,P=u 1u 2...u n

  • 相似对角化 条件:A有n个线性无关的特征向量,即:P (特征向量矩阵) 可逆

A含有n个不同的特征值,或者特征值中的k重特征值对应有k个线性无关的特征向量,则A可以相似对角化

实现矩阵对角化

main_diag

矩阵对角化的应用

  • 计算幂: A = P D P − 1 A = PDP^{-1} A=PDP1

A n = P D n P − 1 A^n = PD^nP^{-1} An=PDnP1

  • 矩阵幂的作用?

动态系统: u ⃗ k = A k u ⃗ 0 \vec{u}_k = A^k \vec{u}_0 u k=Aku 0

A:一次变化

  • 随机过程:概率变化过程

u ⃗ k = P D n P − 1 u ⃗ 0 \vec{u}_k = PD^nP^{-1}\vec{u}_0 u k=PDnP1u 0

:特征值反应系统各个分量的变化速率

你可能感兴趣的:(数学基础)