对称矩阵及SVD分解

矩阵相似型

    如果矩阵A,B满足 A = P − 1 B P A=P^{-1}BP A=P1BP则称A和B相似。A和B的特征方程相同,特征值相同。  (类比相似三角形,矩阵的相似也是从不同的视角观察相同的内容。)

假设P是一个坐标系,则A变换是在P坐标系下观察的B的变换(观察B变换在我们标准坐标系下,观察A变换在P坐标系下,A和B本质是同一变换,只是观察的坐标系不同)

1. 对称矩阵

    (一) 对称矩阵的所有不同的特征值对应的特征向量互相垂直。
  假设矩阵A的两个特征向量 v 1 , v 2 v_1,v_2 v1,v2对应不同的特征值 λ 1 , λ 2 。 \lambda_1, \lambda_2。 λ1,λ2

证明 v 1 ⃗ ⋅ v 2 ⃗ = 0 \qquad \vec{v_1} \cdot \vec{v_2} = 0 v1 v2 =0   (向量之间的点乘,对应的因子相乘再相加)
( λ 1 v 1 ⃗ ) ⋅ v 2 ⃗ = ( λ 1 v 1 ⃗ ) T v 2 ⃗ = ( A v 1 ) T v 2 ⃗ = v 1 T A T v 2 = v 1 T A v 2 = v 1 T λ 2 v 2 = λ 2 v 1 T v 2 = λ 2 v 1 ⃗ v 2 ⃗ \begin{aligned} (\lambda_1\vec{v_1})\cdot\vec{v_2} &= (\lambda_1\vec{v_1})^T\vec{v_2}=(Av_1)^T\vec{v_2}=v_1^TA^Tv_2=v_1^TAv_2 \\ &=v_1^T \lambda_2v_2=\lambda_2v_1^Tv_2=\lambda_2\vec{v_1}\vec{v_2} \end{aligned} (λ1v1 )v2 =(λ1v1 )Tv2 =(Av1)Tv2 =v1TATv2=v1TAv2=v1Tλ2v2=λ2v1Tv2=λ2v1 v2

( λ 1 − λ 2 ) ( v 1 ⃗ ⋅ v 2 ⃗ ) = 0 (\lambda_1-\lambda_2)(\vec{v_1}\cdot\vec{v_2})=0 (λ1λ2)(v1 v2 )=0
v 1 ⃗ ⋅ v 2 ⃗ = 0 \qquad \vec{v_1} \cdot \vec{v_2} = 0 v1 v2 =0

1.1 正交对角化

   (二)对称矩阵一定可以被对角化 A = P D P − 1 \qquad A=PDP^{-1} A=PDP1
如果A是对称矩阵 A = Q D Q − 1 \qquad A=QDQ^{-1} A=QDQ1  将每一个特征向量标准化 A = Q D Q T \qquad A=QDQ^{T} A=QDQT  故进行了正交对角化
(标准正交矩阵的逆等于标准正交矩阵的转置)
   A是对称矩阵 <—> A可以被正交对角化 A = Q D Q T \qquad A=QDQ^{T} A=QDQT

2. 奇异值(Singular Value)

若A是一个 m ∗ n m\ast n mn的矩阵,则 A T A A^TA ATA是一个 n ∗ n n\ast n nn的方针,且对称。

A T A A^TA ATA 可以被正交对角化,拥有n个实数特征值 ( λ 1 , λ 2 , . . . , λ n ) (\lambda_1,\lambda_2,...,\lambda_n) (λ1,λ2,...,λn);n个互相垂直的标准特征向量 ( v 1 ⃗ , v 2 ⃗ , . . . , v n ⃗ ) (\vec{v_1},\vec{v_2},...,\vec{v_n}) (v1 ,v2 ,...,vn )

∣ ∣ A v i ⃗ ∣ ∣ 2 = ( A v i ⃗ ) ⋅ ( A v i ⃗ ) = ( A v i ⃗ ) T ⋅ ( A v i ⃗ ) = v i T A T A v i {||A\vec{v_i}||}^2=(A\vec{v_i})\cdot(A\vec{v_i})={(A\vec{v_i})}^T\cdot(A\vec{v_i})={v_i}^TA^TAv_i Avi 2=(Avi )(Avi )=(Avi )T(Avi )=viTATAvi
= v i T ( A T A v i ) = v i T ( λ i v i ) ={v_i}^T(A^TAv_i) ={v_i}^T(\lambda_i v_i) =viT(ATAvi)=viT(λivi)
= λ i v i T v i = λ i ∣ ∣ v i ⃗ ∣ ∣ 2 = λ i = \lambda_i {v_i}^Tv_i = \lambda_i{||\vec{v_i} ||}^2 = \lambda_i =λiviTvi=λivi 2=λi
A T A A^TA ATA的特征值>=0,
σ i = λ i \sigma_i = \sqrt{\lambda_i} σi=λi σ i \sigma_i σi称为奇异值,奇异值就是 A v i ⃗ A\vec{v_i} Avi 的长度。

2.1 奇异值的几何含义

λ i \lambda_i λi A T A A^TA ATA的特征值, v i ⃗ \vec{v_i} vi A T A A^TA ATA的特征向量。 则A是列空间的一组正交基 λ i ≠ 0 \quad \lambda_i \neq0 λi=0

证明正交性:
( A v i ⃗ ) ⋅ ( A v j ⃗ ) = ( A v i ) T ⋅ ( A v j ) = v i T A T A v j (A\vec{v_i})\cdot(A\vec{v_j})=(Av_i)^T\cdot(Av_j)={v_i}^TA^TAv_j (Avi )(Avj )=(Avi)T(Avj)=viTATAvj
= v i T ( A T A v j ) = v i T ( λ j v j ) ={v_i}^T(A^TAv_j)={v_i}^T(\lambda_jv_j) =viT(ATAvj)=viT(λjvj)
= λ j v i T v j = λ i ( v i ⃗ ⋅ v j ⃗ ) = 0 =\lambda_j{v_i}^Tv_j=\lambda_i(\vec{v_i} \cdot \vec{v_j})=0 =λjviTvj=λi(vi vj )=0

证明{ A v i ⃗ A\vec{v_i} Avi }是A的列空间的一组基:

未完待续……

参考链接-liuyubobobo

你可能感兴趣的:(数学,Python,线性代数)