1. 奇异值分解的定义与性质

  1.1 定义

  Am×n=UΣVTUUT=ImVVT=InΣ=diag(σ1,σ2,...,σp)σ1≥σ2≥...≥σp≥0p=min⁡(m,n)A_{m \times n} = U \Sigma V^T\\

  UU^T=I_m\\

  VV^T=I_n\\

  \Sigma=diag(\sigma_1,\sigma_2,...,\sigma_p) \\

  \sigma_1\ge \sigma_2 \ge...\ge\sigma_p \ge0\\

  p=\min(m,n)Am×n=UΣVTUUT=ImVVT=InΣ=diag(σ1,σ2,...,σp)σ1≥σ2≥...≥σp≥0p=min(m,n)

  UΣVTU \Sigma V^TUΣVT 称为矩阵 AAA 的奇异值分解(SVD),UUU 是 mmm 阶正交矩阵, VVV 是 nnn 阶正交矩阵,Σ\SigmaΣ 是 m×nm \times nm×n 的对角矩阵

  σi\sigma_iσi 称为矩阵 AAA 的奇异值

  UUU 的列向量,左奇异向量

  VVV 的列向量,右奇异向量

  1.2 两种形式

  1.2.1 紧奇异值分解

  上面的SVD称为:完全SVD

  Am×n=UrΣrVrTA_{m \times n} = U_r \Sigma_r V_r^TAm×n=UrΣrVrT

  紧奇异值分解,仅由前 rrr 列得到,对角矩阵 Σr\Sigma_rΣr 的秩与原始矩阵 AAA 的秩相等

  1.2.2 截断奇异值分解

  只取最大的 k 个奇异值 (k

  实际应用中提到的,经常指的 截断SVD

  Am×n≈UkΣkVkT,0

  在实际应用中,常常需要对矩阵的数据进行压缩,将其近似表示,奇异值分解提供了一种方法

  奇异值分解是在平方损失(弗罗贝尼乌斯范数)意义下对矩阵的最优近似

  紧奇异值分解—>无损压缩

  截断奇异值分解—>有损压缩

  1.3 几何解释

  矩阵的SVD也可以看作是将其 对应的线性变换 分解为 旋转变换、缩放变换及旋转变换的组合。

  这个变换的组合一定存在。

  1.4 主要性质

  (1) 由 A=UΣVTA=U\Sigma V^TA=UΣVT 有

  ATA=(UΣVT)T(UΣVT)=V(ΣTΣ)VTAAT=(UΣVT)(UΣVT)T=U(ΣΣT)UTA^TA=(U\Sigma V^T)^T(U\Sigma V^T)=V(\Sigma^T\Sigma)V^T\\

  AA^T=(U\Sigma V^T)(U\Sigma V^T)^T=U(\Sigma\Sigma^T)U^TATA=(UΣVT)T(UΣVT)=V(ΣTΣ)VTAAT=(UΣVT)(UΣVT)T=U(ΣΣT)UT

  对称矩阵 ATAA^TAATA 和 AATAA^TAAT 的特征分解 可由矩阵 AAA 的奇异值分解矩阵表示

  (2)

  AV=UΣ⇒Avj=σjuj,j=1,2,...,nATU=VΣT⇒ATuj=σjvj,j=1,2,...,n;ATuj=0,j=n+1,n+2,...,mAV=U\Sigma \Rightarrow Av_j=\sigma_ju_j,j=1,2,...,n\\

  A^TU=V\Sigma^T \Rightarrow A^Tu_j=\sigma_jv_j,j=1,2,...,n;A^Tu_j=0,j=n+1,n+2,...,mAV=UΣ⇒Avj=σjuj,j=1,2,...,nATU=VΣT⇒ATuj=σjvj,j=1,2,...,n;ATuj=0,j=n+1,n+2,...,m

  (3) SVD奇异值 σ1,σ1,...,σn\sigma_1,\sigma_1,...,\sigma_nσ1,σ1,...,σn 是唯一的,但矩阵 U,VU,VU,V 不唯一

  (4) 矩阵 AAA 和 Σ\SigmaΣ 的秩相等,等于正奇异值 σi\sigma_iσi 的个数 rrr

  (5) 矩阵 AAA 的 rrr 个右奇异向量 v1,v2,...,vrv_1,v_2,...,v_rv1,v2,...,vr 构成 ATA^TAT 的值域 的一组标准正交基;

  矩阵 AAA 的 n−rn-rn−r 个右奇异向量 vr+1,vr+2,...,vnv_r+1,v_r+2,...,v_nvr+1,vr+2,...,vn 构成 AAA 的零空间 的一组标准正交基;

  矩阵 AAA 的 rrr 个左奇异向量 u1,u2,...,uru_1,u_2,...,u_ru1,u2,...,ur 构成 AAA 的值域 的一组标准正交基;

  矩阵 AAA 的 m−rm-rm−r 个左奇异向量 ur+1,ur+2,...,umu_r+1,u_r+2,...,u_mur+1,ur+2,...,um 构成 ATA^TAT 的零空间 的一组标准正交基

  2. 奇异值分解与矩阵近似

  2.1 弗罗贝尼乌斯范数

  奇异值分解也是一种矩阵近似的方法,这个近似是在弗罗贝尼乌斯范数(Frobenius norm)意义下的近似

  矩阵的弗罗贝尼乌斯范数是 向量的L2范数的直接推广,对应着机器学习中的平方损失函数

  设矩阵 A=[aij]m×nA=[a_{ij}]_{m \times n}A=[aij]m×n, 其弗罗贝尼乌斯范数为:∣∣A∣∣F=(∑i=1m∑j=1n(aij)2)1/2||A||_F = \bigg( \sum\limits_{i=1}^m \sum\limits_{j=1}^n(a_{ij})^2\bigg)^{1/2}∣∣A∣∣F=(i=1∑mj=1∑n(aij)2)1/2

  假设 AAA 的奇异值分解为 A=UΣVTA=U\Sigma V^TA=UΣVT ,其中对角矩阵 Σ=diag(σ1,σ2,...,σp)\Sigma=diag(\sigma_1,\sigma_2,...,\sigma_p)Σ=diag(σ1,σ2,...,σp),则 ∣∣A∣∣F=(σ12+σ22+...+σn2)1/2||A||_F = \bigg(\sigma_1^2+\sigma_2^2+...+\sigma_n^2\bigg)^{1/2}∣∣A∣∣F=(σ12+σ22+...+σn2)1/2

  2.2 矩阵的最优近似

  奇异值分解 是在平方损失(弗罗贝尼乌斯范数)意义下对矩阵的最优近似,即数据压缩

  紧奇异值分解:是在弗罗贝尼乌斯范数意义下的无损压缩

  截断奇异值分解:是有损压缩。截断奇异值分解得到的矩阵的秩为k,通常远小于原始矩阵的秩r,所以是由低秩矩阵实现了对原始矩阵的压缩

  2.3 矩阵的外积展开式

  矩阵 AAA 的奇异值分解 UΣVTU\Sigma V^TUΣVT 也可以由外积形式表示

  将 AAA 的奇异值分解看成矩阵 UΣU\SigmaUΣ 和 VTV^TVT 的乘积,将 UΣU\SigmaUΣ 按列向量分块,将 VTV^TVT 按行向量分块,即得

  3. 奇异值分解Python计算

  import numpy as np

  a = np.random.randint(-10,10,(4, 3)).astype(float)

  print(a)郑州妇科医院哪家好 http://m.120ask.com/zhenshi/

  print("-----------------")

  u, sigma, vT = np.linalg.svd(a)

  print(u)

  print("-----------------")

  print(sigma)

  print("-----------------")

  print(vT)

  print("-----------------")

  # 将sigma 转成矩阵

  SigmaMat = np.zeros((4,3))

  SigmaMat[:3, :3] = np.diag(sigma)

  print(SigmaMat)

  print("------验证-------")

  a_ = np.dot(u, np.dot(SigmaMat, vT))

  print(a_)

  结果:

  [[-6. 8. 9.]

  [ 6. 8. -8.]

  [ 6. -1. 2.]

  [ 6. 9. -9.]]

  -----------------

  [[-0.30430452 0.93673281 0.17295875 -0.00395842]

  [ 0.64134399 0.19762952 0.04109474 -0.74022408]

  [ 0.06410812 -0.16033168 0.98267774 0.0672931 ]

  [ 0.70140345 0.24034966 -0.05235412 0.66897256]]

  -----------------

  [19.56867211 12.83046891 6.0370638 ]

  -----------------

  [[ 0.52466311 0.45709993 -0.71818401]

  [-0.30821258 0.88838353 0.34026417]

  [ 0.79355758 0.04282928 0.60698602]]

  -----------------

  [[19.56867211 0. 0. ]

  [ 0. 12.83046891 0. ]

  [ 0. 0. 6.0370638 ]

  [ 0. 0. 0. ]]

  ------验证-------

  [[-6. 8. 9.]

  [ 6. 8. -8.]

  [ 6. -1. 2.]

  [ 6. 9. -9.]]