将一个 非 零 的 \color{red}{非零的} 非零的的 m × n \color{red}{m\times{n}} m×n的实矩阵A,表示为以下三个矩阵乘积的运算:
A = U Σ V T , 这 里 是 完 全 奇 异 值 分 解 \color{red}{A=U\Sigma{V^T},这里是完全奇异值分解} A=UΣVT,这里是完全奇异值分解
其中,U是m阶正交阵,V是n阶正交阵
满 足 U U T = E , V V T = E , 对 应 着 坐 标 系 的 旋 转 或 反 射 变 换 \color{red}{满足UU^T=E,VV^T=E,对应着坐标系的旋转或反射变换} 满足UUT=E,VVT=E,对应着坐标系的旋转或反射变换
Σ \Sigma Σ是 m × n m\times{n} m×n矩形对角矩阵(只有对角线上的元素非零)
满 足 Σ = d i a g ( σ 1 , σ 2 , ⋯ , σ p ) , σ 1 ≥ σ 2 ≥ ⋯ ≥ σ p ≥ 0 ; p = m i n ( m , n ) , 对 应 着 坐 标 轴 的 缩 放 变 化 , \color{red}{满足\Sigma=diag(\sigma_1,\sigma_2,\cdots,\sigma_p),\sigma_1\geq\sigma_2\geq\cdots\geq\sigma_p\geq0;p=min(m,n),对应着坐标轴的缩放变化,} 满足Σ=diag(σ1,σ2,⋯,σp),σ1≥σ2≥⋯≥σp≥0;p=min(m,n),对应着坐标轴的缩放变化,
任 意 实 矩 阵 A 的 奇 异 值 分 解 均 存 在 \color{red}{任意实矩阵A的奇异值分解均存在} 任意实矩阵A的奇异值分解均存在
紧奇异值分解与截断奇异值分解:
A = U k Σ k V k T \color{red}{A=U_k\Sigma_kV_k^T} A=UkΣkVkT;
U k , V k 分 别 对 应 着 完 全 分 解 中 U , V 的 前 k 列 , Σ k 由 Σ 的 前 k 个 对 角 线 元 素 构 成 \color{red}{U_k,V_k分别对应着完全分解中U,V的前k列,\Sigma_k由\Sigma的前k个对角线元素构成} Uk,Vk分别对应着完全分解中U,V的前k列,Σk由Σ的前k个对角线元素构成
假设矩阵 A 的秩为 r:
k = r :紧奇异值分解是和原矩阵 等 秩 \color{red}{等秩} 等秩的奇异值分解,对应着 无 损 压 缩 \color{red}{无损压缩} 无损压缩
k < r :上式分解中的等号要变成约等号,截断奇异值分解是比原矩阵 低 秩 \color{red}{低秩} 低秩的奇异值分解,对应着 有 损 压 缩 \color{red}{有损压缩} 有损压缩
主要性质:
求解对称矩阵 A T A A^TA ATA的特征值和特征向量,
实 际 应 用 并 不 直 接 计 算 A T A , 有 许 多 其 他 的 求 解 奇 异 值 分 解 的 算 法 ; \color{red}{实际应用并不直接计算A^TA,有许多其他的求解奇异值分解的算法;} 实际应用并不直接计算ATA,有许多其他的求解奇异值分解的算法;
弗罗贝尼乌斯范数:
∣ ∣ A ∣ ∣ = ( ∑ i = 1 m ∑ j = 1 n ( a i j ) 2 ) 1 2 = ( σ 1 2 + σ 2 2 + ⋯ + σ n 2 ) 1 2 \color{red}{||A||=(\displaystyle\sum_{i=1}^m\sum_{j=1}^n(a_{ij})^2)^\frac{1}{2}}=(\sigma_1^2+\sigma_2^2+\cdots+\sigma_n^2)^\frac{1}{2} ∣∣A∣∣=(i=1∑mj=1∑n(aij)2)21=(σ12+σ22+⋯+σn2)21
定理:在秩不超过 k k k的 m × n m\times{n} m×n的矩阵的集合 M M M中,存在矩阵 A A A 的弗罗贝尼乌斯范数意义下的最优近似矩阵 X X X,使得:
∣ ∣ A − X ∣ ∣ F = min S ∈ M ∣ ∣ A − S ∣ ∣ F = ( σ k + 1 2 + σ k + 2 2 + ⋯ + σ n 2 ) 1 2 \color{red}{||A-X||_F=\displaystyle\min_{S\in{M}}||A-S||_F=(\sigma_{k+1}^2+\sigma_{k+2}^2+\cdots+\sigma_n^2)^\frac{1}{2}} ∣∣A−X∣∣F=S∈Mmin∣∣A−S∣∣F=(σk+12+σk+22+⋯+σn2)21
而 A ′ = U Σ ′ V T , 就 是 这 样 一 个 最 优 矩 阵 \color{red}{A'=U\Sigma'V^T,就是这样一个最优矩阵} A′=UΣ′VT,就是这样一个最优矩阵, Σ ′ \Sigma' Σ′为前k个奇异值构成的 m × n m\times{n} m×n的对角矩阵;
矩阵的外积展开式:
A = ∑ k = 1 n σ k u k v k T = σ 1 u 1 v 1 T + σ 2 u 2 v 2 T + ⋯ + σ n u n v n T \color{red}{A=\displaystyle\sum_{k=1}^n\sigma_ku_kv_k^T=\sigma_1u_1v_1^T+\sigma_2u_2v_2^T+\cdots+\sigma_nu_nv_n^T} A=k=1∑nσkukvkT=σ1u1v1T+σ2u2v2T+⋯+σnunvnT,将矩阵 A A A分为矩阵的有序加权和; u k v k T u_kv_k^T ukvkT为一个 m × n m\times{n} m×n矩阵,是两个向量的外积,
若矩阵 A k = σ 1 u 1 v 1 T + σ 2 u 2 v 2 T + ⋯ + σ k u k v k T \color{red}{A_k=\sigma_1u_1v_1^T+\sigma_2u_2v_2^T+\cdots+\sigma_ku_kv_k^T} Ak=σ1u1v1T+σ2u2v2T+⋯+σkukvkT,则 A A A的秩为 k k k,且 A k A_k Ak是秩为k的矩阵中在弗罗贝尼乌斯范数意义下 A A A的最优近似矩阵,矩阵 A k A_k Ak就是矩阵 A A A的截断奇异值分解;
一 般 情 况 下 , σ i 递 减 很 快 , 所 以 即 使 k 取 很 小 值 , A k 也 能 对 A 有 很 好 的 近 似 \color{red}{一般情况下,\sigma_i递减很快,所以即使k取很小值,A_k也能对A有很好的近似} 一般情况下,σi递减很快,所以即使k取很小值,Ak也能对A有很好的近似