根据 A v i = σ i u i A\mathbf{v}_i = \sigma_i\mathbf{u}_i Avi=σiui 知矩阵 A A A 把行空间正交基 v 1 , ⋯ , v r \mathbf{v}_1,\cdots,\mathbf{v}_r v1,⋯,vr 变换为列空间垂直基(向量两两垂直,不是单位向量) σ 1 u 1 , ⋯ , σ r u r \sigma_1\mathbf{u}_1,\cdots,\sigma_r\mathbf{u}_r σ1u1,⋯,σrur ,该垂直基的方向是列空间正交基 u 1 , ⋯ , u r \mathbf{u}_1,\cdots,\mathbf{u}_r u1,⋯,ur 方向,这些向量只是尺度不再是单位长度,而是有伸缩,当 σ i > 1 \sigma_i > 1 σi>1 时变长, σ i < 1 \sigma_i < 1 σi<1 时变短, σ i = 1 \sigma_i = 1 σi=1 时不变。故矩阵 A A A 在矩阵 A A A 行列空间中构成一一映射。 A v i = σ i u i A\mathbf{v}_i = \sigma_i\mathbf{u}_i Avi=σiui , v i \mathbf{v}_i vi 可以看作高维单位球的半径, σ i u i \sigma_i\mathbf{u}_i σiui 看作高维椭球的半径,故矩阵 A A A 把球变换为椭球。
A + ( σ i u i ) = v i A^{+}(\sigma_i\mathbf{u}_i) = \mathbf{v}_i A+(σiui)=vi 伪逆相反,把列空间垂直基 σ 1 u 1 , ⋯ , σ r u r \sigma_1\mathbf{u}_1,\cdots,\sigma_r\mathbf{u}_r σ1u1,⋯,σrur 变换为行空间正交基 v 1 , ⋯ , v r \mathbf{v}_1,\cdots,\mathbf{v}_r v1,⋯,vr ,故伪逆 A + A^{+} A+ 在矩阵 A A A 行列空间中构成一一映射。伪逆 A + A^{+} A+ 在矩阵 A A A 行列空间中是矩阵 A A A 映射的逆映射,这是伪逆的本质特征。
根据矩阵奇异值分解 A = U Σ V T A = U\Sigma V^T A=UΣVT 对任意向量 x \mathbf{x} x , A x = U Σ V T x A\mathbf{x} = U\Sigma V^T \mathbf{x} Ax=UΣVTx ,所以矩阵 A A A 对向量 x \mathbf{x} x 的变换作用等效于三个矩阵 U , Σ , V T U,\Sigma, V^T U,Σ,VT 的作用,即先进行 V T V^T VT 变换,由于正交矩阵变换类似于旋转变换,可以把 V T x V^T \mathbf{x} VTx 看作仅对 x \mathbf{x} x 进行了旋转;因为 Σ x = ( σ 1 x 1 , ⋯ , σ n x n ) \Sigma \mathbf{x}= (\sigma_1 x_1,\cdots, \sigma_n x_n) Σx=(σ1x1,⋯,σnxn) 仅对 x \mathbf{x} x 进行了尺度变换,即每个坐标轴分量长度变为原来的 σ i \sigma_i σi 倍; U x U \mathbf{x} Ux 看作仅对 x \mathbf{x} x 进行了旋转。所以矩阵 A x A\mathbf{x} Ax 总效果是先进行旋转,再尺度变换,最后旋转,旋转和尺度变换解耦了。线性变换就是旋转变换和尺度变换的复合。
按照这个思路,伪逆 A + = V Σ + U T A^{+} = V\Sigma^{+} U^T A+=VΣ+UT 是先进行旋转 U T U^T UT,再尺度变换 Σ + \Sigma^{+} Σ+,最后旋转 V V V 。矩阵转置 A T = V Σ U T A^T = V\Sigma U^T AT=VΣUT 是先进行旋转 U T U^T UT,再尺度变换 Σ \Sigma Σ,最后旋转 V V V 。注意这两个变换,旋转变换完全相同,只有尺度变换不同,故矩阵转置某些性质类似逆矩阵,比如 ( A B ) T = B T A T , ( A B ) − 1 = B − 1 A − 1 (AB)^T=B^TA^T,(AB)^{-1}=B^{-1}A^{-1} (AB)T=BTAT,(AB)−1=B−1A−1 ,都需要改变顺序。
A + A = V r V r T = V E ′ V T A^{+}A = V_rV_r^T = V E' V^T A+A=VrVrT=VE′VT ,先进行旋转 V T V^T VT,再尺度变换 E ′ E' E′,最后旋转 V V V ,注意 E ′ E' E′ 变换是前 r r r 分量保持不变,后 n − r n-r n−r 分量变为 0 0 0 。总效果是前 r r r 分量保持不变,后 n − r n-r n−r 分量变为 0 0 0 ,即投影变换。
A A + = U r U r T = U E ′ U T AA^{+} = U_rU_r^T = U E' U^T AA+=UrUrT=UE′UT ,先进行旋转 U T U^T UT,再尺度变换 E ′ E' E′,最后旋转 U U U ,注意 E ′ E' E′ 变换是前 r r r 分量保持不变,后 m − r m-r m−r 分量变为 0 0 0 。总效果是前 r r r 分量保持不变,后 m − r m-r m−r 分量变为 0 0 0 ,即投影变换。
A T A = V Σ 2 V T A^TA = V\Sigma^2 V^T ATA=VΣ2VT ,先进行旋转 V T V^T VT,再尺度变换 Σ 2 \Sigma^2 Σ2,最后旋转 V V V。
A A T = U Σ 2 U T AA^T = U\Sigma^2 U^T AAT=UΣ2UT ,先进行旋转 U T U^T UT,再尺度变换 Σ 2 \Sigma^2 Σ2,最后旋转 U U U。