一文让你通俗易懂的理解正交变换和正交矩阵

变换

在线性代数中,我们经常用到“变换”这个词,什么是变换?

“变换”本质上就是函数,不过我们狭义认为的函数接收和输出都是一个数,这个数位于实数空间中, x ∈ R x \in \mathbb{R} xR。但是在实际应用中,问题是复杂的,输入和输出不止是一个数,往往是多元的,这些数组织起来我们称为向量,从一个向量作用到另一个向量的这个过程,我们就称为“变换”,它接收的是一个向量,而向量位于高维空间中, x ∈ R n x \in \mathbb{R}^n xRn

对于函数,我们有一个具体的函数体 f ( x ) f(x) f(x),研究这个函数体的性质有助于我们理解这个函数是如何作用于输入的,从而揭露了从输入到输出之间的规律。对于变换,我们是通过矩阵来实现类似函数的功能。我们要对一个输入向量 x , x ∈ R n x ,x \in \mathbb{R}^n x,xRn 进行变换,那么就对其左乘一个矩阵 A A A,于是变换的定义就是左乘一个矩阵: y = A x y=Ax y=Ax
一文让你通俗易懂的理解正交变换和正交矩阵_第1张图片
左乘一个矩阵就代表对右边的向量做一次变换,向量代表的是一条有方向的直线,变换的结果其实就是对这条直线进行各种运动,包括:平移、旋转、伸缩、投影(高维到低维)、映射等,其中,映射是对一个向量作升维或降维(也可以在同一空间中)的操作 R n \mathbb{R}^n Rn R m \mathbb{R}^m Rm,所以广义上,映射的意思等同于变换.

另外一个经常提到的词是“线性变换”,线性变换保证了输入的直线(向量)在变换过程中不会产生弯曲,即输入是直线,输出也是直线。因为 矩阵变换都是线性变换,所以我们这里说的“变换”其实就是“线性变换”。

先举个简单的例子,假如我们要将直线OB [ x y ] \left[ \begin{matrix} x \\ y \end{matrix} \right] [xy]变换到直线OB’ [ x ′ y ′ ] \left[ \begin{matrix} x' \\ y' \end{matrix} \right] [xy],也就是逆时针旋转 θ \theta θ,那么我们怎么求变换矩阵 A A A
一文让你通俗易懂的理解正交变换和正交矩阵_第2张图片
根据变换的定义,也就求一个矩阵 A A A,使得:
[ x ′ y ′ ] = A [ x y ] \left[ \begin{matrix} x' \\ y' \end{matrix} \right] =A \left[ \begin{matrix} x \\ y \end{matrix} \right] [xy]=A[xy]
一文让你通俗易懂的理解正交变换和正交矩阵_第3张图片
于是变换矩阵
A = [ c o s θ − s i n θ s i n θ c o s θ ] A=\left[ \begin{matrix} cos \theta & -sin \theta \\ sin \theta &cos \theta \end{matrix} \right] A=[cosθsinθsinθcosθ]
例子来源https://www.zhihu.com/question/67425734/answer/252724399

那么假如我们二维中有许多点都要同时进行同样的变换怎么办,很简单,把这些点依次并列起来,然后用矩阵 A A A去作用,也就是
[ x 1 ′ x 2 ′ x 3 ′ … y 1 ′ y 2 ′ y 3 ′ … ] = [ c o s θ − s i n θ s i n θ c o s θ ] [ x 1 x 2 x 3 … y 1 y 2 y 3 … ] \left[ \begin{matrix} x'_1 & x'_2 & x'_3 &…\\ y'_1 & y'_2 & y'_3 &…\end{matrix} \right] =\left[ \begin{matrix} cos \theta & -sin \theta \\ sin \theta &cos \theta \end{matrix} \right] \left[ \begin{matrix} x_1 & x_2 & x_3 &…\\ y_1 & y_2 & y_3 &…\end{matrix} \right] [x1y1x2y2x3y3]=[cosθsinθsinθcosθ][x1y1x2y2x3y3]
可以推广到任意维度的变换 C m × n = A m × m   B m × n C_{m \times n}=A_{m \times m} \, B_{m \times n} Cm×n=Am×mBm×n,其中 A A A是变换矩阵, B B B是原矩阵, C C C是变换的结果,假如我们把 B B B C C C的每列看作一个点或向量,那么矩阵就是一个点集(有时候也称空间)或向量组,这也是矩阵的其中一种意义。

正交变换

在各种变换中,有一种变换拥有良好的特性——它能使变换后的向量长度,向量之间的内积、距离、夹角等很多性质都不变,这种变换,我们称为正交变换,用于实施这种变换的矩阵,我们称为正交矩阵,这种变换的特性,我们称为正交变换的不变性

假如有m个向量,我们把向量都看作点,那么这m点就会构成一个具有一定几何结构的空间(图形),我们对这m个点进行正交变换,其结果直观来说就是,正交变换不会对图形进行拉伸、压缩,它能够使变换后的图形保持原来图形的几何形状,如下图所示,ABC构成的空间正交变换到A’B’C’,其大小和形状都不会改变
一文让你通俗易懂的理解正交变换和正交矩阵_第4张图片

正交矩阵

上面的正交变换是从变换的结果来进行直观的解释,可以看到这种变换拥有良好的性质——能够保持空间的不变性,保证不会对原空间产生压缩拉伸,往深了说,就是这种变换不会损失信息,因为它保持了原空间的内部结构,这在工程上是很有用的。

那么产生这种变换的矩阵——正交矩阵是什么样的,有什么性质?下面给出正交矩阵的定义:

如果矩阵 A A A满足: A A T = A T A = E AA^T=A^TA=E AAT=ATA=E,则A为正交矩阵。

由上述定义,我们可以很容易得到正交矩阵的如下性质:

  1. A T = A − 1 A^T = A^{-1} AT=A1
  2. 等式两边取行列式,可以得到 ∣ A ∣ = ± 1 |A|= \pm1 A=±1
  3. 列(行)两两相乘相同为1,不同为0(与自身转置乘的意义),可以得到 A A A的各列(行)都是单位向量且两两正交

根据上述三条性质,可以很容易证明正交变换的不变性(本质上是内积和长度的不变性):

  1. 对于正交变换 A x 和 A y Ax和Ay AxAy 的内积,有: ( A x ) T A y = x T A T A y = x T y (Ax)^TAy = x^TA^TAy=x^Ty (Ax)TAy=xTATAy=xTy,即向量的内积不变
  2. 对于正交变换 y = A x y=Ax y=Ax 的长度,有: ∣ y ∣ = y T y = ( A x ) T A x = x A T A x = x T x = ∣ x ∣ |y|=\sqrt{y^Ty}=\sqrt{(Ax)^TAx}=\sqrt{xA^TAx}=\sqrt{x^Tx}=|x| y=yTy =(Ax)TAx =xATAx =xTx =x,即向量的长度不变
  3. 同理,对于向量间的夹角<>,由于长度和内积不变,所以夹角不变
  4. 同理,还可证得向量间的距离不变

由于长度、夹角和距离都不变,所以正交变换能够保持空间的几何形状。

如果对你有帮助,请点个赞:-D

你可能感兴趣的:(数学知识)