【矩阵论】内积空间与等距变换(1)

内积空间与等距变换之基本概念

前面有关于“线性空间与线性变换”的概念主要是对几何空间中的线性运算(数乘和加法运算)进行了推广;
不论我们讨论线性空间的什么性质和定义,其本质都是围绕着线性运算进行展开的。

但是在几何空间中还有一些概念(度量类的概念)没有进行推广,比如说向量的长度,以及两个向量之间的夹角。

以下对于将所谓“度量”概念推广到抽象线性空间进行描述:
E.g.(以最特殊的二维平面的线性空间为例)
【矩阵论】内积空间与等距变换(1)_第1张图片
在平面直角坐标系中有两个向量α和β,相应给出了向量的坐标,可以利用坐标对向量的长度||α||(或||β||)以及两个向量之间的夹角φ进行表示。

同时,对于平面向量,有一个我们很熟悉的运算【内积】,通过内积,可以将向量的长度和向量间的夹角都用内积进行表示。
接下来,我们的目标就是把【内积】这一度量性质向抽象线性空间进行推广。
在这里插入图片描述


一. 内积

1.内积的定义和性质

(1)内积的定义

【矩阵论】内积空间与等距变换(1)_第2张图片
四条性质分别说明:
①内积满足正定性
②内积满足可加性
③内积满足齐性
④交换两个元素进行内积运算得到的结果互为共轭数

(2)由内积定义的空间

①内积空间

定义了内积的线性空间称为内积空间

②欧几里得空间和酉空间

对于一个内积空间:

当数域F是实数域R时,为欧几里得空间
当数域F是复数域C时,为酉空间

也即:我们把欧几里得空间和酉空间统称为内积空间。

特别地,因为欧几里得空间的数域集合为实数域,所以不存在所谓“共轭”一说。欧几里得空间中对应的性质【<α,β> = <β,α>】称作对称性。

(3)一些内积空间的示例
【矩阵论】内积空间与等距变换(1)_第3张图片

上述1-3都是欧几里得空间,4是酉空间。

对于空间4来说,其运算方式就是某一复向量乘上另一复向量的共轭。至于“为什么一定要在运算定义的时候加上【共轭】”是为了满足内积定义的正定性。

而根据共轭运算的性质,也可以验证空间4中的定义是满足共轭对称性的。

上述空间1和空间4是最为常见的夜视最符合常理的两个内积定义,因此常把其二者称为标准内积

后续如果提到Rn和Cn,没有特殊说明,均是指上图中定义的两个标准内积。

(4)内积的性质(归纳总结)

①内积不论是对第一个元素还是第二个元素均满足可加性

在这里插入图片描述

在内积的定义中已经说明了对于第一个元素是满足可加性的,这一条性质对于第二个元素进行补充。

②内积对第二个元素只满足“共轭”齐性(自己编的名字…)

在这里插入图片描述

证明如下:
【矩阵论】内积空间与等距变换(1)_第4张图片
①-----内积定义中的共轭性
②-----内积定义中的“关于第一个元素的齐性”
③-----共轭的运算性质
④-----内积定义中的共轭性

③内积运算“线性性”的有限拓展

在这里插入图片描述

从左向右看,因为对于第一个元素和第二个元素均满足可加性,所以求和符号均可以提出去。

再利用内积运算对于第一个元素的齐性和对于第二个元素的“共轭齐性”,将内积中的系数提出并有相应的形式。

④零元素参与的内积结果为0

在这里插入图片描述

证明如下:
【矩阵论】内积空间与等距变换(1)_第5张图片
其中,对于θ向量可以构造任意系数k,并不一定只有构造系数0的时候才能证明出来。

当构造出来的系数为k的时候,就能推出<α,θ> = k<α,θ>,自然也能推出<α,θ> = 0.
【注意】因为内积的定义本质上是个函数(从数集到数集的特殊映射),所以内积的运算结果是数值。


2.内积的简易表示——度量矩阵

(1)度量矩阵的定义

【矩阵论】内积空间与等距变换(1)_第6张图片

按照上述定义,在一个空间中,给定了一组基之后,两个向量的内积结果和其度量矩阵是一一对应的。

(2)度量矩阵的特点

不是任意一个矩阵都可以作为一个度量矩阵的,需要满足一定性质。

这里只对度量矩阵应该满足的基本特点进行一下说明。

【矩阵论】内积空间与等距变换(1)_第7张图片
所谓A = AT,就是说<εi,εj> = <εj,εi>

而A = AH,就是说<εi,εj> = <εj,εi>的共轭

我们把满足A = AH的矩阵A称为Hermit矩阵。

Hermit矩阵及其性质是对我们大学线性代数中【正定矩阵】的推广和定义。


二. 向量的度量性质(模长、距离、夹角)

在这一节开始之前,我们就先理顺了本章节的思路。

我们对内积进行定义和讨论,最终还是想要引出向量的一些度量性质,如长度和夹角。

1. 向量模长的定义和性质

(1)模长定义

【矩阵论】内积空间与等距变换(1)_第8张图片

(2)模长性质

①判断零向量的充要条件

在这里插入图片描述

换句话说,非零向量的模长应该要大于零,这一点也和内积的定义中的第一点相吻合。

②模长的数乘性质
在这里插入图片描述

证明:
按照模长的定义将kα代入公式,再针对第一个位置的齐性和第二个位置的共轭齐性,可以将系数k提取出来,整理就得到结论所要的形式。【矩阵论】内积空间与等距变换(1)_第9张图片

其中符号|k|的含义取决于k隶属于哪种数域,如果在实数域中讨论,|k|称作是k的绝对值;如果在复数域中讨论,|k|称作是k的模

③向量的单位化

通过引入了第二条性质,说明了向量具有数乘性之后,对于任意一个给定的向量,均可以通过【单位化】的手段,将其转变成一个单位向量。

p.s. 回顾模长的定义中所说,单位向量的定义就是模长为1的向量

【矩阵论】内积空间与等距变换(1)_第10张图片


2. 向量的夹角和距离

再来回顾一下我们在这章节之前就讨论过的思路,对于一个二维平面的向量夹角求解来说,可以通过模长和内积以及反三角函数的求解得到两个向量的夹角,求解公式如下所示——
【矩阵论】内积空间与等距变换(1)_第11张图片

但是要想利用该公式进行求解,必须要满足反三角函数运算的相关性质,比如说(<α,β>/(||α||·||β||))这个式子的值必须要在[-1,1]之间。

显然并不能达到这一要求,因为对于复数域中的内积运算,结果很有可能是负的,所以我们只想要将这种类似性质的关系在抽象线性空间中进行推广。

(1)两个重要不等式

①C-B不等式

【矩阵论】内积空间与等距变换(1)_第12张图片

两个向量的内积的绝对值是不大于两个向量模长的乘积

当且仅当两个向量α和β线性相关(也就是成比例的时候)不等式取到等号。

②三角不等式

【矩阵论】内积空间与等距变换(1)_第13张图片

在以前讨论过的二维平面和向量空间中我们已经很熟悉三角不等式了,在二维平面中,三角不等式还有一个几何意义就是对于三角形来说,【两边之和一定大于第三边】,现在我们要证明三角不等式在抽象的线性空间上依然成立。

证明如下:
【矩阵论】内积空间与等距变换(1)_第14张图片

1:模长的定义
2:内积运算的可加性
3:模长的定义——<α,α> = ||α||2;复数的运算——设u = a + bi,则u+u(共轭) 2Re(u) = (a+bi)+(a-bi) = 2a
4:放缩,一个复数的实部(或虚部)总是不大于这个复数的模
5:运用C-B不等式
6:逆向使用完全平方公式

(2)向量之间的距离

①定义
【矩阵论】内积空间与等距变换(1)_第15张图片

要比较两个向量的距离,把两个向量的起点移到同一点,比较两个向量终点间的距离。

②三角不等式的距离形式

【矩阵论】内积空间与等距变换(1)_第16张图片

证明时抓紧两向量间距离的定义,以及使用向量的三角不等式进行构造

在这里插入图片描述

(3)向量的正交

①正交的定义

若向量α和β的内积为零,则称α和β是正交的。记作:α⊥β。

②勾股定理

将向量的正交性和向量的模长联系起来,对于几何中我们所熟悉的“勾股定理”就可以用以下式子进行表示。

若α⊥β,则||α+β||2 = ||α||2 + ||β||2
【矩阵论】内积空间与等距变换(1)_第17张图片

证明:利用模长和内积之间的关系【<α,α> = ||α||2】以及向量正交的定义【<α,β> = 0↔α和β正交
【矩阵论】内积空间与等距变换(1)_第18张图片


三. (标准)正交基

1. (标准)正交基的定义

(1)引入时机

在前面我们对向量的模长以及向量的夹角(正交)都进行了讨论,那么自然地,我们就可以像线性代数那样引出标准正交向量基的概念,将这一概念在抽象线性空间中进行推广。

(2)定义

【矩阵论】内积空间与等距变换(1)_第19张图片

在这里说明一下,所谓(标准)正交基的概念都是从相应的向量组之间过渡得到的,也就是说将一组基看成是一组向量组的时候,如果他是(标准)正交的,那么它就是(标准)正交基。

(3)引入原因

为什么要引出标准正交向量基?——任意向量在标准正交基下进行表示的形式十分简单。

假设ε1,ε2,…,εn是一组标准正交基,那么由此可知两两不同向量之间都是正交的且向量的模长都是1.

即:当i≠j时,<εi,εj> = 0;当i = j时,<εi,εj> = 1

根据上文我们讨论过的【度量矩阵】的概念,可以得到在标准正交基下对应的度量矩阵是一个单位矩阵,因此表示十分简单。

2. 标准正交基下的运算

(1)标准正交基下的内积

【矩阵论】内积空间与等距变换(1)_第20张图片

证明与理解:
按照向量内积的度量矩阵表示方式,可以得到α和β两个向量的内积表示实质为下图所示
【矩阵论】内积空间与等距变换(1)_第21张图片
而其中X的转置和Y的共轭相乘,其结果和YH·X的结果是一致的,按照内积的定义,可以写成是在Cn这个常见的内积空间中向量X和Y的标准内积的结果。

在上文“常见内积空间的示例”中我们讨论过Cn中标准内积的定义
【矩阵论】内积空间与等距变换(1)_第22张图片


(2)Schmidit正交化方法

前面已经讨论过拥有了标准正交向量基之后,向量之间的运算表示会得到很大的简化,因此,若给定了任意一组基,我们希望它是标准正交的。

设给定的一组基α1,α2,…,αs∈V是线性无关的。

①正交化过程
【矩阵论】内积空间与等距变换(1)_第23张图片

正交化过程的理解:

拿β2的构造过程示例——先前已经设立了β1 = α1,那么利用β1和α2需要能够构造出β2,故写成β2 = α2 - kβ1的形式

因为我们在正交化的过程,所以构造出来的β2和β1必须是正交的,故而求出k系数。
【矩阵论】内积空间与等距变换(1)_第24张图片

正交化后得到的一组向量β1,β2,…,βs,它们两两之间都是正交的。

②单位化过程

【矩阵论】内积空间与等距变换(1)_第25张图片

因此,可知道,任意给定的一组基都存在其相应的标准正交向量基

【例】标准正交向量基的求解 - 1

在这里插入图片描述

【题型框架】给定某空间在某一组基下的度量矩阵,求解该组基对应的标准正交向量基。

p.s. 对于度量矩阵不熟悉的读者,可以参考前文讨论过的“度量矩阵”,度量矩阵中蕴含着大量的基的模长和内积的信息。

【矩阵论】内积空间与等距变换(1)_第26张图片
【矩阵论】内积空间与等距变换(1)_第27张图片

对于给定的基ε1和ε2进行标准正交化的过程同样也按照先正交化再单位化来变化。

从度量矩阵中,可以得到以下信息——
<ε1,ε2> = 2 ; <ε1,ε1> = 1 ; <ε2,ε2> = 5.
从而解决了正交化的问题

在单位化过程中,需要求解β2向量的模长→需要求解β2向量自身的内积→β2向量在基ε1和ε2下的坐标为[-2,1]T→β2自身内积在基ε1和ε2对应的度量矩阵下的求解应为[-2,1]·A·[-2,1]T,其中A为度量矩阵。


【例】标准正交向量基的求解 - 2

在这里插入图片描述

【题型框架】给定的一个内积空间中(内积运算有可能是自定义的,一定要跳出常规思维),找出其中一组标准正交基

一般都是在我们常见的内积空间中求解,可以先找出一组我们熟悉的基,再按照方法逐步标准化和单位化。

<正交化>

题目中给出了内积的严格定义,不管是求内积还是求模长,都要严格按照定义进行积分运算。

【矩阵论】内积空间与等距变换(1)_第28张图片
<单位化的过程此处省略,读者可以自行计算>


(3)酉矩阵

讨论酉矩阵——

其一,是为了研究标准正交向量基不唯一的问题

其二,酉矩阵是【正交矩阵】这一概念在抽象线性空间中的推广。

p.s. 关于第二点,读者可以在看过酉矩阵的定义之后再体会,只需记住,若AT·A = I,那么A就称为正交矩阵

①定义
在这里插入图片描述

当矩阵A是实矩阵,那么就有AH(念作:A的共轭转置矩阵) = AT

②命题和性质

前面就说过了酉矩阵的概念本身就是正交矩阵的拓展,所以以下命题都可以用正交矩阵进行类比。

【矩阵论】内积空间与等距变换(1)_第29张图片

③定理1(“酉矩阵对于讨论标准正交基有什么作用呢?”)

【矩阵论】内积空间与等距变换(1)_第30张图片

理解:
板书稍稍有点凌乱,读者可以先按照我框画的各个板块进行理解,若有疑问,可以再看底下的文字注释:

根据前面的命题,要想证明U是酉矩阵,即只需要证明U的行(列)向量组是Cn的标准正交基。
将U矩阵写成列矩阵分块的形式,其中每一个分量xi也有其实际意义:γi在基α1,α2,…,αn下的坐标

对任意两个向量γi和γj求内积,因为γ向量是在标准正交基α1,α2,…,αn底下进行表示,根据定理可以写成其坐标在Cn空间的标准内积。
【矩阵论】内积空间与等距变换(1)_第31张图片

因为是标准正交基,其有【当i≠j时,内积为0;当i=j时,内积为1】的结论,从而得证x1,x2,…,xn就是Cn空间中的一组标准正交基,也就是说矩阵U就是酉矩阵

④定理2(“任意一个子空间的基是否可以扩充成整个线性空间的基”)

【矩阵论】内积空间与等距变换(1)_第32张图片

你可能感兴趣的:(数学,#,矩阵论,线性代数,矩阵论,数学,笔记,内积空间)