微分几何笔记(1) —— 预备知识 & Proof of Mazur-Ulam Theorem

上来先开了一大堆坑,不知道要填到什么时候,有点自闭,不想学习的时候就写一写吧

这个算是本科微分几何课程的笔记整理,主要涉及中的的曲线和中的曲面,follow的是Klingenberg的A Course in Differential Geometry.

说到这我想起来,刚开学时向修过的同学要实体书,自己打的是Kallenberg,闹了笑话。原因是记得大二时去某校的暑期学校,概率论讨论班用书是他的Fundations of Mordern Probability, 读的痛不欲生,从此断了学习概率的念想。

这个笔记应该是比较平和的,如果发现了错误,恳请指出。

(Ps. 本篇笔记前半部分到定理1.1是应该知道的预备知识,之后部分只是个练习,与主题内容无关,可以略过。)

 

 预备知识

1.1 欧氏空间\mathbb{R}^n和欧氏空间中的等距变换(isometry)

学过泛函都知道几个空间的关系:内积诱导范数,范数诱导距离,距离诱导拓扑

先定义下距离,范数,内积

距离:一个从集合X\mathbb{R}的二元函数d(x,y),满足

1.正定性:d(x,y)\geq0, 等号成立当且仅当x=y;

2.对称性:d(x,y)=d(y,x);

3.三角不等式:;

这样就在集合上定义了距离,记作(X,d),时常略作X,称之为一个距离空间。

 

范数(线性):一个域\mathbb{K}(实数域或者复数域)上的线性空间X,给任意点定义到原点的距离,满足:

1.正定性:\left \| x \right \| \geq0,等号成立当且仅当x=0;

2.齐次性:;

3.三角不等式:\left \| x+y \right \|\leq\left \| x \right \|+\left \| y \right \|.

从而在集合上定义了范数,记作(X,\left \| \cdot \right \|),为一个赋范线性空间,时常略作X.

(思考:为什么要是线性空间,如果是非线性空间会怎样)

 

内积:在一个域\mathbb{K}(实数域或者复数域)上的线性空间X中定义的二元函数(x, y):

1.正定性:(x, x)\geq0,等号成立当且仅当x=0

2.对称性:(x, y)=\overline{(y, x)}

3.线性:(\alpha x+\beta y, z)=\alpha(x,z)+\beta(y,z)

本笔记中写作x\cdot y,一个意思。.

 

按照这里内积的定义,只需加上完备性,就构成Hilbert空间,我将在Fourier分析的笔记(新的坑已经出现)中继续讨论。

 

内积诱导范数:

范数诱导距离:d(x,y)=\left \| x-y \right \|=\sqrt{(x-y)\cdot (x-y)}

多说一句,距离诱导拓扑也很简单,距离可以定义开集闭集,从而也就有了拓扑。

 

在后文中会用到的,线性映射(linear map) 的定义:

对于两个实赋范空间X,Y,称F为线性映射,如果

\left\{\begin{matrix} L(x+y)=L(x)+L(y) \\ L(ax)=aL(x) \end{matrix}\right.

定义 仿射(affine map):

称f为仿射,如果

 

这个课程主要是讲在低维欧式空间中的曲面曲线,所谓n维欧氏空间,就是n维实内积空间,其中的元素有向量表示x=(x_1, x_2, ...,x_n)^T ,文中出现的向量均为列向量。

 

多说一句,其实列向量行向量什么的并不本质,只要能按定义进行运算即可,什么必须行向量点积列向量只是形式化的表达,本质的是向量(矩阵)的线性性质(多线性)。但对于计算机,这个虽然不本质,但是挺重要的,比方说像在神经网络中,如果权重矩阵W的尺寸不对应输入,那当然就要报错了。

 

 

 

欧氏空间中的等距变换(isometry):

等距变换,等的应该是距离。这里要特别强调是欧氏空间中,等距离和等内积是一样的,而内积所代表的是向量长度和夹角,这些也均被保持了下来。

定义:

欧氏空间中的等距变换F:\mathbb{R}^n\rightarrow \mathbb{R}^n

 

接下来证明个定理:

[Theorem 1.1]任意\mathbb{R}^n中的等距变换,都可以写成F(x)=Ax+b的形式,其中A是正交阵,b是任意\mathbb{R}^n中向量。

 

正交阵都可以分类为旋转和对称,或者在更高维空间中,二者的混合。多说一些,就算没学微分几何,我们也知道有限维空间可以被基底线性表出,基底就如同空间的骨架一样,对一个空间作用正交阵,其骨架的相对形状是不会发生变化的。更广义一些,将正交矩阵推广到复空间中就是酉矩阵,任何一本数值线性代数的书刚开始会介绍它的性质。

我们先猜测在欧氏空间中的等距变换只有 平移 和 作用正交阵,两种途径,那么我们先将一点固定,证明固定了一点(去除平移之后),剩下的作用只能是乘一个正交阵。

Proof:

Step1:先证明在欧氏空间中,任意固定了原点的等距映射F(x)=(F_1(x),F_2(x),...,F_n(x)),保持内积:

\text{set } y=0, d(F(x),F(0))=d(x,0)\Rightarrow\left \| F(x) \right \|=\left \| x \right \| \Rightarrow \sum _iF^2_i(x_i)=\sum_ix^2_i\\ \indent \forall x, y\in\mathbb{R}^2,\text{by the definition of }d(x,y) \text{ and inner product }d(F(x),F(y))=\sum_i(F_i(x_i)-F_i(y_i))^2=d(x,y)=\sum_i(x_i-y_i)^2

上式把平方打开,两边约去相等项,就得到:F(x)\cdot F(y)=x\cdot y

 

Step2:保持内积的映射是线性映射:

因为是n维欧氏空间中的一个n-1维平面,不会恒等于0,除非系数均为0

所以有F(ax)=aF(x)

同理,

Step3:\mathbb{R}^n中任意等距变换,都可以写成F(x)=Ax+b的形式:

F(x)是等距的,那么显然F-F(0)也是等距的,且将原点映为原点,所以其为线性的。

(也就是,\mathbb{R}^n中任意等距变换F(x)都是仿射的)

\text{thus}, \exists A\in\mathbb{R}^{n\times n}, s.t. F-F(0)=Ax,而由第一步的结论,保内积:

Ax \cdot Ay=x^TA^TAy=x\cdot y \\ \Rightarrow \forall x,y\in \mathbb{R}^n, A^TA=I, \text{similiarly, }AA^T=I,所以A为一个正交阵

原命题得证。

 

为了证明Mazur-Ulam 定理,先证个引理:

[Lemma 1.2]任意等距映射F: X\rightarrow Y是仿射的(affine),如果满足:

F(\frac{x+y}{2})=\frac{F(x)+F(y)}{2}, \forall x,y\in X

Proof:

先令x=x+y, y=0

F(\frac{x+y}{2})=\frac{F(x+y)+F(0)}{2}=\frac{F(x)+F(y)}{2} \\ \\ \Rightarrow (F-F(0))(x+y)=(F-F(0))(x)+(F-F(0))(y)

这就证明了线性的第一个要求

 

复杂在第二个要求:

在条件中令y=0:

递归知道这个式子对任意2的负指数幂均成立;

在条件中令x=2x, y=0:(F-F(0))(2x)=2(F-F(0))(x)

同理,这个式子对任意2的正指数幂均成立;

我们知道任意一个实数在二进制下都可以写成2的幂次的和,如果在二进制下是有限项,根据我们已经证明的线性第一个要求,这个实数已经可以被拉到映射外面了,但如果是无限项呢?这就需要考虑极限和映射F(x)的换序问题

对任意给定的a,写成二进制后,它的2的正整数次幂总是有限项,因为a是给定,是有限的一个数。只需要考虑它万一有无穷项负整数次幂的情况:

我们需要证明的是\lim_{N\rightarrow \infty}F(\sum^{-1}_{n=-N}2^nx)=F(\sum^{-1}_{n=-\infty}2^nx),这里便用到了F(x)是等距的,从而连续,因为,只需要让就是连续的定义。因为极限和连续映射可以换序,就有

F(\sum _{\substack{n\in\mathbb{Z}, \\n\in(-\infty,M]}}2^nx)=\sum _{\substack{n\in\mathbb{Z}, \\n\in(-\infty,M]}}2^nF(x)\\ \\ \Rightarrow F(ax)=aF(x)

从而引理得证。

 

对于“引理”,小时候做竞赛题,看解答,经常见到先证明一个引理,然后势如破竹证明了原题目,觉得神奇但想不通怎么来的,所以直接放弃。现在来看是经过尝试,总结一个通法,加上一点(或许很多)灵性或者高观点,猜测一个引理当作工具。希望勤能补一点点拙吧。

 

[Theorem 1.3](Mazur-Ulam 1932)\text{Let X and Y be two real normed spaces, and }F : X \rightarrow Y \text{ be a surjective isometry. Prove F is affine.}

Proof:

在等距映射的条件下,满射(surjective)和双射(bijective)是等价的:

如果

我们希望能够对F证明出引理的形式,这样应用引理,就能说明F是一个仿射

定义一个关于F的差值:

\text{def } d(F)=\left \| F(\frac{x_1+x_2}{2})-\frac{F(x_1)+F(x_2)}{2} \right \| \\ \leq \frac{1}{2}\left \| F(\frac{x_1+x_2}{2})-F(x_1) \right \| + \frac{1}{2}\left \| F(\frac{x_1+x_2}{2})-F(x_2) \right \|=\frac{\left \| x_1-x_2 \right \|}{2}\leq \infty

也就是说d(F)关于F是一致有界的(uniformly bounded in F) 

如果定理正确,这个差值应该是恒等于0的,我们反证这个事,如果F和d(F)是正线性相关的,然后我们不停的放大F以致于无穷,那么d(F)也应该趋近于无穷,而d(F)是一致有界的,造成矛盾。所以接下来就是要找到F和d(F)之间的相关关系。

 

最重要的一步:

在Y空间中,考虑一个关于\frac{F(x_1)+F(x_2)}{2}的中心对称变换\rho : y \mapsto F(x_1)+F(x_2)-y

\text{set } F'=F^{-1}\rho F\\ d(F')=\left \| F'(\frac{x_1+x_2}{2})-\frac{F'(x_1)+F'(x_2)}{2} \right \|=\left \| F^{-1}\circ \rho \circ F(\frac{x_1+x_2}{2})-\frac{F^{-1}\circ \rho \circ F(x_1)+F^{-1}\circ \rho \circ F(x_2)}{2} \right \| \\ \\ =\left \| F^{-1}(F(x_1)+F(x_2)-F(\frac{x_1+x_2}{2}))-F^{-1}(F(\frac{x_1+x_2}{2})) \right \|=\left \|F(x_1)+F(x_2)-2F(\frac{x_1+x_2}{2}) \right \| \\ \\ =2d(F)

 

所以如果不是d(F)\equiv 0的话,不停的迭代F,会导致d(F)趋向∞,矛盾。

d(F)\equiv 0使用引理,定理得证。

 

参考:

[1]厦门大学杨波老师的主页:http://math-faculty.xmu.edu.cn/display.aspx?tid=149

[2]Bogdan Nica:THE MAZUR - ULAM THEOREM:https://arxiv.org/abs/1306.2380v1

[3]Wilhelm Klingenberg:A Course in Differential Geometry

你可能感兴趣的:(数学笔记,#微分几何,微分几何,Differential,Geometry,Klingenberg)