从欧几里得到微分几何
什么是几何学
陈省身
整理:林丽明
几何原本
在差不多一百年前,几何就是欧几里得。他在公元前三百年左右写了一部大书,中文叫做《几何原本》。从这本书我们可以看出:在当时的社会,几何并不被大家所注意,所以像欧几里得这样伟大的人,我们也不大知道他的生平。大致说起来,他是属于西元前365~275年间的人物,这是大致算的时间,并不表示他活了90岁。
这本书是人类文化史上一部非常伟大、有意义的著作,它的主要结论有两个:
一、毕氏定理:有一直角三角形 ABC,则长边的平方会等于其他两边的平方和。由几何方面来说,如果我们在三边上各作一个正方形,那么两个小正方形的面积和就会等于大正方形的面积(见图一)。
图一 c2=a2+b2
二、三角形三内角之和等于180°,如果以弳 (radian) 为单位,也可以说三角形三内角之和等于π。
这本书在当时受到重视,不单只是为了学几何,主要还要学一种逻辑推理的方法。欧几里得用几个很明显的事实──公理,把几何的结论从公理用逻辑的方法推出。而在他所列出的公理当中,较受争议的是平行公理。平行公理原来是说:有两条直线被一直线所截,如果截角的和小于180°,那么这两条直线在充分延长后,必相交于一点。(见图二)
图二
另一个简单的说法是:假使有一直线和线外一点,那么通过那个点就刚刚好只有一条直线和原来的直线平行。平行者,就是这两条直线不相交(见图三)。
图三
这个平行公理在所有公理之中是最不明显的,所以数学家或是对数学有兴趣的人便想从其他的公理去推得平行公理。而这努力延持了两千年,后来证明这是不可能的,于是有了非欧几何学的发现,这在人类思想史上是非常特别、有意思的事实。因此我感觉到这是西洋数学和中国数学不同的地方。
《九章算经》是中国古代最有名的数学书,一共九章,第九章谈的是所谓勾股,勾、股就是直角三角形中较短的两个边,一个叫做勾,另一个就叫做股,而最长的那个边便称为弦。勾股定理也就是刚才所谓的毕氏定理,所以它的发现,中国人也应该有份。但是在中国的几何中,我无法找到类似三角形三内角和等于 180° 推论,这是中国数学中没有的结果。
因此,得之于国外数学的经验和有机会看中国数学的书,我觉得中国数学都偏应用;讲得过分一点,甚至可以说中国数学没有纯粹数学,都是应用数学。这是中国科学的一个缺点,这个缺点到现在还存在,大家都讲应用,不注意基础科学。当然应用很要紧,但是许多科学领域基本的发现都是在基础科学。
球面几何与非欧几何
因为有三角形三内角之和等于180°这个结论,而有接下来的重要发展:
一、球面几何所讨论的三角形,不一定是要在平面上,也可以是一个球面三角形,在这个情形下,三角形三内角之和会大于180°,并且有一个非常重要的公式:
R 是球的半径,R2 则是度量球面的曲率,因此有曲率的观念跑到这样一个简单的公式里。这在数学或物理上是一个重要发展,因为爱因斯坦的相对论中,曲率=1/R2 代表一个场的力,所以几何度量和物理度量便完全一样。
二、非欧几何在这个情形下,三角形三内角之和是小于 180°的,即有如下的重要公式:
此时 R2 代表非欧几何的一个绝度的度量,换句话说在非欧几何的平面上,它的曲率是负的,即 曲率=。因此,在空间或者平面的曲率,可以是正的,像球面几何;也可以是负的,像非欧几何。而其相对应的三角形三内角和,也分别有大于或小于 180°之情形,不再满足欧几里得的平行公理。
坐标几何
欧几里得几何之后,第二个重要的发展是坐标几何。这是法国哲学家、数学家笛卡儿(1596~1650年),对于研究几何,引进了坐标的概念,因此可用解析的方法来处理几何的问题。坐标就是说:假使在 X-Y 平面上,有两个轴:X 轴和 Y 轴,那么一个点的两个 X、Y 坐标,就分别以如图四中的两个相对应的度量来表示。
图四
因此几何的讨论可用解析方法,即:
于是几何的问题便成为代数的问题。
这样的发展不但使几何问题的处理容易些,更有其重大的意义:
一、解析之后,使可研究的图形的范围扩大,除了直线的一次方程式,或者圆周的二次方程式,我们还可以取任意的方程式 f(x,y)=0,讨论所有点它的坐标 (x,y) 适合这样方程式的轨迹。因此许多用几何的方法很难处理的曲线,在解析化之后,都可从表示它的方程式中得到有关的几何性质。
二、研究的图形不再局限在二维的平面上,可推广至高维的空间。世界上的事情,如果只用二维的平面,往往不足以表示,需要取更多的坐标。例如我们所在的空间是三维,有 x、y、z 三个度量。假使要用几何来表示物理的问题,那么三个度量之外,尚须加一个时间 t,所以物理的空间就变成了四维的空间;不但如此,假使有一点在三维空间运动,那么除了需要 (x,y,z) 来表示点的位置,还需要这三坐标对时间的微分来表示它的速率,即 ( ),这就成了六维空间。所以种种的情形都指示我们有必要考虑更高维的空间,来表示自然的现象。
解析几何把几何研究的范围大大地扩大了,而科学发展的基本现象,就是要扩大研究的范围,了解更多的情形。笛卡儿的解析几何,便达到了这个目的,使几何学迈入一个新的阶段。
群的观念
第三个发展是群的观念,这是数学上一个基本的结构。数学上总是要运算,加、减、乘、除;研究几何的话,把这个东西从这个位置移动到其他的位置,也是个运算。而这样的运算(也称为运动)有一个特别的性质,也就是说:把一个物体从甲地移到乙地,再移到丙地,可直接把物体从甲地移到丙地,即两个运动的结果,可经由一次运动来达成,具有这个特殊性质的,便称其成一群。研究几何的对象,应是研究经运动群后是不变的几何的性质。这个观念立刻便有了重要的发展。
既然讨论运动群,有时我们还想讨论更大的群,看是不是有些性质不但在运动群下不变,在更大的群之下也是不变。历史上最主要的例子是投影。假使两条直线在空间中相交,从一点投影,被一新平面所截,则所得之二直线仍旧是相交。这种“直线相交”的几何性质,是经过一种比运动还广的投影之后,仍然不变的。这也有许多应用,如艺术家画画,讲求透视,远近合乎几何的条件。
研究几何性质在投影群之下不变的是所谓投影几何。投影几何的发展,把几何的观念推广了,不只是有普通的欧几里得几何(讨论几何性质经运动群后不变的),也可以讨论投影几何中,投影后仍是不变的性质。有许多经运动群后不变的性质,在投影变换后是变了的,像距离、角度,但是还有些更重要的性质在投影下是不变的,而且这些性质能经过(大一点的)投影群不变,在几何上自有其重要的意义。
法国数学家 Poncelet(1788~1867年),在投影几何发展史上是一个主要的人物。他曾追随拿破仑攻打俄国,被俄俘虏,囚禁在俄国监狱中,而他的主要著作,也就是在此时完成的。因此,大家常常抱怨科学研究的设备不好,相形之下,这个例子可以证明这不是科学研究最主要的问题──当然这情形非常例外。
黎曼及克莱恩的几何学
在几何学的发展之中,有许许多多几何学,像欧几里得几何学、投影几何学……及其他种种几何学,自然就要有一个人把它综合集结起来,那就是德国的数学家克莱恩(F. Klein, 1849~1925年)。他在二十二岁的时候,前往德国小城 Erlangen 的一所大学任教。依据德国的习惯,新教授上任必须做一次公开演讲,而他讲演的结果──Erlangen program,就是这个新几何学,他把几何学建立在群的观念上:一个空间有一个变换群,允许把空间的图形从这个位置移到另一个位置。因此有了一个群之后,便有一种几何,它研究所有经过这个变换群不变的几何性质。这个群可以是欧几里得运动群,也可以是投影变换群,或者其他种种的群。因为群的选择不同,也就得到许多不同的几何学;其中包括非欧几何学。
仿克莱恩的观点,只要在空间中有一个所谓二次的超曲面,就有一个非欧几何,它讨论使这个二次超曲面不变的投影变换子群所相应的几何性质。如:在平面上有一个圆周,非欧几何就变成研究圆内点所构成的空间的性质,也就是在双曲平面 (hyperbolic plane) 上讨论。因此由克莱恩的观点,非欧几何学就变得极易处理。
在这阶段前,还有黎曼 (Riemann) 几何的发展,这是笛卡儿坐标几何的自然推广。在笛卡儿坐标系中如果我们取 m 维的空间,一个点就可以用 m 个坐标 来表示,而此点到原点的距离如果是 d,那么就有(见图五)。即这个点到原点距离的平方,是坐标的一个二次式。而黎曼不但用坐标,他还用坐标的微分,于是硬把笛卡儿几何局部化。因此黎曼几何可说是一个局部化的几何。黎曼几何主要建构在弧长 s 上,弧长微分的平方会等于坐标的一个二次微分式,即;用弧长即可建立一个几何,因为既然有了 ds,便可计算两点所连接的曲线的长度,也就是弧长。“测地线”(geodesic) 是指在两点间使弧长最短的那条曲线,它是平面上直线的推广。有了测地线,便可以有面积及其他种种观念。
图五
黎曼几何最初在二维的情形是高斯(Gauss, 1777~1854年)发展的,他在1827年写了一本差不多五十页的小册子,研究在二维(即曲面)的情形及这样的 ds2 之下,所能够发展的几何性质。他的目的是为了应用,因为当时的德国 Hannover 政府要他主持一个测量工作,为了给这个测量工作一个理论甚础,于是高斯写下了这篇在微分几何上最要紧的论文,微分几何自此诞生。以前关于把微积分用在几何上的问题,只能说是微积分在几何学上的应用,在高斯这篇文章之后,微分几何便成了一门独立的学问,就是从 ds2 得到一切的几何性质。
1854年,黎曼(1826~1866年)在为取得大学教书资格的公开演讲上,发表了黎曼几何的第一篇论文。黎曼几何并不像其他我们所谈的欧几里得几何,或者克莱恩的 Erlangen program 几何,或者是投影几何,需要整个的空间。在黎曼几何的情形之下,我们只需要空间的一部分,因为 ds2 有意义,我们便可量弧长、面积、角度等几何性质,不需要知道全部的空间。也就是说,在这样的一个小块里,便可发展全部的几何性质,这是黎曼几何革命性的观念,使几何局部化,这个和物理上的场论是完全符合的。
真正使黎曼几何受到重视的是爱因斯坦的广义相对论。大致说起来,爱因斯坦的广义相对论是要把物理几何化,也就是说把物理的性质变为几何的性质,因此黎曼几何就成为物理学家一定要念的一门数学。到了黎曼空间一样有曲率的概念,只是因为黎曼空间是高维的,所以它的曲率概念就变得相当复杂。在爱因斯坦的广义相对论中的基本公式里,大致说起来,物理的力是一个曲率;数学家讲曲率和物理学家讲力、位 (potential)、速度,是完全可以把它们连在一起的。
联络、矢量丛、规范场论
在黎曼几何中,Levi-Civita 平行性是一个重要的观念。Levi-Civita 以为在黎曼几何(广义相对论里的其中一种,称为劳伦兹几何)都有一个很基本的性质,那就是平行性;在这个时候,空间不再是只用一个坐标系表示的空间,而是需要很多不同的坐标系才能表现的“流形”(manifold),这样又把几何研究的空间推广了。所以我常有个比喻,如果我们把几何空间的推广和人类穿衣服的过程相对照,那么一开始的欧几里得几何,便好比人在原始社会中没有穿衣服,是裸体的;然后笛卡儿把坐标的概念加入了“赤裸”的空间,就好比人类开始穿衣服;而到了流形的阶段,就好比现代人,不只穿一件衣服,还要常常换。也许有些人不太能接受这样“奇装异服”式的换坐标,但是没有关系,爱因斯坦花了七年的时间,才终于接受坐标可以转换的概念,而能从狭义相对论进展到广义相对论。空间中有不同的坐标系,那么麻烦就来了,因为几何的性质是和坐标系的选取有关,不过不要紧,只要我们能控制坐标变换的性质,使在变换前即有的性质,经过变换之后仍为我们所控制,那么换坐标就没关系了,这是近代几何学比较困难的地方。
用以表示流形的坐标系是任意的,因此可能是非线性的坐标,这在处理上就变得比较困难;但是我们可以取线性的空间去逼近流形。换句话说,虽然流形本身是非线性的,但在流形上的一点,都有一个和普通空间一样的线性空间,即切空间。这些切空间之间原本是没有关系的,而 Levi-Civita 平行性就是要建立二点之间的切空间的关系;之后,微分几何学家发现,这个平行性是非常基本的性质。又因为拓仆学 (topology) 的发展,我们把这个观念推广了,不一定要谈切空间,任意一个空间都可以,于是就有矢量丛 (vector bundles) 和联络 (connections) 的观念。也就是说流形的切空间差不多是平的,但是矢量丛却可以是一个豎起来的空间,任何的矢量空间都可以,这是今天在几何上大家所公认的一个基本结构。从黎曼几何推广到有联络的矢量丛,这也就是物理上规范场论 (gauge field) 的数学基础。
亏格、结、圆周丛
黎曼几何把几何局部化,但我们不能永远只在一个小区域里头,所以局部化之后又要整体化,又要把它扩充到全空间。而在这个整体化的扩充当中,最要紧的就是拓仆学。只要我们不把一个图形扯破,那么就有些几何性质虽经过放大、缩小等很大的变换,也不会改变,例如亏格 (genus) 的性质。比方说我们在一个二次的曲面上挖两个洞(见图六),那么它的亏格就等于 2。亏格也可以等于 3、4……,或者像美国的甜甜圈只有一个洞,亏格就是 1。即亏格等于洞的个数,这个数目是把曲面放大缩小之后仍旧不变的,这是拓仆不变式的一个例子。
图六
图七
另外一个例子是有关于结 (knot)。如图七,这是一个三维空间中封闭的曲线,没有办法把它解开成一圆周,这就是所谓的结。不要把这想成几何学家没有事在玩的东西,在应用上,这有非常重要的意义。刚才说过,物理上的空间是四维的,如果再加上电磁场,就成了五维的空间。马克士威方程式中,底空间是一个四维的流形,在那上头的每一点都突出去一条一维的空间(矢量丛)。这一维的空间,在物理上必须是封闭的,所以是一个圆周,数学家称此为圆周丛 (circle bundles) 也就是说,底空间是四维,每一点又有一个圆周,所以整个空间就是五维的。但是这并不是一个任意的五维空间,它必须满足这样特别的一个几何结构。利用这个观念,马克士威方程就可写成下面这样简单的形式:
其中 F 是这个圆周丛的一个联络的曲率,这曲率是一个二次微分式,d 是代表此微分式的外微分,dF=0 就是说这个二次微分式是封闭的。
另外一个方程式是 δ,,即所谓余微分(codifferential)。在一般的电磁学书上,是用一组方程来表现马克士威方程。现在由于数学或几何的发展,不但把一组方程式简化,而且可由这化简的方程式去推得数学、几何、物理上的结论,并不一定要回来把方程式全展开才可获得相同的结论。所以这观念上的发展,的确使得科学进步。如果大家有兴趣,可试著去证明这组方程和平常我们所见的马克士威方程是一样的。
图八
规范场论的基本方程式
在物理上有一个 Bohn-Aharonov 实验,就是说:普通把马克士威方程写成那样的形式是不对的。因为它没有把所有的电磁现象都表示出来,应该利用圆周丛联络 A,dA=F 才是描写所有电磁现象的方程式,dF=0 只是 dA=F 的一种结果。Bohn-Aharonov 实验的装置(见图八),有一个内有磁场的圆筒,外面没有磁场,而在圆筒的外围接有线圈,那么圆筒内的磁场,便和通电之路径有关。杨振宁先生有一篇文章把这情形说得很清楚。
总之,就是应该把马克士威方程写成:
的形式(也就是杨-Mills 方程式),用以处理更复杂的实验,也才能真正代表所有电磁现象。除此之外,杨-Mills 方程式是一切场论的基础,是规范场论的基本方程式,它的重要性就如同马克士威方程在电磁场或爱因斯坦方程在引力场的重要性。不过在这个情形下,矢量丛就变成二维而不是一维了,那么作用在这个二维矢量丛上的群就不再是可交换,因此数学上的处理就变得很复杂了。
DNA 的基本公式
最后谈谈 James White 的公式,这在分子生物学,DNA 方面是一个基本公式。DNA 在几何上的结构是双螺线,是两条封闭的曲线互相绕著,所以很自然的,研究 DNA 几何结构的基础是很简单的微分几何的曲线理论,和刚刚谈的结有关,即打了一个结,结的数学性质就对应到 DNA 的生物反应。目前王倬教授正在南港从事这方面的实验。
DNA 分子虽是一个螺线,却不像我们所想像的,它的螺线是以最经济的方式互相缠绕,而产生了许多复杂而有意思的几何问题。之中有一个就是 White 的公式:Lk=Tk+W。两个封闭曲线套起来的话有一个套数 Lk,它会等于 twist 和 writhing-number 之和。套的数目可以很大很大,分子生物的现象,不仅是可以使它套起来,也可以使它解开,恢复原来的形状。总而言之,我不懂这些生物学,只是道听涂说。
大家觉得微分几何应该是很有用的,因为在物理学发展之中,电磁学对人类日常生活是最有影响的;而在遗传工程及其他方面,DNA 的结构也是生物科学对人类生活最有影响的一门学问。很巧,我刚好就是研究这两门学问的数学基础:微分几何。这让我联想到一个有名的理论物理学家,E. Wigner 所写的一篇文章:〈The unreasonable effectiveness of mathematics in science〉。为什么数学会有用?光玩玩亏格、结,竟也能找到有用的数学性质,提供了很好的应用,他觉得很不可思议。在这篇文章的开头,他举了一个更简单的例子:有两个中学同学,毕业后各奔前程,若干年后,两个人再度碰面,甲便问乙近几年在研究什么?乙说他在研究人口问题,甲便欣赏了一下乙的论文,发现论文裏头总有个 π。我们都知道 π 是圆周率,怎么可以和人口问题发生关系?这也是一个最粗浅的例子,告诉我们:基本的发现,有时候也不一定要求立刻的应用,可能结果有更大的应用。