闵氏几何专题(2):几何是由什么决定的?欧式几何和闵氏几何有什么区别?

04欧式几何不变量

在欧式几何里也有一些量是不随坐标系的变化而变化的,比如最简单的线段的长度


在二维的欧式几何里,我们假设在一个直角坐标系里有两点A(x1,y1)、B(x2,y2),令Δx=x2-x1,Δy=y2-y1,那么,利用勾股定理就能非常容易的算出AB之间的距离Δl²=Δx²+Δy²。这时候我们如果在建一个新的直角坐标系,在这个新的坐标系里原来A、B两点的坐标变成了A(x1’,y1’)、B(x2’,y2’),同样令Δx’=x2’-x1’,Δy’=y2’-y1’,AB之间新的距离Δl’²=Δx’²+Δy’²。这时候我们可以很轻松的验证Δl=Δl’,也就是说Δx²+Δy²=Δx’²+Δy’²

闵氏几何专题(2):几何是由什么决定的?欧式几何和闵氏几何有什么区别?_第1张图片

这个结论一点都不奇怪,我们都可以很直观的感觉到,为什么呢?因为欧式几何就是我们日常熟悉的空间啊,我们现在就假设有一跟2米长的尺子AB,我在一个直角坐标系里计算它的长度的平方Δl²=Δx²+Δy²=2²=4,难不成我在另一个坐标系里算得它的长度的平方Δl’²=Δx’²+Δy’²还能不等于4么?我这把尺子的长度是一定的,如果我在不同坐标系下得到尺子的长度却不一样了,那还了得,那这几何就有问题了。


因此,在欧式几何里,Δl²=Δx²+Δy²也是一个坐标系不变量,这个值不随你取坐标系的变化而变化。很显然的,如果把欧式空间从二维推广到三维,那么这个不变量自然就可以写成Δl²=Δx²+Δy²+Δz²;推广到四维,我们用t表示第四个维度,那么Δl²=Δx²+Δy²+Δz²+Δt²,再往上推广几维,我就加几个分量就行了。


大家肯定注意到了:在欧式几何里,不随坐标系变化的是Δl²=Δx²+Δy²+Δz²+Δt²,而我们上面在讲狭义相对论的时候,不随惯性系变化的量Δs²=Δx²+Δy²+Δz²-(Δt×c)²。这两者非常的相似,这个光速c是个常数,可以不用考虑,为了方便计算我们甚至可以直接约定c=1,这样的话Δl²Δs²的差别就仅仅只差一个Δt前面的负号而已。


那么,这种形式上的相似和那个负号的差别到底意味着什么呢?毕竟它们一个代表的是不随惯性系的变化而变化的量(Δs²),一个代表的是欧式几何里不随坐标系的变化而变化的量(Δl²),一个是物理量,一个是几何量,好像并没有直接的关系。但是,我们这样想想:如果我想用一种几何来描述狭义相对论里Δs²=Δx²+Δy²+Δz²-(Δt×c)²不随惯性系的变化而变化的这种性质,我们肯定就不能选欧式几何了(因为欧式几何里不随坐标系变化的量是Δl²=Δx²+Δy²+Δz²+Δt²)。所以我们需要一种新的几何,在这种新几何里,不随坐标系变换而变化的量是类似Δs²这样带有一个负号的量,这种全新的几何自然就是闵氏几何


你这时候心里可能有点疑惑:我们真的可以只凭借不随参考系变化的量是Δs²和Δl²,就断定这是两种不同的几何么?Δs²和Δl²这些东西到底意味着什么?或者说,到底是什么决定了一种几何?


05线元决定几何

我们从小就在学习欧式几何,我们学习直线、三角形、圆等很多几何图形,我们关心它们的各种性质,比如两点的距离、曲线的长度、两条线的夹角、一个图形的面积。但是,大家有没有想过:在欧式几何的各种各样的性质里,有没有哪个是最基本的?也就是说,我们能不能只定义这个最基本的量,其他的各种量都可以从这个量里衍生出来?这样的话,我们就只需要抓住这一个最基本量的性质,就可以抓住这种几何的性质了。


答案是:有,这个最基本的量就是弧长,准确地说是组成任意曲线、弧线的基本元段长


要把这个说清楚,我们这里得稍微引入一丢丢微积分的思想,别慌,这个很容易理解的~在欧式几何里,我们很容易求一根线段的长度(直角坐标系里利用勾股定理就行了),但是,如果要你求一条任意曲线的长度呢?

闵氏几何专题(2):几何是由什么决定的?欧式几何和闵氏几何有什么区别?_第2张图片

比如上图的曲线AB,这是随手画的很一般的一条曲线,不是什么特殊的圆弧,你要怎么求它的长度呢?数学家们是这么考虑的:我在曲线AB之间取一些点,比如P1、P2、P3,然后这三个点就把这段圆弧的分成了四个部分。我们用线段把这几个点连起来,这样我们就得到了一条折线,这时候我们就用折线的长度(也就是这四条线段的和AP1+P1P2+P2P3+P3B)来近似代替曲线AB的长度。当然,你肯定会说,曲线的长度明显比这四条线段加起来更长啊,你怎么能用折线的长度来代替曲线呢?


是的,如果你只在AB之间取三个点,那么曲线AB的长度肯定要比折线的长度多很多,这样近似的误差很大。但是,如果我再多取一些点呢?我在AB之间取十个、一百个甚至一千一万个点,那么,这成千上万条线段组成的折线的总长度跟曲线AB比呢?当然,还是会短一些,但是,你可以想象,这时候这些折线已经跟曲线AB非常接近了。如果一根1米长的曲线被你分成了1万条线段,这时候你用肉眼根本分辨不出来这是原来的曲线还是折线。但是你内心还是知道折线要短一些,那么接下来就是重点了:如果我在曲线AB之间放无穷多个点呢


无穷是一个很迷人,同时也很迷惑人的词汇。从上面的分析我们知道:当我们在曲线AB里放越多的点,这些小线段连起来的折线就越接近曲线AB本身。那么,当我们放了无穷多个点的时候,这无穷多个线段组成的折线是不是就应该等于曲线AB的长度了?答案是肯定的,而这,就是微积分最朴素也是最核心的思想。


闵氏几何专题(2):几何是由什么决定的?欧式几何和闵氏几何有什么区别?_第3张图片

在这种思想的指导下,我们要求任意曲线的距离,最终还是要求小线段的距离,因为无穷多个小线段累加起来的长度就是曲线的长度。因此,我们只要知道如何求无穷小的线段的长度,我们就能用微积分的思想求出任意曲线的长度,我们把这个最基本小线段称为曲线的一个元段长,记做dl

闵氏几何专题(2):几何是由什么决定的?欧式几何和闵氏几何有什么区别?_第4张图片

在欧式几何里,我们把基本元段dl在坐标系里分解一下,用dx和dy表示dl在x轴和y轴上的分量,那么根据勾股定理就有dl²=dx²+dy²,我们就把dl²称之为线元


提炼出了线元这个概念以后,我们就可以开始反推了。在任何一种几何里,如果我们确定了线元,就等于知道了元段dl的长度,然后就可以利用上面微积分的思想求任意一段曲线的长度。那么,接下来,我们会发现几何里的其他性质都可以按照这些定义。比如,我们就可以把两点之间的距离定义为这两点之间所有可能的曲线里最短的一条,把两条直线的夹角定义为弧长和半径的比值(想象在一个圆里,半径固定,弧长越大角度越大),其他什么面积、体积之类的几何性质就都可以根据这些基本性质来定义。


最后,你会发现只要给定了一个线元,我们就能把它所有的几何性质都确定下来,也就是说:线元决定几何


那么,什么是欧式几何呢?欧式几何就是由欧式线元(dl²=dx²+dy²)决定的几何。非欧几何呢?只要你的线元不是欧式线元,那么这个线元决定的几何就是非欧几何。用这种新线元,我们一样可以定义出在这种新几何里的曲线长度、两点的距离、线的夹角等等几何性质。


闵氏几何专题(2):几何是由什么决定的?欧式几何和闵氏几何有什么区别?_第5张图片

那么,闵氏几何是什么?闵氏几何的线元又是什么呢?


答:很显然,闵氏几何就是由闵氏线元决定的几何。闵氏线元是这样的ds²=-dt²+dx²+dy²+dz²,如果只考虑二维闵氏几何的话,那么ds²=-dt²+dx²。

 

闵氏线元(ds²=-dt²+dx²)跟欧式线元(dl²=dx²+dy²)十分相像,它们之间唯一的差别就在于闵氏线元的第一个分量dt²的前面是负号,而欧式线元全部都是正号。也因为如此,闵氏几何欧式几何也非常像,所以闵氏几何还有一个称呼,叫伪欧几何。但是,我们也要特别注意这个负号,正是这个负号,决定了闵氏几何和我们熟悉的欧式几何里所有不一样的地方,而这些不一样,恰恰是我们通过闵氏几何来理解狭义相对论的关键。


06闵氏几何与狭义相对论

我们现在知道了,所谓的闵氏几何,不过是由闵氏线元ds²=-dt²+dx²+dy²+dz²决定的几何。在这种几何里面,曲线的长度、两点的距离、线的夹角等一切性质都有这个第一项带了一个负号的闵氏线元决定


看看这个闵氏线元ds²=-dt²+dx²+dy²+dz²,再看看我们最开始提到的那个在狭义相对论里不随惯性系的变化而变化的量Δs²=Δx²+Δy²+Δz²-(Δt×c)²,是不是非常像?在相对论里有两种单位制:国际单位制几何单位制。国际单位制就是我们平常熟悉的那一套单位制,几何单位制就是选择光速c=1,这样可以大大简化在用几何处理相对论问题的难度。采用几何单位制的话,不随惯性系变化的Δs²=Δx²+Δy²+Δz²-Δt²,这就真的跟闵氏线元ds²=-dt²+dx²+dy²+dz²一模一样了。


这就是为什么我们要用闵氏几何,而不是欧式几何来描述狭义相对论的根本原因


在牛顿的世界里,时间是绝对的,三维的空间也是绝对的,一根木棒在三维空间里随便怎么变换,随便怎么变换参考系,它在三维空间里的长度是一定的,这个是跟三维的欧式线元对应的(因为三维的欧式线元dt²+dx²+dy²也不随坐标系的变化而变化)。

 

但是,在狭义相对论里,空间不再是绝对的,不再是一成不变的,我们熟悉的尺缩效应不就是说从不同的惯性系里观测同一把尺子,这个尺子的长度是不一样的么?这就是说空间上的“长度”在狭义相对论的不同惯性系里不再是不变量。但是,我们发现如果把时间也考虑进来,把三维空间和一维时间一起组合成四维时空,那么这个四维时空里的间隔Δs²=Δx²+Δy²+Δz²-Δt²就是不随惯性系的变化而变化的量(这个在前面说过,用洛伦兹变换可以非常方便的证明)。

 

闵氏几何专题(2):几何是由什么决定的?欧式几何和闵氏几何有什么区别?_第6张图片

所以,在牛顿的世界里,三维空间是绝对的,他必须保证同一把尺子在不同的三维空间的坐标系里长度是一样的,也就是说在度量三维空间里长度的方式(这个有个更专业的概念叫度规,这里我们知道就行)必须跟坐标系无关,而欧式几何正好有这样的特性,所以牛顿力学的背景是欧式几何


而在狭义相对论里,三维空间并不是绝对的,三维空间里一把尺子的长度在不同惯性系里是不一样的。但是,三维空间和一维时间组成的四维时空是绝对的。四维时空里如果也有这样一把“尺子”,那么这把“尺子”无论从哪个惯性系来看,它的四维“长度”都是一样的。而狭义相对论的这种四维“长度”,或者说我们在四维时空里度量长度的方式,它跟闵氏线元表达式的形式是一样的。也就是说只有在闵氏几何里,狭义相对论的时空间隔才对应于他们几何里的“长度”的概念,所以我们要使用闵氏几何来描述狭义相对论。


理解这一段非常的重要,因为只有理解了这个,你才能从根本上把闵氏几何和狭义相对论对应起来。有很多闵氏几何的科普文章里上来就是直接给你画时空图,然后告诉你闵氏几何里的这种图形这个几何性质对应着狭义相对论里的这种概念,这样很多人就感觉难以接受,然后对几何语言产生抵触的心理。


好,既然我们打算用闵氏几何来描述狭义相对论,那么肯定就要把狭义相对论里的物理语言翻译成闵氏几何里的几何语言。几何肯定是离不开画图的,在欧式几何里我们经常会画出一个几何图形在空间上的样子,这是空间图。而狭义相对论把时间和空间看作一个整体, 它要求我们以同等的地位来看待时间和空间,所以我们需要画出一个事件同时在时间和空间里的样子,这种图就叫时空图

公众号:长尾科技

你可能感兴趣的:(闵氏几何专题(2):几何是由什么决定的?欧式几何和闵氏几何有什么区别?)