1905年,爱因斯坦正式提出了狭义相对论;1908年,闵可夫斯基给出了狭义相对论的几何表述,也就是我们这里说的闵氏几何。爱因斯坦一开始对这套几何语言很反感,认为这些纯数学上的“花架子”没什么用,还增加了相对论的复杂度。但是,他很快就发现闵氏几何非常重要,发现这绝不是什么纯数学技巧,而是有着深刻物理内涵的洞见。而且,如果要建立广义相对论,少了它根本不行。
几何语言清晰直观,在处理许多问题时有很大的优势,这在双生子佯谬里体现得非常明显:使用代数语言,使用洛伦兹变换去处理双生子佯谬,其中难度之大思维之绕,绝对是对智商极大的考验;而使用几何语言,这个问题就简单得不像是个问题。然而,目前绝大部分介绍相对论的书籍文章还是使用的代数语言,所以你还是能经常看到许多人在一些非常简单的问题上纠缠不清,争论不休。
梁灿彬老师说他上世纪80年代从“言必称几何”的芝加哥大学回来以后,就一直在国内大力推广相对论的几何语言,但是不明白为啥过了三十多年大众对它还是很排斥。长尾科技就在这篇文章里跟大家好好聊一聊,希望能够解开大家跟闵氏几何之间的心结。
因为这是从零开始的一篇文章,所以我暂时就只谈相对论里最简单的几何语言,也就是狭义相对论里的闵氏几何。至于广义相对论里涉及的黎曼几何,我们后面再说。
01为什么很多人觉得几何语言难?
了解相对论的人大多知道一点闵氏几何,知道我们可以通过画时空图的方式来解决一些很复杂的问题,但是他会觉得闵氏几何很难:把时空图画出来很难,画出来之后去解释时空图更难。当看到别人对着时空图“轻而易举”地把问题解决了,他心里没底。他无法理解为什么你说时空图里的这个代表了相对论的里的那个,为什么你对时空图里的一些点、线、面做这样的处理就对应着相对论里的那个问题。所以,他觉得你在时空图里做的那些几何操作非常“虚”,他不理解这些几何背后的实质,自然会觉得很难。
然而,这不该是几何该给我们留下的印象啊。我们平常接触的几何,一个点、一条线、一个正方形、一个圆,这些都是我们日常生活里一些形状的完美投射,它们非常的实在,一点都不虚。很多在代数上不好理解的东西,我们把它画到几何图形上一下子就理解了。几何原本就应该比代数更加简单直观,但是为什么到了相对论这里,大家反而觉得几何语言更加难以接受了呢?原因就是狭义相对论里使用的几何并不是我们熟知的欧式几何,而是一种全新的闵氏几何,当我们把欧式几何里的一些习惯和常识代入进来的时候,自然会引起各种水土不服。
所以,这里我们先不谈闵氏几何和欧式几何的具体区别,我们先来看看狭义相对论是怎么和闵氏几何对上眼了的。为什么狭义相对论不用欧式几何来描述,而非得使用一个我们不熟悉的闵氏几何呢?这个问题不清楚,讲再多闵氏几何的性质也是白搭。
02两个基本假设
为什么狭义相对论要使用我们不熟悉的闵氏几何,原因当然还是得从自身来找。大家都知道狭义相对论有两条基本假设:相对性原理和光速不变。从这两个假设出发我们可以很自然的推导出狭义相对论里各种奇奇怪怪的结论,这里我们先来审查一下这两个假设。
相对性原理说物理定律在所有的惯性参考系里都是平等的,不存在一个特殊的惯性系。这一点很自然,伽利略很早就发现这点了,他意识到一个人在一个匀速移动(惯性系)的密闭船舱里根本无法区分这艘船到底是静止的还是以某个速度匀速运动。无法区分的意思就是这两个参考系(静止和匀速运动)是平等平权的,否则,你就应该有办法把它们区分开。
不同的是:伽利略只敢给力学定律打包票,他只敢说我们无法用力学实验区分两个惯性系,其他定律(比如电磁学实验)能不能区分惯性系他就不敢说了。爱因斯坦说你不敢打包票我来,我打赌所有的物理定律(力学的也好,电磁学或者其他的也好)都无法区分惯性系,你在船舱里做什么实验都也无法区分这艘船是静止的还是匀速运动的。
从这里我们可以感觉到,相对性原理好像并没有那么反常识,它只是把伽利略的那套相对性原理的适用范围给扩大了。那么,狭义相对论里那么多结论的“诡异”似乎就应该来自另外一个假设,也就是光速不变。
光速不变说真空中的光速在所有的惯性系里都是一样的。不论你在哪个惯性系(注意一定要是惯性系,非惯性系里光速就没人管它了)里测量光速,在静止的地面也好,飞速的火车飞船里测也好,测得的光速都是一个定值c。
这就太反常识了,怎么能够在不同的参考系里测量同一个物体的速度都相同呢?比如,在一辆速度为300km/h的高铁上,有一个人以5km/h的速度朝车头走去。那么,高铁上的人会觉得他的速度是5km/h,而地面的人会觉得他的速度是300+5=305km/h,这两个速度肯定是不一样的。但是,如果我把这个人换成一束光,让这束光射向车头,光速不变就是说不管你是在高铁上测量,还是在地面上测量,这束光的速度都是c。你以为在地面上测量的光速应该是c+300km/h么?对不起,并不是这样。
你觉得这个事诡异么?诡异!为什么会这样呢?不知道,光速不变是狭义相对论的一个基本假设,这个类似数学里的公理,我们只能假设它是对的,但是却无法证明它是对的,它的可靠性由实验保证。其实,这个事情很多人还是知道的,但是,大多数人并不知道如果我们再深挖一下光速不变原理的秘密,我们就能找到一条通向闵氏几何的隐秘通道。
03光速不变的秘密
光速不变说你在任何惯性系中测量光速,得到的结果都是c,我们来定量的分析一下这个原理。
假设我们在K系里测量一束光,假设这束光在Δt的时间内走了Δl的距离,那么显然就有Δl=Δt×c。如果我们把这束光在x,y,z三个坐标轴方向移动距离的分量记为Δx,Δy,Δz,那么根据勾股定理就有:Δl²=Δx²+Δy²+Δz²,再把这两个式子合起来就能得到:Δx²+Δy²+Δz²-(Δt×c)²=0。如果这时候我们用一个新的量Δs²表示左边的东西,那么就有Δs²=Δx²+Δy²+Δz²-(Δt×c)²=0。
好,事情发展到这里,一切都非常容易理解,上面的事情倒腾来倒腾去就是一束光在空间里走了一段距离,然后套用了小学生都知道的距离等于速度乘以时间而已。而且,大家也会发现这个事跟光速不变也没有什么关系,你就是把上面的光换成一颗子弹,把光速c换成子弹的速度,那么上面的一切推理都还是那样的。没错,因为光速不变说的是光速在不同的惯性系里都一样,那么我们还得再考察一个惯性系。
还是上面那束光,我们这次在另一个参考系K’里对它进行测量。假设我们测量的结果是它在Δt’的时间内走了Δl’,我们同样对这个距离做一个分解,假设它在x,y,z三个坐标轴方向移动距离的分量记为Δx’,Δy’,Δz’。根据光速不变原理,光在这个参考系里的速度还是c,那么,按照上面的逻辑,我们依然可以得到Δs’²=Δx’²+Δy’²+Δz’²-(Δt’×c)²=0。
当我们把K和K’这两个参考系了的结果拿来对比的时候,光速不变原理带来的反常效应就出现了:大家有没有发现Δs和Δs’的表达式的形式完全一致,而且值还相等(都等于0)?
我们只是把K系里测量的时间和距离全都换成了K’系里测量的时间和距离,其它的东西我们一概没动。而在牛顿力学里,Δs和Δs’的表达式形式是不一样的,因为牛顿力学里另一个惯性系的测量速度会加上两个参考系之间的相对速度。也就是说在牛顿体系里,在K’系里测量的光速应该是c加上两个参考系的相对速度,这样Δs’的形式就Δs跟不完全一样了,而相对论是用光速不变强制保证了它们的形式一致。
这一点大家好好想一想,它并不难理解,但是却是后面的关键。我们现在等于说是定义了一个Δs,对于光来说,这个Δs的值在不同的参考系里是相等的,刚好都是0。
那么,重点来了:如果我把这个Δs从光推广到所有物体,我仍然从两个不同的惯性系K和K’去测量这个物体在空间上运动的距离Δx、Δy、Δz和时间上经过的间隔Δt,然后一样把它们组合成Δs和Δs’。那么,这个物体的Δs和Δs’之间有没有什么关系呢?它们是不是还跟光的Δs和Δs’一样相等并且都等于0呢?
是否等于0很好回答,一看就知道肯定不等于0。假设博尔特1秒钟跑10米,那么Δt=1、Δx=10,不考虑另外两个维度(Δy=Δz=0),看看Δs²的表达式:Δs²=Δx²+Δy²+Δz²-(Δt×c)²=100+0+0-(1×3×10^8)²,这显然是个非常大的负数。那么问题的关键就落在在惯性系K和K’里测量的这两个值Δs和Δs’是否相等,也就是说,如果博尔特在跑步,我们从地面和火车上测量得到的 Δs和Δs’是否相等?
这个答案我直接告诉大家:一样!
这个证明过程其实也非常简单,这不就是同一个事件看它在不同的惯性系里是否满足某个式子么?同一个事件在不同惯性系下变换关系,在相对论里这不就是洛伦兹变换的内容么?所以,你直接用洛伦兹变换去套一下Δs和Δs’,你很简单就能发现它们是相等的,这里我就不做具体计算了,当作课后习题。
所以,我们通过分析就得到了这样一个结论:在相对论里,不同惯性系里测量一个物体的位移、时间等信息可能不一样,但是它们组合起来的Δs²=Δx²+Δy²+Δz²-(Δt×c)²确是相等的,而这个值对光来说还刚好就是0。
注意了,这个结论极其重要,正是它决定了为什么我们要使用闵氏几何来描述狭义相对论,甚至,从某种角度来说,它几乎包含了闵氏几何里的全部奥秘。为了让大家更好地了解这个结论背后的意义,我们先去看一看欧式几何里的类似情况。
公众号:长尾科技