爱因斯坦的狭义相对论

1905年对爱因斯坦,对物理学,以及从人类对自然的认知来说,都是奇迹的一年。因为这一年爱因斯坦发表了五篇重要的文章,其中的狭义相对论,现已是家喻户晓。而另一篇有关光电效应的文章,说明了光的粒子性和光能量的量子性,是量子力学的重要里程碑,让他于1921年获得了诺贝尔奖。

1927年,爱因斯坦又发表了广义相对论。广义相对论要比狭义相对论复杂得多,它考虑的是引力的本质。按照牛顿第二定律,我们知道,有力就有加速度。而狭义相对论不考虑加速度。另外,广义相对论的数学非常高深,而狭义相对论的数学只要中学水平就够了。狭义相对论难的不在数学,而在物理观念,尤其是它预示着一些“令人不解”的现象,比如:一对双胞胎,一个坐上接近光速飞行的飞行器,回来发现自己还年轻,而他的同胞兄弟却已老态龙钟。再比如,在一个人看起来同时发生的两个事件,对另一个快速飞行的人来说却有先有后,这让我们知道,不同地点不同事件发生的同时性,是相对的,从另一个角度(也叫不同的参照系)看,它们并不是同时发生的,“同时性”失去了绝对的意义。比如我们有时会觉得“同年同日同时生”,好像预示某种奇特的机缘,其实没什么,因为这个同时性根本不是绝对的。

狭义相对论有这么多奇妙的事情要说,我们这里就不谈广义相对论了。如果没有特殊说明,我们这里提到相对论指的就是狭义相对论。

相对论的难理解,也说明了它的重要性。因为它改变了人们之前基于牛顿力学的时空观。如果它好理解,说明与人们的观念没有大的区别,因此也就没那么重要了。时至今日,因为大多数人并不懂得相对论,所以头脑里仍然是牛顿的时空观,所以爱因斯坦依然难懂。牛顿时空观指的是:空间和时间是互相独立的:空间是空间,时间是时间;而且空间和时间也都是“绝对”的,即他们客观存在,独立于观测者。这也意味着,不论你以什么速度运行,空间长度和时间长度都应该是不变的。但是,相对论的主要结论是,时间和空间在(做相对匀速运动的)不同参照系下会有不同,因此不是绝对的,而且时间与空间还有关联性。这些说法,读者可能还不太明白,因为我们还没有说明什么是参照系,即使知道了参照系,时间和空间相互关联这件事与人们日常的感觉也不合。时间和空间有什么关系呢?再加上前面提到的双胞胎在不同速度下不同的老化程度和同时性的非绝对性,相对论就相当神秘费解,说明爱因斯坦时空观确实与牛顿时空观不同,它让我们对时空有了新的理解,因此具有革命性。

那么,我们怎么知道爱因斯坦的相对论是对的呢?如果是对的,是什么原因造成这种时空观之不同的呢?

我们下面就来回答这些问题,这其中的关键是对光速的理解。人们知道光速很快,在十九世纪末测量到了它的速度,是大约每秒三十万公里。但在牛顿力学里,光速和其它运动物体的运动速度没什么相关性,也没有什么特殊性。而在爱因斯坦的理论里,光速却有着至关重要的作用:光速在真空中的速度是个常数,是宇宙万物运动的极限,没有其它运动速度可以超过这个。

光速是极限速度这倒不难理解,因为光没有质量,最轻,其它有重量有质量的东西负重前行总不会比光跑得还快吧!

但光速是个“常数”这句话意味深长,我们需要理解这到底指的是什么。物理学是门严谨的科学,任何说法都要定义清楚,深究起来都隐藏着重要的东西。要理解光速是常数这句话,我们需要先了解什么叫参照系。

参照物,又称参考体,指的是研究一个物体运动时所选定的参照物体。参照系指的是与这个参考体相固连的整个延伸空间。为了用数值表达一个物体的位置,可在参照系上设置坐标系,称为参考坐标系。参考系和参考坐标系都可以任意选择,但有些选择没什么实质区别,有的区别却很大。比如选择上海还是沈阳为坐标原点,虽然上海和沈阳相距甚远,只是让物体位置的标识不同,但物体位置的变化,包括速度都是相同的。但是选择上海火车站为坐标原点以及与它相固连的整个延伸空间为坐标系,和以驶过上海火车站的一辆列车上的某点为坐标原点以及列车为坐标系,虽然这时列车就在上海站,就非常不同。列车上的人相对于上海火车站那个坐标系是运动的,相对于列车上的坐标系却是静止的。

同一个运动在不同参考系中的表现有所不同。通常我们会按照问题的实际情况选取适当的参考体。火车站里面两人谈问题,以火车站坐标最方便。火车上两个人谈问题,以火车上的坐标最方便。从物理学和工程角度看,当火箭从地球表面起飞时,宜用地球做参考体;但当航天器成为绕太阳运动的人造行星时,宜用太阳做参考体。

参照系分为惯性和非惯性。狭义相对论考虑的是惯性参照系。惯性参照系(inertial frame of reference)是牛顿运动定律在其中有效的参考系,我们可以简单理解为加速度为零,也称为惯性坐标系,或惯性系。如果某参照系S为惯性系,则任何对于S作匀速速直线运动的参考系S’也都是惯性系;而对于S作加速运动的参照系则是非惯性参考系(非惯性系)。对于一般工程技术中的动力学问题,与地球相固结的坐标系是一个很好的近似的惯性系。但在研究大气或海洋的大范围运动或航天器空间的运行时,必须考虑地球缓慢自转产生的影响,这时地心坐标系(坐标原点在地心)就是一个更精确的惯性系。如果研究空间探测器的星际飞行,应使用日心坐标系作为惯性系。

在惯性系中,不受外力的一切物体总保持与参考系的匀速直线运动状态或相对静止状态。不同惯性系中所指惯性可能不同。例如某惯性系中物体由于惯性保持相对静止状态,从另一个惯性系观察,这个物体在作匀速直线运动。

讨论相对论时最常提到的就是比较地球上一个人周围地面延伸的静止的(参照)坐标系,和一辆以匀速运动经过此人的车辆里的坐标系。很显然,车厢内坐标系里静止的物体,对于地面上这个坐标系来说是在做匀速运动的。狭义相对论不考虑加速的坐标系,即不考虑非惯性系。

了解了参照坐标系,就可以说说光速是常数指的是什么了。

我们先看看大家熟悉的情况,我们来比较一个人在车上扔一个球,和另一个人在地上扔一个球,有什么区别和关联性。假设相对于每个人自己来说,他们扔出的球的速度是一样的,但是车下的人看车上人扔的球的速度会不一样。如果车迎面而来,车上的人向你扔来一个球,你测得的球速度是他在车上扔球的速度加上车速。你会觉得球很快,打在身上会很痛。如果车离你而去,车上的人向你扔过来一个球,你测得的球速度是他在车上扔球的速度减去车速,你会觉得球没那么快,打在身上也没那么痛。所以,速度是可叠加的。

但如果这球是光球,就完全不一样。我们前面说过,光速是每秒三十万公里,是个常数。这个常数速度是什意思?是车上的人测到的,还是地上的人测到的呢?我们还是从两个坐标系来看。比如说,地面上有两个人,其中一个人发射一道光,另外一个人测得光速是每秒三十万公里。在运动的车辆上也有两个人,其中一个人发射一道光,另外一个人测得光速是每秒三十万公里。现在,我们要看看,地面上的人测得运动车辆上发来的光速度是多少呢?

按照牛顿力学,地面上的人测得向他驶来的车上发出的光速,应该是每秒三十万公里加上车速,测得离他而去的车上发出的光速应该是每秒三十万公里减掉车速。如果那样的话,光速是常数就不对了,因为它依赖车速。也许我们只能说,光速是常数指的是静止光源发出的光的速度,运动光源发出的光的速度也依赖光源的速度。但这是牛顿力学的观念,不是爱因斯坦力学里“光速是常数”的本意,也不是实验所发现的现象。实际上,一辆车上发出一束光,不论车向你驶来还是离你而去,也不论车开得多快,地面上的你测得的光速还是每秒三十万公里,没有车速包含在里面。就算车本身的速度非常快,比如是一半的光速,或者是整个光速。没关系,你测得的光速都是每秒三十万公里。

光球和铁球就是这样不同,为什么呢?这好诡异啊!原因呢,其实就是因为铁球太慢,它越快,越接近光速,就越来越像光球一样怪异。

就是这个怪异的光速不变性,造成爱因斯坦和牛顿时空观的不同。因为这个光速不变,是常数,就是说真空中不论是静止光源还是运动光源发出的光,不论那个运动的光源是面向你还是离开你,光的速度都是每秒三十万公里,这件怪事,造成了相对论怪异的结论。也因此,说相对论对不对,首先要看光速不变是个常数这个事对不对。在十九世纪到二十世纪交界的那些年,人们做了大量的测量发现,这个光速,真就是个常数。

你可能会说,可能还是因为测量手段不够精确吧?也许,但是人们已经做了无数实验,还是测不出区别,今天依然。

更重要的,光速是不是常数,会导致不同的物理现象。而目前所有的相关的物理结论都基于光速不变,都完美地指导着物理研究和各种工程实践。而基于光速可变的理论都被验证是错误的,这一点我们后面再说。

但是,历史上还有一件事说明这个光速真是个常数,是不变的。这来自于著名的麦克斯韦方程组。

麦克斯韦方程组(Maxwell's equations),是英国物理学家詹姆斯·克拉克·麦克斯韦在十九世纪建立的一组描述电场、磁场与电荷密度、电流密度之间关系的偏微分方程。它由四个方程组成:描述电荷如何产生电场的高斯定律、论述磁单极子不存在的高斯磁定律、描述电流和时变电场怎样产生磁场的麦克斯韦-安培定律、描述时变磁场如何产生电场的法拉第感应定律。

很多物理学家认为麦克斯韦方程是最优美的物理定律,因为电和磁表现出完美的对称性。这个理论说明电生磁,磁生电,这样一环套一环就产生了电磁波。这个电磁波在真空中的传播速度,从麦克斯韦方程组可以推出恰好就是一个常数的光速。

麦克斯韦方程里出现了一个常数C,其值等于真空里的光速。这给人新的启示,即可见光也是电磁波的一种,让人们想到还有看不见的电磁波,于是电力和通讯时代来临。但是,公式里出现一个常数,而且是光的速度,这得好好想一想。因为这说明光速有特殊性。

公式里有个常数的光速跟一个叫做伽俐略的“相对论”的想法有矛盾。伽俐略这个想法,也是爱因斯坦相对论的第一个假设,就是一切运动规律在惯性(匀速)参照系中是不变的。你在地上,和在一个匀速运动中的系统中,比如在一辆匀速行驶的船上做物理实验得出的结论是一样的,这里的实验可以就是日常活动。比如你在家里打乒乓球和在游船上都一样,否则每到一个新的参照系就得学新本领,掌握新力度,新窍门,那可会把人累死。具体来说,在地上和在船上看自己乒乓球的速度是一致的。

但是从一个参照系看另一个参照系就不同了。虽然车上的人的活动在他看来与在地上做没什么区别,但对地上你来说,就不一样,你如果去测量,球的速度与车速有关。这个逻辑如果用到麦克斯韦方程组上就出现了问题,如果在车上的人做电磁学实验,服从麦克斯韦方程组,那么车下的人就得把那个常数C加上车的速度。但麦克斯韦方程组不允许有这样的变化。按照牛顿力学,任何速度都依赖运动速度,为什么光速这么奇特,以常数的形式高傲地出现呢?

为解决这一矛盾,物理学家提出了“以太假说”,即放弃伽俐略相对性原理,认为麦克斯韦方程组只对一个绝对参考系成立,这个绝对参照系称之为以太。根据这一假说,由麦克斯韦方程组计算得到的真空光速是相对于绝对参考系(以太)的速度;在相对于“以太”运动的参考系中,光速具有不同的数值。于是人们开始设计实验来测量这个光速的变化,但一直测量不到。最著名的是迈克耳孙-莫雷实验,这个实验表明光速与参考系的运动无关。

以太参照系的提出是基于人们当时对波传播的理解。水波需要水,声波需要空气,似乎波的传播都需要介质,那么光和电磁波也应该借助于什么,人们把这个假想的介质称为以太。但是光速测量的结果使得人们对以太特性的要求很高,一方面它要能传播电磁波,需要很好的敏感度,另一方面,我们测量不到它,这要求它几乎不存在。哪里有这样的东西呢?

渐渐地人们觉得光速的测量结果否定了以太假说,表明还得坚守伽俐略相对性原理的正确性,只是需要作出一些变换使得光速在参照系之间测量的结果不变。这个变换来自物理学家洛伦兹,是数学变换。在洛伦兹变换下,麦克斯韦方程组具有相对性原理所要求的协变性。洛伦兹的这个假说解决了上述矛盾,但他不能对变换的物理本质做出合理的解释。随后数学家庞加莱猜测洛伦兹变换和时空性质有关。但只有爱因斯坦,才清楚的解决了这个问题,并清楚的说明时空的相对论本质。

我们现在来看看爱因斯坦是怎么想出相对论的。其实与所有新理论的提出一样,都是因为旧的理论遇到新问题了。有些说法,曾经能把事情说得清,但一旦有了新的现象出现,说不清了,就得改。改需要一套理论,经得起推敲,要通过逻辑和数学推导,还要有预测能力。预测的结果与观测的结果对得上,而旧有的理论不能预测或对不上,就说明新的理论超过了旧的。牛顿力学在形成之后近三百年里几乎没有遇到问题,人们用起来得心应手,解决了各种问题,但到了二十世纪初,出现了牛顿力学没有答案的问题,于是人们就想法解决。

这与牛顿之前的情况也一致。两千四百年前,亚里士多德认为,物体能均匀运行,是因为有外力如人力推着。这个解释与人们所见一致,就成了正统的理论,直到大约四百年前伽俐略认识到,没有外力作用的物体才能均匀运行;日常生活中物体运行需要外力推是因为受到了摩擦力的阻碍,外力是来抵消摩擦力的;如果没有摩擦力,运动的物体就会一直走下去,并不需要外力。亚里士多德错误的解释,竟然延续了接近两千年。

牛顿把伽俐略的发现接受过来作为起始点,就成了牛顿第一定律。他接着研究,外力的作用是什么呢?他发现,外力在没有互相抵消的情况下,会让物体做加速运动,而且随物体的质量有关,同样的外力物体的质量越大加速越慢,这就是牛顿第二定律。再加上牛顿第三定律,牛顿力学就构成了。人们用牛顿力学,也包括据说他被苹果砸了想出来的万有引力定律(其实也是牛顿第二定律的一种特殊形式),能对大到天体,小到尘埃的物体运动做分析,得出合适的解答。

人们对世界的认识就是这样一步步地向前推进。爱因斯坦提出相对论的时候,也出现了一些让牛顿力学及当时的科学界不能解答的问题。当然,不是所有这些问题都与狭义相对论有关。比如一些问题造就了量子力学。但有几个问题,是狭义相对论解决的。当时也有不少方案,但只有在爱因斯坦的狭义相对论到来之后,这些问题才被完美的解答了。不仅如此,相对论还让我们对时空有了新的认识。

这些问题的第一个就是前面讲过的伽利略变换与电磁学理论不自洽,就是当时完善起来的描述电磁学的麦克斯韦方程里出现了一个常数C,其值等于真空里的光速。

其次,就是光速的不变性。

这些都是与牛顿力学相矛盾的,因此人们不敢改变,只能用数学修补。但爱因斯坦秉持物理学实事求是的原则,让狭义相对论基于两个实验证明了的假设之上:第一,相对论原理,即物理体系状态变化的定律,同描述这些状态变化时所参照的互相匀速移动着的坐标系中究竟是在哪个之中并无关系。第二,光是以确定的速度 C运动着的,不管这道光是由静止的还是运动的物体发射出来的。也就是说,地上的人看到运动的车上来的光速与车上的人自己看那光速等同。

这第二个光速不变的假设很“怪异”,相对论所导出的各种“怪异的”结论,都是从这个怪异的光速假设来的。我们前面说,如果车迎面而来,车上的人向你扔过一个球,你测得的球速度是他在车上扔球的速度加上车速。你会觉得很快,打在身上会很痛。但如果这球是光球,就完全不一样,不论车开得多快,你测得的光速还是每秒三十万公里。就算车本身的速度非常快,比如一半的光速,或者整个光速,或者车离你而去,没关系,你测得的光速都是每秒三十万公里。

你可能觉得这不可接受,为什么光球与别的球就不一样呢?不是,别的球也有这样的效果,你以为不是,只是因为球的速度和车速太低,你感觉不到这种光速不变的效应。比如,假如车的速度是光速,车上的人向你扔个铁球,你测量到的铁球的速度是多少呢?是不是应该是车的速度即光速,加上铁球的速度呢?不是,那不是说,有质量的铁球的速度,超过了没有质量的光速了吗?没有什么速度会超过光速。再比如,如果一个人坐在一束光上向你飞来,然后他打开一个手电,你去测他手电光的速度,会是两倍的光速吗?也不是,还是光速,也就是说,你和那个人,虽然与自身参照系相对应的速度是光速,但测量彼此的光速也还是光速。光速就是这么“怪异”,它的速度就是不变。不仅怪异,还不准其它速度超过它。但是从逻辑上看,这又是唯一正确的答案,因为如果光不是常数,可以叠加,其它有质量物体的速度也就可以叠加,从而可以超过光速,这就不合理了。

虽然逻辑自洽,但这个假设对我们熟悉了低速的人很怪异,所以相对论的结果也因此怪异,因为这些怪异的结果都源于要确保光速不变的这个假设(也是事实)。因为速度是距离除以时间,而要保证速度不变,怪异的事就得出现在距离和时间上。首先,你在静止的地面上看匀速运动参照系中的尺子,它会比车上人看到的短。你看匀速运动参照系中的钟表,它走的会比车上人看到的慢。也就是说,如果你看到车上的钟过了一小时,你自己的时间已经走了超过一小时,所以你老得快。而匀速运动参照系里同时发生的事件,在你看来一个在前,一个在后,不再同时。

这些怪事,都需要参照系相对速度很大,和光速可比才有效果。如果是日常速度,根本看不到感觉不到,因此我们并不会看到这些怪异的事。

因此,以一般速度运动的一般人来看,牛顿和爱因斯坦都是“对”的。

但是如果相互运动的速度可以与光速相比,这些“奇怪的”事就能显现出来了。而那时的怪异,并不能说爱因斯坦是错的,而是因为我们没有人体验过这样的高速度。那个时候,我们就不能用自己的感觉来评论对不对了。

在这种快速运动的参照系下,我们怎么才能感知相对论是否是对的呢?因为日常生活中没有这么快的速度,似乎难以验证。但有一个“日常”的领域,一直在我们的身边,可以在那里“验证”相对论。这个领域,不是我们熟悉的“日常”,而是“日常”生活中物质的微观世界。在这个微观世界里,相对论的作用是无处不在,无时不在,非常重要。这倒不是因为粒子的速度快,虽然粒子速度可以被加速到很快,而是因为相对论对于时空关系的描述,导出一个著名的公式,这个公式把物体的能量和动量,质量,光速结合在一起。当物体静止的时候,这个公式就是我们现在经常看到的爱因斯坦在黑板上写的能量等于质量乘上光速的平方(E=M*C^2)。注意,牛顿力学根本不知道有这样一个关系。

一般讲相对论的时候不讲量子力学,可是我这里要讲,是要说明相对论的正确。我们都知道量子力学是研究微观领域的物理,而量子力学研究的主要是粒子能量的变化,所以相对论的这个有关能量的公式在量子力学里就非常重要。最先把相对论引进到量子力学的是狄拉克,他的狄拉克方程是量子力学里最为重要的薛定谔方程的相对论推广。它预示了正电子的存在,实验也已经证明了这些结果。不仅如此,各种反粒子,反物质,甚至于所有今天量子理论的所有结论,都离不开相对论。人们经常说相对论和量子力学不融合,这是因为,我们这里说的是狭义相对论,那里说的是广义相对论。广义相对论怎样和量子力学结合是一个高难度的课题。

至于光速为什么不变,而且是速度的极限呢?终极原因只有造物主知道,但是我们可以说,如果光速没有上限,可以无限大,那么,就没有了因果关系。你这里叩动板机,几千里外,或者别的星球上的人瞬间死去,这还怎么说是因果关系呢?动作失去了“局域性”。你挥舞一下拳头,不仅仅对你面前的人发挥效应,全宇宙瞬间都有感觉。那宇宙的秩序,主要是因果关系,就不存在了。而光速的不变,不能叠加,也是避免有质量物体的速度,任何时候都不会超过无质量的光的速度,逻辑正确。造物主不会对我们开玩笑,我们以为怪异的事是由于我们有限的认知能力。

如果造物主想改变我们对生活的态度,他只需要按动光速的按钮,改变光速,或者让光速不再有限,就可以达到目的,但那样也不会有逻辑自洽的世界,也不会有我们了。