一. 时钟佯谬简史
在相对论的历史上, 曾出现过一些流传很广的佯谬——也可以说是意外。 之所以说是意外, 是因为一些知名物理学家也参与了某些话题的讨论, 给出的答案却不尽相同, 从而使被讨论的话题变得更像佯谬。 时钟佯谬 (clock paradox) 就是其中最著名的一个。
时钟佯谬源于一个很简单的问题: 在惯性参照系中有两个彼此校准了的时钟, 一个保持静止, 另一个沿闭合路线运动后回到原地, 问两个时钟重新相遇时哪个时钟慢了?
最早对这个问题作出回答的当然不是别人, 而是 Albert Einstein 本人。 他在狭义相对论的开山之作 “论动体的电动力学” (On the Electrodynamics of Moving Bodies) 中对这一问题给予了明确回答, 答案是运动时钟慢了, 理由是狭义相对论的时钟延缓 (time retardation) 效应[注一]。 但不知是没往那个角度考虑, 还是觉得那不是问题, Einstein 只在静止时钟参照系中回答了这一问题, 而未如许多后人所做的那样, 将静止时钟参照系与运动时钟参照系视为对等来进行分析, 从而没有触及后来被称为 “佯谬” 的东西——即两个时钟均认为自己静止, 对方运动, 从而在表观上彼此矛盾地均认为是对方慢了。
文献中最早触及时钟佯谬, 并试图给予解释的知名人士是法国物理学家 Paul Langevin。 他在 1911 年发表的一篇题为 “空间和时间的演进” (The Evolution of Space and Time) 的文章中提出: 解释时钟佯谬的要点, 是注意到运动时钟经历了加速运动, 而静止时钟没有经历加速运动。 在那篇文章中, 他还引入了两条很受后人欢迎的 “人性化措施”: 一是将时钟换成人, 二是采用两人互发光信号的方法来比较各自经历的时间。 Langevin 这篇文章影响了很多人, 时钟佯谬的别名 “双生子佯谬” (twin paradox) 据说就是他将时钟换成人所引发的。 直至今日, 许多初等教材及科普读物仍采用 Langevin 的方法分析时钟佯谬 (有些著作还将两人互发光信号改成更 “亲密” 的互数对方心跳)。
继 Langevin 之后, 德国物理学家 Max von Laue 也对时钟佯谬提出了解释。 他在 1912 年发表的一篇题为 “两种反相对论意见及对它们的反驳” (Two Objections against the Theory of Relativity and Their Refutation) 的文章中提出: 解释时钟佯谬的要点, 是注意到运动时钟在从远离转为返回的过程中更换了参照系, 而静止时钟没有更换参照系。 他的这一看法也被一些人采纳, 成为分析时钟佯谬的切入点之一。
Einstein 本人则似乎直到广义相对论发表之后, 才对时钟佯谬中的 “佯谬” 部分发表看法。 他在 1918 年发表的一篇题为 “关于反相对论意见的对话” (Dialog about Objections against the Theory of Relativity) 的文章中运用自己的 “独门武器” 等效原理 提出了一种看法。 他认为解释时钟佯谬的要点, 是注意到运动时钟受到了与加速场等效的引力场的影响, 而静止时钟没有受到那样的影响。 由于引力场中的时钟延缓是广义相对论的推论, 加上 Einstein 在相对论领域的巨大威望, 他的解释在很长的时间里被视为了时钟佯谬的正解。 20 世纪上半叶的很多相对论名著, 比如奥地利物理学家 Wolfgang Pauli 的《相对论》(Theory of Relativity)、 丹麦物理学家 Christian Møller 的《相对论》(Theory of Relativity)、 美国物理学家 Richard C. Tolman 的《相对论、 热力学及宇宙学》(Relativity, Thermodynamics, and Cosmology) 等都采用了 Einstein 的观点, 认为时钟佯谬需要用广义相对论来解释。 甚至连后来出版的一些知名著作, 比如 20 世纪 70 年代出版的日本物理学家汤川秀树的《经典物理学》, 也认为时钟佯谬 “在狭义相对论框架中考虑时是佯谬, 但若考虑广义相对论就不再是佯谬了”。
不过, 以上这些物理学家对时钟佯谬的解释虽各有各的侧重点, 而且从现代观点来看, 都不够切中要害, 但他们的结论是一致的, 并且也是正确的, 那就是运动时钟慢了 (这一结论后来得到了实验证实)。 时钟佯谬作为 “佯谬” 的正史大体就是这些, 但在结束本节之前, 有一段 “外史” 必须提一下, 因为时钟佯谬作为 “佯谬” 的名声, 在很大程度上其实是被那段 “外史” 搅起来的。 那段 “外史” 就是英国哲学家 Herbert Dingle 在 20 世纪 50 年代末对相对论的猛烈攻击, 而那攻击的主要目标就是时钟佯谬。 Dingle 在攻击中先是认为两个时钟应显示相同时间, 遭驳斥后又转而宣称相对论的预言与经验不符 (实际上有关时钟佯谬的预言当时就已得到了 μ 子衰变实验的支持), 甚至连数学上显而易见的 Lorentz 变换存在逆变换这一基本事实, 也被他斥为明显不可能。
这样一个用上海话讲根本就 “拎勿清爽” 的人物照说是不配在本节中被提及的, 但历史有时是充满惊奇的, 这位 “拎勿清爽” 的 Dingle 先生在 1951-1953 年间竟担任过英国皇家天文学会 (Royal Astronomical Society) 的主席[注二], 并且还是英国科学史学会 (British Society for the History of Science) 的创始成员之一以及 1955-1957 年间的主席。 也许是因为这些背景的缘故, 几十位物理学家对他那破绽百出的文字进行了认真驳斥, 从而构成了时钟佯谬历史上一段虽无价值, 却引人注目的 “外史”, 并在最大程度上成就了时钟佯谬作为 “佯谬” 的名声。
以上就是时钟佯谬的简史, 对于本站读者来说, 还可以补充一段史上最小的八卦, 那就是本文作者 “小时候” 也曾认同过广义相对论才是时钟佯谬正解的看法, 在本站的昔日版本中还贴过怀旧之作, 对某些基于 Langevin 和 Laue 思路的解释进行了 “呛声”。 也许是因此之故, 常有网友在本站问及时钟佯谬。 从这个意义上讲, 本文可算是一篇还债之作——还那怀旧之作引发的文债。
这篇还债之作之所以拖到今天才写, 不是企图 “赖债”, 而是因为时钟佯谬的现代解释实在太简单了, 简直就是 “一句话解释”, 就算加上注解, 似乎也构不成一篇文章。 当然, 这种估计如今看来显然是错误的, 因为真要写的话, 几乎没什么话题是构不成文章的。
好了, 现在言归正传, 谈谈时钟佯谬的现代解释。 自 20 世纪 70 年代以来, 有关相对论的许多教材和专著, 比如 Robert M. Wald 的《广义相对论》(General Relativity)、 Roberto Torretti 的《相对论与几何》(Relativity and Geometry)、 Wolfgang Rindler 的《相对论》(Relativity)、 Rainer Sachs 等人的《数学家用广义相对论》(General Relativity for Mathematicians)、 Charles W. Misner 等人的《引力》(Gravitation)、 Roman U. Sexl 等人的《相对论、 群论、 粒子》(Relativity, Groups, Particles) 等都采用了几何语言来阐述时钟佯谬, 这就是所谓时钟佯谬的现代解释。 在中文文献中, 梁灿彬等人的《微分几何入门与广义相对论》也采用了现代解释, 中文读者可以参考[注三]。
那么究竟什么是时钟佯谬的现代解释呢? 我没有忽悠诸位, 它的要点确实只有一句话, 那就是: 时钟记录的是自己的世界线长度。 在时钟佯谬中, 之所以是运动时钟慢了, 原因就是它的世界线长度较短。 这里唯一要说明的是, 所谓 “世界线长度” 指的是 Minkowski 空间中的长度[注四], 它与普通空间中的长度有一个最大的区别, 那就是前者的测地线 (即 “直线”) 长度是极大值而不是极小值 (请读者想一想, 这是 Minkowski 空间的什么特点造成的?)。 但无论 Minkowski 空间还是普通空间, 有一点是共同的, 那就是长度是坐标变换下的不变量, 从而与参照系或坐标系的选择无关[注五]。
在这样的几何语言下, 时钟佯谬的结论, 即运动时钟比静止时钟慢, 不过是对两个时钟的世界线长度不同这一简单事实的简单陈述而已, 并不比普通空间中两条曲线的长度不同来得奥妙, 更没有任何佯谬可言。 这一点是如此地显而易见, 以至于前面提到的《相对论与几何》一书的作者 Torretti 感慨道: “相对论时钟是类时世界线上的里程表, 假如人们对这一事实有过更多关注, 那么在所谓时钟佯谬上付出过的很多努力就可以省掉了。”
但话虽如此, 如果我们在这里就结束本文, 有些读者也许会感到失望, 因为在时钟佯谬的传统讨论中, 人们曾花大力气讨论运动时钟参照系, 试图说明该参照系也能理解运动时钟变慢这一结论。 即便那些努力如今 “可以省掉了”, 但若不把那最令人困惑的运动时钟参照系单独拿出来, 更直接地讨论一下, 似乎多少有些偷懒的感觉。 为了 “抚平” 这种感觉, 我们再多说几句。
如前所述, 在时钟佯谬的现代解释中, 运动时钟之所以慢了, 原因是它的世界线长度较短。 如果画出时空图的话, 静止时钟的世界线是直线, 运动时钟的世界线是曲线 (参阅右图), 两者起始点相同, 但曲线的长度较短 (因为是 Minkowski 空间)。 这一切当然都是几何语言。 那么, 在这种语言中运动时钟参照系是什么呢? 它就是把运动时钟的世界线视为直线, 而把静止时钟的世界线视为曲线的坐标系。 这种坐标系其实我们并不陌生, 它就是曲线坐标系——把运动时钟的世界线作为时间轴的曲线坐标系。 明白了这一点, 运动时钟参照系里的问题就迎刃而解了, 因为曲线坐标系虽然完全合法, 而且确实能在表观上使两条世界线的 “曲”、 “直” 互换, 却不会改变它们的长度, 从而不会改变时钟佯谬的结论, 因为曲线坐标系有一个众所周知的 “副作用”, 那就是会改变度规的形式, 使之不再是 Minkowski 度规 ds2 = ημνdxμdxν 或 Euclid 度规 ds2 = δijdxidxj。 比如极坐标下的度规是 ds2 = dr2 + r2dθ2 而不是 ds2 = dr2 + dθ2。 正是这种度规改变抵消了 “曲”、 “直” 互换的影响, 使得长度不变, 从而保证了时钟佯谬的结论不变 (有关这一点的进一步说明可参阅 附录二)。
当然, 这一切其实就是对 “长度是坐标变换下的不变量” 这一简单事实的繁琐说明, 只不过这样一说明, 或许显得更像是 “解释” 而已。 另外, 它也示范了一种方法, 即当我们对时钟佯谬的某个方面感到困惑时, 想想它在几何语言下的对应, 以及在普通空间中的类比, 往往会豁然开朗。
在本节的最后, 我们评论一下 “时钟佯谬需要用广义相对论来解释” 这一流传很广的观点。 很明显, 时钟佯谬的现代解释并不支持这种观点。 时钟佯谬作为 Minkowski 空间中的现象, 是完全可以, 并且也应该用狭义相对论来解释的——正如上述现代解释所做的那样。 事实上, 在 Minkowski 空间中无论采用什么参照系或坐标系, 都不可能使四维曲率张量非零, 从而不可能出现曲率意义下的引力场。 不仅如此, 迄今为止除上述现代解释外, 对时钟佯谬的任何其它解释都是针对特例或近似的。 比如 Langevin 和 Laue 的解释通常只被用于运动时钟匀速远离, 再匀速飞回的特例; Einstein 的解释则往往要采用广义相对论的弱场近似。 与之相比, 时钟佯谬的现代解释完全不受那些特例或近似的约束, 从而有极大的普适性。 哪怕两个时钟都作任意复杂的类时运动, 现代解释依然适用 (传统解释则会变得苦不堪言)。 甚至当我们把时钟佯谬的舞台由 Minkowski 空间搬到更复杂的空间, 从而越出狭义相对论的范围时, 现代解释依然适用 (只需增添一个非平凡的背景度规即可)[注六]。
在结束本文前, 我们还要讨论一个衍生话题: 什么是时钟? 之所以要讨论这个话题, 是因为时钟佯谬的传统解释, 尤其是 Einstein 的思路, 很容易产生一个与 “什么是时钟?” 密切相关的问题, 那就是加速度究竟会不会对时钟产生影响? 关于这个问题, 许多现代教材及专著——比如前面提到的 Torretti、 Sexl、 Rindler、 Misner 等人的著作——都给出了明确回答, 我们在这里作一个简单介绍。
首先要指出的是, 对于具体的时钟来说, 这个问题的答案显然与时钟的结构有关 (而且大都是肯定的), 比如对加速场中的摆钟来说, 加速度越大, 摆动的周期就越短, 如果我们用这种摆钟的摆动次数来计时, 加速度对它显然是有影响的。 又比如对人来说, 如果我们将生理节律作为时钟——就像 Leginvin 所做的那样, 它显然也会受加速度影响, 在足够大的加速度下——对飞行员来说是 10g 以上, 对本文作者来说估计 5g 就够了——甚至会 “停止计时” (一命呜呼)。 不仅宏观世界的时钟如此, 曾被用来验证相对论的原子钟, 严格讲也是会受加速度影响的, 因为它的能级结构与包括加速场在内的各种外场有关。 甚至连最早对时钟延缓效应作出实验判决的 μ 子的衰变, 我们也并不肯定它不会受加速度影响。 只不过, 对于微观世界的时钟来说, 与它内部的微观相互作用相比, 加速场的影响往往是微乎其微的, 因此当我们采用微观世界的时钟时, 通常都能忽略加速度的影响。
但无论加速度对具体时钟的影响是有还是无, 是大还是小, 有一点是肯定的, 那就是我们并不认为像摆钟受加速度影响, 或本文作者在 5g 的加速度下 “停止计时” 那样的效应反映了时间的固有性质。 相反, 我们认为那是具体时钟的缺陷导致的表观效应, 是可以、 并且必须校正的。 我们真正关心的是反映时间本质的时钟, 即所谓的理想时钟。 本文所说的时钟除非有特别说明, 指的也全都是理想时钟。
因此我们的问题其实是: 什么是理想时钟? 对此, 相对论——无论狭义相对论还是广义相对论——的回答是: 理想时钟是记录自己世界线长度的时钟。 这是理想时钟的定义, 被 Torretti 称为 “时钟假设” (clock hypothesis)。 不难证明, 对于时钟佯谬所涉及的 Minkowski 空间的时钟来说, 这一定义给出的理想时钟与瞬时随动惯性系 (momentarily co-moving inertial frame) 里的时钟完全同步 (请读者自行证明)[注七]。 由此, 我们也得到了 “加速度究竟会不会对时钟产生影响?” 的答案, 那就是加速度对理想时钟没有影响。
细心的读者也许已经注意到了, 上述理想时钟的定义其实正是前面提到过的时钟佯谬现代解释的要点, 即 “时钟记录的是自己的世界线长度”。 时钟佯谬的现代解释之所以有极大的普适性, 一个很根本的原因就是它实际上包含了理想时钟的定义。
在本文的最后, 给感兴趣的读者留两组思考题:
- 人们常说的 “引力场中的时钟较慢” 究竟是什么意思? 把它与 等效原理 合在一起, 是否会得出与 “加速度对理想时钟没有影响” 相矛盾的结论?
- 在理想时钟的定义中, 只校正了加速度的影响, 这是否是一种随意选择? 能否把速度的影响也像加速度的影响一样校正掉?
- 也称为时间膨胀 (time dilation) 效应。
- 我试图查找 Dingle 对天文学的贡献, 却没能找到。 他最主要的天文活动似乎是参加了 1927 与 1932 年的日食远征队, 但两次都因天气原因无功而返。 他被选为皇家天文学会主席一事, 据说连他自己都觉得惊讶, 因为自 20 世纪 30 年代后期起, 他就已经离开天文学, 转而研究自然哲学了。
- 不过, 梁灿彬等人的著作多加了一个似是而非的论据, 即认为三维加速度是相对的, 四维加速度才是绝对的, 以此反驳那种认为加速度也是相对的观点。 其实, 就该书所述的情形——即该书自己援引的第 6.3 节——而言, 在对解释时钟佯谬来说最关键的加速度的 “有” 和 “无” 的区分上, 三维加速度与四维加速度都是绝对的 (理由很简单, 相对于一个惯性系作加速运动的物体相对于任何惯性系都是作加速运动的, 从四维加速度的分量表达式也可看出, 四维加速度为零当且仅当三维加速度为零), 对两者作相对与绝对的划分对于解释时钟佯谬来说不仅似是而非, 而且毫无必要 (有关这一点的进一步说明可参阅 附录一)。
- 对于类空曲线来说, 这种长度常被称为 “固有长度” (proper length), 对于类时曲线来说, 则常被称为 “原时” 或 “固有时” (proper time)。 另外, Minkowski 空间常被称为 “Minkowski 时空”。
- 本文对 “参照系” 和 “坐标系” 这两个术语只作粗略区分: 意在强调与核心物理观察者 (即那两个时钟或双生子中的某一个) 的关系时用 “参照系”, 意在强调具体数学坐标时用 “坐标系”。
- 有人也许要问: 时钟佯谬的传统解释到底算不算错误? 我的看法是, 在各自针对的特例或近似下, 它们作为理解时钟佯谬的辅助手段, 谈不上错误。 但它们是否称得上解释, 则取决于对 “解释” 一词的理解, 我个人认为它们起码不算是好的解释。
- 瞬时随动惯性系是指在所考虑的时刻与运动时钟具有相同瞬时速度的惯性参照系, 也称为 “瞬时静止惯性系” (momentary inertial rest frame)。
参考文献
- Charles W. Misner et al, Gravitation, W. H. Freeman (1973).
- Wolfgang Rindler, Relativity: Special, General, and Cosmological, Oxford University Press (2006).
- R. K. Sachs and H. H. Wu, General Relativity for Mathematicians, Springer (1983).
- Roman U. Sexl et al, Relativity, Groups, Particles: Special Relativity and Relativistic Symmetry in Field and Particle Physics, Springer-Verlag (2001).
- R. Torretti, Relativity and Geometry, Dover Publications (1996).
- 梁灿彬 周彬, 微分几何入门与广义相对论 (上册), 科学出版社 (2006).
二零一一年五月十四日写于纽约
二零一一年五月十五日发表于本站
https://www.changhai.org/
本文的 [注三] 引起了一些网友的讨论, 使我觉得有必要作稍稍详细些的说明。 首先要强调的是 [注三] 中的两个界定条件: “就该书所述的情形——即该书自己援引的第 6.3 节——而言” 以及 “对于解释时钟佯谬来说”。 这两个界定条件所要表达的意思是: [注三] 并不是要泛泛地反对那种认为 “三维矢量是相对的, 四维矢量是绝对的” 的观点, 而只是针对梁灿彬等人的著作 (以下简称 “梁书”, 版本同参考文献所列) 在解释时钟佯谬时对该观点的应用。
具体地讲, 梁书为什么会提到 “三维加速度是相对的, 四维加速度是绝对的” 呢? 是因为要反驳从 “加速度是相对的, 甲认为乙有加速度, 乙也认为甲有加速度” (梁书 p.150) 这一角度看待时钟佯谬的做法。 而从这一角度看待时钟佯谬的最根本特点, 就是选用运动时钟 (即梁书中的 “乙”) 所在的非惯性系, 并据此认为运动时钟没有加速度, 静止时钟反而有加速度。 这是梁书试图反驳的东西。
但梁书认为这一做法的错误在于没有区分三维加速度 (以下简称 3 加速) 与四维加速度 (以下简称 4 加速), 特别是没有意识到前者是相对的, 后者是绝对的, 却显然会使读者产生一个印象, 那就是选用运动时钟所在的非惯性系虽然可以使 3 加速为零, 但 4 加速不会为零 (否则就谈不上是以 “3 加速是相对的, 4 加速是绝对的” 作为反驳理由了)。 梁书既然这么反驳了, 那接下去就应该在运动时钟所在的非惯性系中计算 3 加速与 4 加速, 以证实诸如 “3 加速为零时 4 加速不为零” 之类的结果, 这样就能构成有效反驳。 但梁书自己援引的第 6.3 节实际上却只介绍了惯性系中的 4 加速, 从而根本就无法胜任自己的反驳任务。 相反, 该节的 6-3-37 式清楚地显示出 3 加速为零时 4 加速也为零 (当然, 这倒也并非转而支持了反驳对象, 因为该式是惯性系中的表达式, 而后者要求的是非惯性系)。 因此我说 “3 加速是相对的, 4 加速是绝对的” 这一说法就梁书所述的情形而言, 对解释时钟佯谬来说不仅似是而非, 而且毫无必要。
有人也许会辩解说, 梁书采用的记号是普适的 (梁书作为广义相对论教材, 采用的多数记号确实是普适的), 既适用于惯性系, 也适用于非惯性系, 因此 6.3 节并非单纯讨论惯性系中的 4 加速。 对此, 我们只需问这样一个问题: 梁书 6.3 节中哪个公式证明了诸如 “3 加速为零时 4 加速不为零” 之类的结果? 如果没有证明那样的结果, 怎么能算是用 “3 加速是相对的, 4 加速是绝对” 来反驳从 “加速度是相对的” 这一角度来看待时钟佯谬的做法呢?
二零一一年五月十六日写于纽约
在讨论本文的过程中, 有网友提出了这样一个问题: 为什么运动时钟参照系必须接受一个 “不平等” 的度规, 而不能像静止时钟参照系那样, 认为自己的度规是 Minkowski 度规? 在时钟佯谬的框架中, 这是因为一开始就已假定问题发生在 Minkowski 空间中, 而所谓 “静止” 时钟与 “运动” 时钟的唯一合理的定义就是前者的世界线为测地线, 后者的世界线为非测地线, 而且两者都是——并且也只能是——相对于背景度规来定义的 (相对论不是一个 Mach 式的理论, 在相对论中与奥地利哲学家 Ernst Mach 所设想的遥远星体所起作用最接近的东西就是背景度规), 这就保证了只有前者所在的参照系可以自始至终使用 Minkowski 度规, 后者则只能使用从 Minkowski 度规 (通过坐标变换) 诱导出来的度规。
不过, 这也引出了一个更一般的问题, 那就是 Minkowski 度规的特殊地位是从何而来的? 在狭义相对论中, 这可以说是一个基本假设 (或经验事实)。 那么, 广义相对论的情况是否会强一些呢? 它是否能对 Minkowski 度规的特殊地位做出 “更物理” 的说明 (从而也对时钟佯谬作出 “更物理” 的解释) 呢? 很遗憾, 答案是否定的, 因为 Minkowski 度规的特殊地位在广义相对论中也是基本假设, 因为广义相对论所用的 pseudo-Riemannian 空间就是局部为 Minkowski 空间的流形 (这是 等效原理 的体现), 其度规则是可以局部地由 Minkowski 度规诱导出来的。 实际上, 按照我们在正文中所建议的类比思路, Minkowski 度规在相对论中的地位与 Euclid 度规在普通 Riemann 几何中的地位是完全相似的, 两者都是切空间中的度规, 都是诱导其它度规的基石。 广义相对论无法比狭义相对论 “更物理” 地解释 Minkowski 度规的特殊地位 (从而也无法 “更物理” 地解释时钟佯谬), 就好比 Riemann 几何无法比 Euclid 几何更充分地说明 Euclid 度规的特殊地位。
二零一一年五月十八日写于纽约