徐一鸿:数学在基础物理中的有效性——威格纳之后三十年

作者简介:徐一鸿是华裔美国物理学家,美国艺术与科学院院士,出生于昆明,成长于上海、香港和巴西,毕业于哈佛大学。目前任教于加州大学圣塔芭芭拉分校的卡弗里理论物理研究所(Kavli Institute for Theoretical Physics)。徐一鸿亦为知名作家,著作中包括畅销科普书《可畏的对称》(Fearful Symmetry)、《爱因斯坦的玩具》(An Old Man's Toy),皆翻译成多国语言。
重点摘要:●威格纳论文发表之后30年,数学和物理都有很大的进展,作者重新审视当时数学和物理之间的关系,省思数学有效性的意义。
●作者区分数学和算术,将数学一词保留给更宏观、更结构性的数学,认为更深刻的数学和更深刻的物理紧密相关,这也是数学有效性的根源。
●基础物理的前沿进展已经走入实验难以验证、直观阙如的处境,唯有数学堪为引路明灯,数学和基础物理的互动将更为活跃。
原文出处:R.S. Mickens (ed.),Mathematics and Science, World Scientific,(1990)。以下中译文繁体版原载于《数理人文》杂志第2期(2014年),简体版刊载于“数理人文”微信订阅号,转载请注明出处。
当我还算是小朋友时,恰巧有机会读到威格纳的文章“数学在自然科学中不合理的有效性”[1],我印象很深刻。因此当明肯思(Ron Mickens)这么多年后,邀我写篇类似的文章时,心中自然十分乐意。
最近重读威格纳的文章,更能领略到他当时已经倾囊相授,而且理应如此。关于他文章标题所引发的问题,我实在很难想像还有谁能更深入一谈。我的同事可能觉得实际做研究的理论物理学家,根本想都不该想这个问题。不过,做一名理论物理学家的乐趣,当然就是可以沉思这类的问题。
更何况,打从威格纳的文章发表至今已经约莫30年。这段期间,物理和数学的发展,至少在重点上,都已经有所改变,很值得再次检视这个问题。我要事先声明,这篇文章既缺乏一以贯之的主题,也没有惊人的洞识。我所能提供的只是片段的观察、轶事与反思。反正底下说的,在我们大学时代算是闲聊八卦(shooting the breeze)。
威格纳的大哉问
当然,威格纳的首要贡献是提出这个问题。关于他擅于询问基本问题的能力,我也许可以讲个小故事。大概第一次读到威格纳的文章时,我还是个大学生。某个冬天晚上,我必须回系上处理一些事情。但晚餐时,外头已经开始下大雪。我一路踉跄走到物理馆,途中还滑了好几跤,到达时已经浑身是雪。当我蹒跚走进系馆时,威格纳身着厚重大衣、头带帽子,正好要走出来。他很仔细的打量我,然后以他奇怪的严肃态度问我说:"堆不起,请闻外棉在瞎雪吗?」【译注:对不起,请问外面在下雪吗?威格纳有很重的匈牙利口音】
老实说,这还真是我听过最深刻的问题,这是目光检视在理解外在世界时不合理的有效性吗?不过正当我认真与这个深刻思想搏斗时,威格纳已经走了出去,消失在咆哮的暴风雪中。
一位物理同事有次告诉我,数学在自然科学中的有效性到底合不合理的问题有个妙处,要嘛,这是一个无比深刻的问题;要不,就是极为显然的无聊问题。我自己的立场倾向于深刻的这一边,但这些姑且不论,让我们先来理解并定义威格纳问题中的用语。
有效性是什么?这场有效性的竞赛里,数学的对手是谁?麻烦的是,我们能举出的任何替代方案,相比下来都十分没效率。但我们怎么知道世上真的没有比数学更有效的方法呢?史前时代的威格纳可能会认为,当要理解现实世界时,魔法咒语也具备不可思议的有效性。到底是否有某种人们尚无从感知、甚至定义的东西,却比数学更有效呢?而且不管找到的答案是什么,威格纳所谓的不合理的有效性,就等同于最有效的意思吗?
事实上我怀疑威格纳认定的数学也许只是整个计量概念的世界。如果真是如此,那他提出的问题可能还真的是深刻的无聊(或者是无聊的深刻),因为一缸子定量概念,当然比一缸子定性概念更有效率。定量概念本来就比较明确与简洁。
我们又要如何测量不合理或不可思议的程度呢?是根据某个社群公认的标准吗?很显然,由于物理学家假设空间和时间是连续的,也因为这个假设的基础是仔细验证过的观察,所以理当得出底下的结论:连续可微函数的数学是有效的。根据这种观点,因为基本的数学概念如几何学,是人类从现实世界的经验抽象萃取出来的,因此数学理当有效。这个论点的拥护者指出一个明显的事实,现代数学中和「日常」经验绝少渊源的数学领域,也跟物理学较不相干。
这种说法最戏剧性的反例,是量子物理学中出现的复数。为什么我们描述微观世界时,必须真的用到复数?这实在很不可思议。
回头再谈谈描述连续时空很有效的可微函数。我可以想像,如果在某种距离尺度之下,发现时空其实是离散的,那么(就威格纳理解的)数学可能就完全失效。说真的,数学在如格点规范理论(lattice gauge theory)的领域里并不特别有效,事实上除了去跑电脑,别的方法都不太管用。
数学和算术
接下来,我想以较多篇幅定义「数学」 。威格纳用了两节讨论「数学是什么」与「物理是什么」。为了不重复他的论点,我希望能区分数学与「算术」(arithmetic),用这个词是因为我找不出更好的用语。这样的区分非常直白,还故意带着一点势利眼(「你所谓的数学,在我看来只是算术罢了。」)威格纳的文章发表20年后,汉明(R. W. Hamming,1968年图灵奖得主)曾经写了一篇文章,名为〈数学不合理的有效性〉[2]。停!我并不怎么在意他的文章,就我而言,基于汉明出身的工程背景,他所谈的内容大概都不出我所谓的算术范围。
好,那么数学和算术的差别到底是什么?我认为,一位够聪明的物理学家(暂时定义成显然比我更聪明的某人)在有限时间内,遵循大致上直截了当的逻辑,却无法完成的那种研究就是数学(至于有限时间是多长,就让各位去烦恼);其他的都是算术。举例来说,我可能可以掌握勒让德方程(Legendre's equation)解的性质,因此所有这些勒让德方程的性质绝对都是算术。另一方面,从高维球面有意义的映射到低维球面的所有可能性只有三种,亦即 S3 S2、S7 S4、S15 S8,这是我所谓的数学。
至于称某项理论是数学还是算术,某种程度上依赖于我们看待的观点。如果能认识到勒让德多项式和旋转群的表示(representation)有关,就表示我们对旋转群的结构性质有一些理解。简而言之,我将数学联系到结构的或整体的理解,而算术则和计算有关。
费曼数学观的影响
图片
费曼(照片来源:Wikipedia)
让我重述一段广为人知、关于物理学家如何傲慢的轶事,费曼(Richard Feynman)有次曾说,如果上帝没有创造数学,那物理学家大概晚一周就能创造出来(1920年代,如果复数还没发明出来,量子力学发展的延宕会远远超过七天吗?)根据费曼的看法,物理学家可以发明任何他们需要的东西,至于剩下的那些数学,依照费曼关心的目标,根本打一开始就只是莫须有的烦恼。当然,费曼的态度展现了物理学长久以来的传统,在1970年代中期之前,我可能也会同意费曼的看法。不过当弦论出现,还有在那之前大约十年,真正深刻的数学开始大量进入物理(主要是量子物理用到了群论)时,我的看法才开始转变。不过在这些发展之前,物理学家似乎还真的可以信从费曼的说法,与「纯粹」的数学家丝毫搭不上关系。
就某种角度,费曼并没有错。1970年代,物理学家用了极少的数学就达成大统一理论(GUT,grand unified theory),其中只用了一些基本群论,大概就是这样。拜託!这可是大统一理论!是统一了三种基本作用力的理论!我们解开了大自然最核心的一大部分祕密,理解这个世界是如何构成的,而且没有用到数学家称之为数学的东西。事实上,大统一理论的创造者,以及大部分1970年代的粒子物理学家,都十分费曼,很蔑视数学。有次费曼和我一起看秀,他告诉我数学物理那些华而不实的东西,应用到物理时根本连杯马尿都不如。
我喜欢把量子物理学在1970年代中期的发展,看成是从费曼图(Feynman diagram)的镣铐中脱身。我认为费曼图技巧虽然具备聪明的简洁,却影响太久,最后对粒子物理学造成不健康的影响。在我研究生的一门量子场论课,教授告诉学生场论的定义就是费曼图全体。整组费曼图构成的集合定义了一个酉群的(unitary)、解析的(analytic) ,以及洛仑兹不变性的理论。所有量子力学标准正则发展中的操作譬如场算子的对易,它所附带的精致内蕴,必须做为工具导出费曼法则。一旦这些规则确立,量子场就可以扔到一边去。
图片
费曼图一例(照片来源:Wikipedia)
在这种氛围里,的确没有什么学习数学的必要。但是孤立子(soliton)与瞬子(instanton)理论的出现,摧毁了这种观点。粒子物理学家必须开始学习这种华而不实的数学,像是拓朴学。
自发对称破缺(spontaneous symmetry breaking)与孤立子这两门理论之间的十年鸿沟,依我的看法,乃是出自费曼图束缚思考的影响力。即使到了1970年代,仍然有很多人偏好运用消失到真空的图线来描述自发对称破缺。把场当做实在的对象,当做某种可以把玩捏塑的东西,这种想法在当时是相当革命性的观点。
讽刺的是,当时脱颖而出、名为路径积分法(path integral)的理论也出自费曼,这个方法展现了费曼真正的贡献。
一旦费曼图的枷锁松开,费曼的数学观点也就跟着开始黯淡。年轻一代的粒子物理学家与现代数学的相处越来越融洽,大家对数学的观点有了根本的转变。到了1983年超弦理论出现后,这个潮流更是加速前进。在今天,许多超弦理论的研究其实都是数学结构的研究,这是威格纳做梦都想像不到的情况。
基础物理与数学
以上是我对过去三十年来,理论物理学家的态度如何改变的简短回顾。接下来,我想提供一些观察,谈谈数学在基础物理学的角色。你可能注意到,我将文章题目限制在「基础物理」(fundamental physics)。这是我几年前发明的字眼,藉以取代过时的「粒子物理」(甚至更糟的「高能物理」)。这听起来也许像是狗追着尾巴跑,因为我把基础物理学家定义成想在物理世界中发现某种基础理论的人。基础物理和粒子物理有大量的重叠,但也各有相异之处。这个基础物理的定义广到足以包括一些凝态物理,他们对理解强量子多体系统(strongly quantum many-body system)的「大域」性质感兴趣。如果继续采用我区分数学和算术的势利看法,基础物理学家可以定义成倾向于运用数学而不是算术的物理学家。但不管怎样,让我们继续再看下去。
我相信下面的叙述是真的但却是不可思议的:更深刻的数学描述更深刻的物理学。例如比较薛定谔算子(Schrödinger operator)与狄拉克算子(Dirac operator),狄拉克算子所含藏的数学结构就比薛定谔算子更丰富深刻,而我们也期待如此,毕竟薛定谔方程只是狄拉克方程的逼近。和狄拉克算子相联系的才是真正的数学。
图片
狄拉克(照片来源:Wikipedia)
图片
薛定谔(照片来源:Wikipedia)
前一阵子,这个看法就让我瞠目结舌的给撞上了。当时我和同事正研究一个凝态物理的问题,讨论在量子化的磁通量影响下,非相对论性电子如何在二维格上跃迁(hopping)。这个问题和相对论以及狄拉克方程都毫无关系。为了决定电子能量 E 做为动量 p 的函数,我们得到的是一个很标准又直接的 n 阶方阵特征值的问题。一般来说,除了最简单的情况,都需要跑电脑才能弄出一些数值,这里头没有值得一谈或者有数学意义的东西。然而,如果感兴趣的不是函数 E(p) 的确切形式,而是函数的零根,也就是代到 E(p) 会等于0的 p 值。在这些零点 p∗ 附近,可以对 E 做展开,通常 E 会线性依赖于 p − p∗:也就是 E≈a(p − p∗)。结果在对 p 做恰当的平移与尺度变换后,我们发现电子在动量 p∗ 附近的行为,可以用狄拉克方程做有效的描述。令人赞叹的是,这样我们就可以将指标定理(index theorem)与绕数(winding number)这一整套数学结构搬过来用,找出所有零点的数目。
重点是,决定 E(p) 甚至决定零点 p∗ 的位置都是算术性的工作。这些量依赖汉米尔顿函数(Hamiltonian)的细节,稍微改变汉米尔顿函数,p∗ 的值原则上就会跟着变动。相较之下,数学告诉我们,只要汉米尔顿函数整体结构不变,零点的数目就不变。换句话说,这里我们面对的是一个拓朴不变量。数学在掌握大域与结构性的理解时是有效的,而不是解计算问题。
我曾经在一个对物理感兴趣的哲学家会议中指出,相较于薛定谔算子,狄拉克算子所连结的数学更丰富。有听众大声反对说:「你只要数一下与薛定谔算子相关的数学论文数目不就明白了!」这其实是混淆了实用性与美感。对更大一群物理学家来说,薛定谔方程的确比狄拉克方程更有用,所以他们才会投入许多精力,想要厘清薛定谔方程的性质。
但就算针对薛定谔方程,也不是所有薛定谔问题都生而平等,例如考虑与史塔克效应(Stark effect)有关的薛定谔问题,或者粒子在环绕磁单极(magnetic monopole)的球面上运动的薛定谔问题,后者牵涉到深刻的数学,但前者则否。各位或许有人认为,前者至少还有用,但后者却没什么用,因为磁单极可能根本不存在。但是事实上,就是因为磁单极问题所牵涉的数学够深,所以在最近的理论物理学的发展中占有核心的重要性,相关讨论如雨后春笋一样到处蔓延。我只举几个例子:贝瑞相位(Berry's phase);波里亚可夫(Alexander M. Polyakov)2+1维紧致规范理论(compact gauge theory)的瞬子(这个理论可能和高温超导有关);赫尔丹(Duncan Haldane)关于反铁磁自旋链(antiferromagnetic spin chain)的理论;铁磁背景中洞移动的理论。就其本身而言,以上没有任何一个问题和磁单极有关,但是却都分享了相同的基本数学结构。
我上一段寻找零点的故事,也阐述了物理学家做研究时都知道的要点,也就是问对问题的重要性。当然「对」有好几种可能的意思。显然我们想问的是与物理相关的问题,但我们也想问那些可以有效运用数学的问题。
说来有点伤感,问对问题的重要性在某些物理领域里已经逐渐降低,这得溯及电脑的使用。于是,前面谈过的问题都可以单纯用数值计算来处理。从某种程度来说,算术的确可以取代数学。但无疑的,算术无法提供数学带来的理解。威格纳的文章发表三十年后,电脑已经成为理论物理的主要工具。就某种意义而言,电脑的确扩展了理论物理的范畴,像混沌(chaos)和非微扰量子色动力学(nonperturbative quantum chromodynamics),如果没有电脑,根本寸步难行。同时,电脑也呼应了威格纳文章的主题:「如果把物理定义成物理社群所考虑的问题与情境,数学在物理中并不特别有效。」
数学的洞识
数学所扮演的重要角色之一,是对物理学家需要考察的可能性做出限制。一个例子是李代数(Lie algebra)的完全分类,这对大统一理论的发展显然极为重要。费曼所谓的物理学家可以自己发明需要的数学,我认为在这点是错了。物理学家或许可以弄出一个特定的群如 SU(5),但是想要说出「大伙儿,这里就是所有可能的李代数与李群了。」背后的那种推理却是全然数学的。虽然,这个理论其中所牵涉的推理一旦被发明后,其实并不难理解,但其中却蕴藏着某种称为数学洞识的特质。
当然,有些物理学家如年轻的弦论学家,或许也做得出李代数的完全分类,但这样的话,这些人其实也很容易就可以成为数学家。费曼的攻击要有道理,必须假设存在完全殊异的人类特质,比如有两个人,依照某种测量方式知道他们智力相当,但其中一个人只能当物理学家,另一个人只能当数学家。就我自己的观察,我认为这个讲法还颇讲得通,很多伟大的物理学家想成为数学家根本连门儿都没有。
说真的,有许多例子显示物理学家曾经独力发展出高等的数学。莫里哀(Molière)有个很知名的故事,提到一位有天分但从小失学的作家,当朋友恭维他写的散文时,作家先是很迷惑,后来才领悟到原来自己写的东西被称为散文。我有一位物理同事,就很喜欢用嘲讽的语气问更懂数学的朋友说:「告诉我,我写的是散文吗?」
其实物理的发现经常牵连到很丰富的数学结构,在发现当时是很难想像的(这就是我先前谈到磁单极问题的要点)。狄拉克当然不可能已经领略到所有联系到狄拉克方程的数学。粒子物理学里有一个绝佳的例子——手征反常(chiral anomaly),它首先出现于1960年代,被当成一件怪事,因为明确的费曼图计算显示,天真操作量子场所导出的某个定理是错误的。(事实上,在1950年代初期,就已经有人因手征反常受到各式各样的挫败,只是没能辨认出来而已。)过去20几年,非常令人意外的,手征反常习惯性的在任何主要的理论发展中冒出个头来。这些进展包括规范理论的重整化、路径积分的测度、瞬子、量子数的分数化、诱发质子衰变、绕数与相交数(intersection number)、合适超弦理论的选择,以上还只是一些例子。这个令人瞩目的普遍现象,背后原因是手征反常和根源自拓朴与几何的一项深刻数学结构有关。
当然,这不表示物理学家感兴趣的对象就一定与深刻的数学结构有关。以量子场论为例,从现代观点,量子场论是用某种泛函积分来定义的,其中的被积项是以虚数单位 i 乘以作用量(action)为幂的指数函数。显然这只是诸多可能的泛函积分中的少数几种。至少到目前为止,物理学家并没有从这个积分发现什么特别深刻的数学。相较之下,积分项中的作用量倒是经常有些好玩的数学性质(例如纯粹的杨-米尔斯作用量,Yang-Mills action)。不过在所有重要的情况里,光是理解被积项的性质,对理解整个积分的性质并没有特别的帮助。像是在统计物理的领域里,这是尽人皆知的事。
图片
杨振宁与米尔斯(照片来源:Wikipedia)
有时候,数学在物理情境中会不请自来。一个例子是考虑在均匀磁场下,电子在平面上的运动。最低的能量量子波函数具有 f(z)e-z的形式,其中f(z)是任意的全纯函数(holomorphic function),而 z = x + yi 是平面的复数坐标。劳克林(Robert Laughlin)藉着运用这些波函数所构造的变分多体波函数(variational many-body wavefunction),能够发展出近乎完备的分数霍尔效应(fractional Hall effect)理论,这个理论的结构性质是不断诉诸数学解析性定理而获得的,劳克林不断重复这样的论证:「因为解析性,所以某某必然具备这样的形式。」先验来说,分数霍尔效应所挑战的是多体动力学里令人望而生畏的艰难问题,劳可林这么完备的理论初看起来根本绝无可能出现。
令人惊讶的是,只有在某种规范场之下(从无穷多种可能性中挑出来),其波函数才有上述的全纯形式。事实上,人们不见得有远见将波函数写成 z 的函数,通常只写成 x 和 y 的函数。可想而知,我们还是有可能这样发展出整个理论,毕竟在每一步,只要将方程式重新做规范变换,将 x 和 y 重写也可以做到。但是这么一来,整个理论的结构性就会整个模糊掉了。
上述的例子也阐明了大家早已知道的事情:使用正确的表示法乃是兵家必争之地。
符号的有效性
这带领我们走到实际做研究的物理学家所熟知的另一个事实:研究物理时运用符号的有效性。(我们可以谈合理还是不合理吗?)在最简单却深刻的层次上,代数是在某人引入文字代表数量的「想法」时诞生的。我们所有人研究物理时,都有个人偏好的符号,以致于无法忍受不熟悉的符号。人类是习惯的动物,我们习惯用 m 表示质量,用 T 表示温度,而且就是要这样。好几年前,有位卓越的粒子物理学家使用 π 来表示标数(index,像是动量的第 π 个分量)。他的论文本来就够难读了,这样写,读起来更是雪上加霜。
别人告诉我,麦克斯韦(James C. Maxwell)习惯写出电场与磁场的各个分量,用 E 表示电场的第一个分量,再依序使用 F、G、 H、 I、J(这就是磁场用 H 表示的原因!)我不晓得这个故事是不是别人瞎编的,但你大可想像用这种符号去研究电磁理论的问题!标数的选择真的是门很细致的学问。怪不得有人说,利用重复标数取和的约定是爱因斯坦对物理学最伟大的贡献之一。
从会计师的观点,在上述这些例子里更好的符号表示更高的效率。不过更好的符号经常也表示对整个主题更深入的理解。例如狄拉克的符号系统(bra and ket notation)体现了在希尔伯特空间中并不需要取特定表示(representation)去呈现态向量(state vector)的事实。
在数学里也有基本上相当于寻求更完善符号的完整主题。以微分形式(differential form)为例。当我刚进大一时,惠勒(John Wheeler)决定做个教学实验,他想用「从上到下」的方式教那一年的普通物理学(所以学生先讨论相对论和量子力学,然后再将古典物理当做「无聊」的逼近。附带一句,这个实验隔年没有重复再做。)我们学电磁学时用的就是微分形式,也就是所谓「无标数的标数」(indices without indices)。其中一部分讨论用到的「鸡蛋格」图象,后来还出现在惠勒与他人合著的知名教科书上【注:指知名教科书 C.W. Misner and K.S. Thorne,J.A. Wheeler:Gravitation(重力),(1973) W.H. Freeman】。不消说,学生都很困惑。更糟的是,我(也许别人也一样)变得十分厌恶微分形式。这种符号看起来完全没有用,因为当碰到特定的问题时,终究还是得写出微分形式的各个分量才能进行计算。于是有很多年,我一直抗拒微分形式,即使有几位好心的同事试着要「教」我。但是七年前我研究高维的反常时,我突然意识到,如果没有微分形式我根本活不下去。如果你怀疑的话,不妨试试把所有东西的标数都写出来,然后从 trFn= dω 这样的方程式去解出 ω 。你将会被海洋般的标数给淹没。(这里 F 是杨-米尔斯规范场的二维形式。)
微分形式的真正长处并不是为了避免书写无止无尽的标数串,而是厘清各种物理量的几何特性。譬如在磁单极的问题里,规范场的二维形式让我们能将规范场 F 视为单一的几何物。相较之下,如果将 F 以分量写出,则需要先选择一个特定的坐标,结果就是将简单的几何概念(像是面积),拆散成一堆无法辨认的混乱符号。另一个例子是上一段提到的问题,物理学家用算术计算,早就在 n=2 的情况解出 ω 。但是只有能够认识到,trFn做为微分形式是闭的(closed),而不是正合的(exact),才真正透露出更深刻的理解。
麻烦的是,当惠勒尝试说服我微分形式之美时,我正在尝试掌握计算带电圆盘电场之类的问题,换句话说,就是那种像股票定价分析的问题,几乎没有什么内在的几何结构可言。微分形式在只用到算术的问题里绝无可能展现威力。(这提示我另一个算术 vs. 数学的定义:电荷周遭的电磁势=算术;而磁荷周遭的电磁势=数学。)
最近几年,好几个像是环扭数(linking number)、相交数的拓朴概念开始进入物理学。再一次,这些概念都可以用具有几何特性的微分形式写成既简洁又自然的样式。
这些故事显示,对物理学来说数学常常是威力过大了。用微分形式研究电磁学是太过头了,但是等到你要处理高维的非交换规范理论时,微分形式就变得不可或缺。
我早期对微分形式的态度是物理学家研究的典型心态:除非我能用它做点什么,不然我就不要去学。譬如我现在对纤维丛(fiber bundle)的态度,就还停留在这种阶段。我还在等待真正需要纤维丛理论协助的问题,无疑我终究还是会碰到的。纤维丛所展示的数学概念,既普遍又自然,让我十分惊艳,在某个时刻,它一定会开始诱惑我。
纤维丛提供了一个范例:有时候,光是知道这个字眼就够有用。说起来,它就像可以悬挂物理概念的挂钩,用起来常常像是增强记忆的技巧。譬如说,处理带电粒子在环绕磁单极的单位球面上运动的基本问题时,纤维丛理论提供的专有名词「截痕」(section),虽然在解题时没有太大的帮助,却能提醒我们波函数是在个别区域中各自解出来的,需要用规范变换将它们拼合起来。近年,物理学家大体上也是像这样运用同伦群(homotopy group)的概念,把它当做一种增强记忆的手法。
回到薛定谔算子和狄拉克算子的比较,从狄拉克算子到薛定谔算子损失的当然就是对称性,破坏洛仑兹对称成为旋转对称。比起相对论性方程(relativistic equation),最近我又见识到非相对论性方程的麻烦。我所受的训练是相对论性的物理学家,但是过去这一年半,我研究的是凝态物理。刚开始,我的合作者要不断的提醒我错将方程写成相对论性的形式。我只能叹口大气,继续和非相对论性的方程牛步缠斗,因为处理这类方程总是冗长乏味的过程。
越深刻的数学牵涉到越对称的结构。当威格纳1960年撰写他的文章时,微观世界的物理规律看起来十分不对称。现在我们已经知道这些规律只是更深层物理定律的现象学上的逼近,而这些物理定律都是对称性的。对称性已经被证明是大自然设计的核心组织原理。事实上,从过去这25年基础物理学的历史,我们已经深刻的发现,每当更深入一层去研究大自然时,大自然就会展示出更宏大的对称性。
我已经在别处相当仔细的讲过这段故事[3]。这里我只想强调,大自然的法则并不必然在探索的层次越深时,就一定会越对称。举例来说,弱作用力就另有一个完美可行的理论,其中现象学上的费米理论是源于一双纯量粒子的交换。在大自然的设计里,也有可能弱作用和电磁作用彼此之间根本毫不相干。
对称不合理的有效性
事实上,我认为我们可以提出一个问题:「对称性在理解大自然时不合理的有效性」。为什么大自然在基本层次是由对称性来宰制的?大自然变得愈来愈对称的事实,意味着它是设计出来的吗?爱因斯坦曾经说过,关于世界最令人不可理解的就是它是可理解的。先验来说,我们大可生在一个混沌的宇宙中,其运作的机制远远超出人们的理解。关于这些问题所引发的哲学主题,我也在最近一篇文章讨论过了[4],所以这里我将集中讨论对称和数学的关系。
对称与数学有着千丝万缕的牵连。具有许多对称性的结构其数学性质自然也比较丰富。所以,如果大自然的构造真的随着我们探究的越深入,就拥有越大的对称性,那么数学当然就更有效率。
让我回头来讨论算术和数学的区分。大致来说,这个分野也反映在动力学(dynamics)与运动学(kinematics)的不同。将华丽的数学应用在物理时,通常相当于提出一个运动学的架构,然后再在其中处理动力学的问题,在后面这个阶段,数学就不再那么有效,必须由算术来接手。
让我举一个明确的例子,最近有许多关于姑且称之为陈-西蒙斯理论(Chern-Simons Theory)的讨论,它有非常多可能的应用,范围从与弦论和量子重力有关系的拓朴场论,到高温超导性都可以见到。其中的讨论可以是美妙的数学,包括霍普夫项(Hopf term)这种奇妙的结构,或者是大家都在谈的辫群(braid group)。但一旦碰到实际的高温超导性,我们就得面对「真实生活」的物理问题,真正去研究粒子液体具有分数统计的统计力学,像是这个液体的自由能是什么?它的基本激发态(elementary excitation)是什么?它有超流体(superfluid)的行为吗?华丽的数学什么也不能告诉我们,只有物理的洞识以及算术办得到。
图片
陈省身(照片来源:Wikipedia)
图片
西蒙斯(照片来源:Wikipedia)
在物理社群里,大家都很喜欢价值判断的话题,像是解出的某某问题是容易还是困难?在决定自己是否要佩服同事的研究时,大家倾向于被华丽的数学所震慑。矛盾的是,华丽数学最有效的问题通常是运动学的问题,因此也比较简单。让我引用一个在物理学上比较没那么重要的例子,我记得当我和同事在构筑膜(membrane)的陈-西蒙斯理论时,步步都被其背后霍普夫映射的数学给牵着走,我们知道事情一定会以注定的方式来完成(例如四元数一定会出现)。任何人如果研究过数学味道比算术浓厚的物理问题,一定有种数学自有其生命的感觉,会一路拖着我们往前走。
我是从自己的经验来谈算术和数学的区别,毕竟这两类问题我都研究过。而且多少有点怪的是,无论是算术还是数学都很吸引我。
数学愈丰富的理论愈正确
接下来,我想提一下理论物理学家的普遍感受,这个情怀可以高尚的叙述成「如果我做的物理问题呈现意料外的丰富数学结构,那么这个物理理论一定是正确的。」我们都知道这个假说曾经被惊人的验证过,例如爱因斯坦的重力理论与狄拉克的电子理论。
现在这项论证经常被弦论学家挂在嘴上。当然,某些用来描述弦的那种显然不起眼的作用量,其中隐藏的数学内涵却真的非常不得了。弦论或许很可能是对的,但是这样我们就必须接受这种论证吗?有种挑剔的意见认为,这一切并非巧合,因为基础物理学家想研究的结构,正好是数学家感兴趣的结构。弦论的世界面(worldsheet)是二维的,因此自然可以在上面应用复数,进而使用解析函数的理论,它的作用可以被视为保角场论(CFT,conformal field theory),于是各式各样的美好数学性质接踵而来。从天真的物理学家观点,如果真要扩展研究的架构时,该研究的应该是团状物(blob),而不是弦。可惜,团状物的世界团块是个恶厉之地,那些很自重的解析函数或保角场根本不敢涉足其中,我们看不出上面长得出什么像样的数学结构。但是,这就表示弦论是正确的吗?
当然思考这种事情也许是浪费时间,如果我有力气,应该用到弦论的研究上才是。不过上述的讨论,可以带大家看到我所谓的理论物理镖靶理论。1970年代中期,电弱交互作用的模型激增。当时一位杰出的实验物理学家,曾经向我们一群理论物理学家说,理论学家只是在乱射飞镖,其中有支飞镖一定会射中目标,其他错误的理论则被遗忘。
听到这种说法的理论学家当然给激怒了,我也觉得他们气得有道理。教科书上经常把物理学的进展描述成理论之间的竞争,这种说法大都无法用在基础物理上,因为在任何时间,通常都不是选择理论 A 或理论 B 的问题;反而是在某个优势理论与没有理论之间做选择。我们没有那么奢侈,可以在弦论或别的理论中挑三捡四。在1970年代,也没有理论可以和规范理论竞争。
那么,数学家是朝着物理乱射飞镖吗?数学家研究的众多结构中,总有一些一定可以有效的用来理解物理世界,不是吗?
过去几年,向粒子物理涌入的数学只能用海啸来形容。如果你不清楚弦论的发展,让我给你一个梗概:在1984年,如果理论物理学家能够自在的游走于陪集空间(coset space)、同伦群、同调系列(homology sequence)、异殊代数(exceptional algebra)这些概念之间,同事会认为他精通数学。但是四年之后,同一个人却会被弦论学者所鄙视,认为他在数学上是无可救药、失学又浅薄无知的人。
物理和数学
物理使用这么多数学是好事吗?我没有想法。因为想要证明这点,得先咽下去后才知道,看看弦论是否能解释世界。在此同时,如浪潮般涌入的数学却是完全合理的。为了探究普朗克尺度(Planck scale)的物理学,物理学家离实验支撑的距离还远得很,只剩下数学能指引我们。数学的这种影响方式,连威格纳也无从想像。
讨论数学在物理学中的角色时,我很喜欢讲法拉第(Michael Faraday)和麦克斯韦的故事[3]。法拉第出身贫乏,他自承数学是他的盲点,无法将他直觉的观念转化成精确的数学描述。相反的,麦克斯韦家世显赫,不论是数学还是其他方面,都受到当代最好的教育。不过在麦克斯韦开始做研究之前,他曾说:「我在(电学)领域中看不到数学,直到我读到法拉第的《电学的实验研究》。」事实上,麦克斯韦认为法拉第的数学缺陷反而是种好处,他写道:「于是法拉第 ...... 被隔绝于导致法国哲学家成就的思想路径之外,他必须使用他懂的符号自行解释现象,而不是采用当时知识份子的唯一语言。」
图片
法拉第
图片
麦克斯韦
麦克斯韦所谓的「符号」,指的是法拉第的「力线」(lines of force)。在稍早之前,麦克斯韦就曾说过:「[法国哲学家]泊松(Siméon Poisson)与安培(André-Marie Ampère)[关于电学]的著作内容形式充斥着专业的技术,想要推导出任何结果,学生必须受过严格的数学训练,对于具备年纪成熟这项好处的人,能不能接受这种训练实在很可疑。」是啊,我很确定现代处于「成熟年纪」的物理学家会觉得麦克斯韦的话一针见血。
图片
法拉第手绘的力线
法拉第和麦克斯韦的故事之所以有趣,是因为我们不清楚这个故事的寓意何在。我想大家会同意,属于法拉第宏大传统中的直觉,在物理学的发展中具有最高的重要性。但另一方面,当我们徘徊在普朗克尺度的土地上,还能够有什么直觉?别忘记,如果麦克斯韦缺少法国哲学家的方法——也就是微分方程——的话(对麦克斯韦来说是数学,对我是算术),他可能根本导不出光传播的理论。
我以另一段轶事[5][6],结束这段数学有效性的思辩之旅,姑且不论有效性是合理还是不可思议。有位年轻时认识爱因斯坦的女士告诉我,在一个美丽的春日,她和爱因斯坦走进一座繁花似锦的庭园,他们站着,默默注视着眼前的景色。最后,爱因斯坦说:「我们不值得享有这种美。」物理很美,藉由数学的有效性使它更美。我们值不值得享有这种美,这样想合理吗?
参考文献
[1] E.P. Wigner,The Unreasonable Effectiveness of Mathematics in the Natural Sciences, Commun. Pure Appl. Math.13(1960), 1--14. (中文翻译请见延伸阅读)
[2] R.W. Hamming,The Unreasonable Effectiveness of Mathematics, Amer. Math. Mon.87(1980), 81--90.
[3] A. Zee,Fearful Symmetry, Macmillan Publishing Companym, 1986.
[4] A. Zee,Symmetry in the Ultimate Design, to appear in a book edited by R. Kitchener.
[5] S. Asker, private communication.
[6] A non-physicist friend to whom I told this story immediately interpreted Einstein's reaction in terms of the collective guilt of physicists in connection with nuclear weapons. I prefer to interpret it at a deeper levelm in connection with the discoveries of ever larger symmetries in Nature's design.