施郁 | 规范理论一百年:n个诺奖得主的世纪缠绵
导读:
1918至1919年的一个错误理论开启了一个伟大征程,导致描述自然界三种基本力的理论框架,以及很多重要的物理学和数学成就。为这一征程作出贡献的很多物理学家后来获得诺贝尔物理学奖,也有相关数学家获得菲尔兹奖和阿贝尔奖。
撰文 | 施 郁(复旦大学物理学系教授)
● ● ●
全文分十一章:
1918至1919年的规范理论
量子论拯救规范理论
规范理论的重生
克莱因和泡利
杨-米尔斯理论
粒子物理标准模型与杨-米尔斯理论的复兴
实验给杨-米尔斯理论赋予生命
诺贝尔奖获奖演讲中的杨-米尔斯理论
对称性支配相互作用
10. 规范理论与数学
11. 规范理论的美与真
1. 1918至1919年的规范理论
1918年至1919年,位于苏黎世的瑞士联邦工业大学的赫尔曼·外尔(hermann weyl)发表了三篇文章,试图将电磁力纳入引力几何理论的框架 [1-4]。这就是规范理论的开端。外尔是20世纪最有影响的数学家之一。曾获得有“数学诺奖”之称的菲尔兹奖和阿贝尔奖的迈克尔·阿蒂亚(michael atiyah)爵士曾经告诉笔者,外尔是他的偶像之一。
赫尔曼· 外尔。图源:wikipedia
外尔的这三篇文章,以《引力与电》(gravitation and electricity)一文为主,该文发表于《普鲁士科学院院刊》[2]。正是在这个杂志上,爱因斯坦1915年发表了引力的几何理论,也就是广义相对论,揭示了引力本质上是物质所导致的时空的弯曲 [5]。
1905年,爱因斯坦提出狭义相对论。闵科夫斯基注意到,狭义相对论将时间和空间统一为四维时空。十年以后,爱因斯坦的广义相对论指出,物质使得时空弯曲,弯曲时空又决定物质的运动。
为了领会时空弯曲的含义,让我们想象一个球面。在球面上的某一点放一个箭头,箭头从这一点指向某个方向。然后我们将箭头的底端在球面上移动,移动过程的每一个瞬间,都保持箭头方向不变,这叫平行移动。然而,对于有限长度(非无穷小)的移动,箭头方向却变了。为了方便比较,我们可以让箭头底端沿着某个闭合曲线平行移动一圈,回到原来的位置,箭头的方向不再是原来的方向。这就是球面弯曲所导致的。在弯曲时空里,道理与此类似,任何一个矢量(既有大小也有方向,就像一个箭头)的平行移动可能改变它的方向,但是大小不变。
当时人们了解到,自然界有两种基本力,除了引力,就是电磁力,由电磁势决定。所以外尔自然地想将电磁力也纳入广义相对论的框架。他试图推广平行移动的观念,构想矢量平行移动时,不仅方向变化,大小也变化。对于无穷小的平行移动,矢量大小改变无穷小倍,外尔假设这个无穷小倍数正比于电磁势的无穷小改变。不难推导出,对于一个有限长度的平行移动,矢量大小就变成原来的大小乘以一个指数因子,指数正比于电磁势沿着路径的积分(也就是将每一点的电磁势累加)。这个改变矢量大小的指数因子依赖于平行移动所经过的路径,所以叫做不可积标度因子。
这个结论很奇怪。在相对论里,尺子大小和时钟快慢都可以看成矢量的大小。那么按照外尔的理论,两点之间的尺子大小和时钟快慢的改变居然取决于尺子和时钟沿什么路径移动!
这就是爱因斯坦在外尔《引力与电》一文后所作评论的内容。评论后面还发表了外尔篇幅很长但是没有说服力的答复,但是他承认自己“像野鹅一样追逐疯狂的概念”。
在外尔的这篇文章中,有一句话体现了外尔的思考方式(本文中的直接引文均为作者译自英文):
“电磁守恒定律与新的规范不变性联系起来,通过第五个任意函数表达。在我看来,这与能量动量原理的类似是对当前理论的最强论证——只要在纯粹猜想的情况下允许谈论论证。”
可以看出,外尔的信心源于他提出电磁守恒定律背后的不变性,或者说对称性。这里的守恒量并非今天我们所知的电荷(那需要修正后的规范理论)。外尔这里将对称性导致的守恒量与能量动量守恒相比较。这些都可以当成诺特定理的例子。诺特定理是说,对称性对应于守恒量。不知外尔当时是否已经知道也发表于1918年的诺特定理 [6]。当时诺特在哥廷根大学希尔伯特的麾下,但是五年前外尔就已经离开了。
2. 量子论拯救规范理论
量子论出现以后,1922年,外尔的朋友薛定谔猜测,可以在外尔的标度因子的指数里加上虚数单位i [7]。这样,标度因子就成了一个大小为1的复数,也就是量子力学波函数的相位因子。但是薛定谔当时还没有波函数的概念,只是笼统地说某个“长度”。后来人们发现,这个工作对薛定谔1926年创立波动力学起了启发作用 [8-10]。
也是在1922年,在经典理论中,卡鲁扎(theodor kaluza)将4维时空推广到5维时空,其中某些度规分量代表电磁势(度规是指两点坐标与它们之间距离的关系)。当理论不依赖于第5维坐标时,5维坐标变换退化为4维坐标变换和1维规范变换。
1926年,薛定谔通过4篇文章创立了量子力学的波动力学表述(因此分享1933年诺贝尔物理学奖)。他在第4篇文章中指出,电磁场中带电粒子的动量和能量算符必须包含电磁势 [11]。量子力学里,物理量要用算符表示,意思是对波函数进行运算。
同样是在1926年,克莱因(oskar klein)和福克(vladimir fock)分别讨论了卡鲁扎理论对应的波动力学 [12,13]。福克特别指出,波函数运动方程具有规范不变性,就是说,将波函数乘以相位因子,同时电磁势做一个相应的变换,运动方程依然成立 [13]。
1926年底,伦敦(fritz london)写了一封信给薛定谔,询问他1922年对规范因子的修改与他1926年波动力学的联系 [8-10]。然后伦敦自己写了两篇文章,将通常的波动力学与外尔的规范理论联系起来,将外尔的不可积标度因子改为波函数的不可积相位因子[14-15]。伦敦的工作没有福克的5维理论的额外负担。
3. 规范理论的重生
在伦敦和福克工作的铺垫基础上,外尔在1928年的《量子力学中的群论》一书 [16]和1929年的两篇文章中 [17-18],终于修正了他1918至1919年的理论,正式将标度因子改为相位因子,将标度不变性改为相位不变性,但是沿用了原来的名词“规范(eich)”。我们特意将他在1918年1919年间的不可积因子称作标度因子,因为标度因子和相位因子都称作规范因子。2019年恰好也是规范理论重生九十周年。
1929年的这两篇文章是外尔以美国普林斯顿大学访问教授的身份完成的。第一篇是发表于《美国科学院院刊》(pnas)的英文概要《引力与电子》(gravitation and the electron),里面出现了“规范不变原理”(principle of gauge invariance)。第二篇是德文文章,内容详尽,标题是《电子与引力》(elektronund gravitation)。两个标题与他1918年的《引力与电》(gravitation and electricity)颇为呼应。
规范不变原理当然就是外尔1929年文章中最重要的内容。在量子力学框架下,电磁学作为规范不变的后果被推导出来,规范不变性还导致电荷守恒。这里的规范变换已经不是一个实数的标度因子,而是相位因子(指数上有个虚数单位),规范不变性事实上是相位不变性。这就是我们今天熟悉的规范理论。
导致电荷守恒的规范不变是在整体规范变换(又称第一类规范变换)下,也就是相位变换与时空坐标无关,对每时每地的波函数作同样的相位变换。这可以看成诺特定理的例子,虽然外尔没有直接提到诺特定理。1929年,诺特定理已经广为人知。而导出电磁学的规范不变性是在局域规范变换(又称第二类规范变换)下,也就是说,相位因子依赖于时空坐标。
外尔1929年的文章仍然将引力和电磁力通盘考虑,但是现在需要考虑量子力学,出发点是引力场中的电子自旋。因此外尔讨论了二分量旋量理论(用两个波函数描述电子),包括具有手征性的外尔旋量(后来被称为外尔费米子)。
笔者发现特别有趣的是,在外尔的理论中,局域平直时空依赖于时空坐标,从而导致了一种联络,与时空弯曲的克里斯托弗联络相加,类似于后来人们所知的非阿贝尔规范势,而相应的黎曼张量类似于非阿贝尔规范场场强!
被誉为“物理学的良心”和“上帝的鞭子”的量子力学创始人之一泡利(wolfgang pauli,因泡利不相容原理独享1945年诺贝尔物理学奖)写了一封信给外尔 [19-20]:
“我面前是4月份的《美国科学院院刊》。里面的‘物理’栏目下不仅有你一篇文章,而且表明你现在在一个‘物理实验室’工作:听说给了你一个美国的物理教授职位。我欣赏你的勇气;因为不可避免的结论是,你希望不是用纯数学的成功来评价你,而是用你真实但是不愉快的对物理学的热爱来评价你。”
泡利。图源:wikipedia
外尔这篇文章引起泡利的反感是可以理解的:外尔1918年的文章是带着爱因斯坦的质疑一起发表的,泡利当年也反对 [4],现在居然卷土重来,再加上文章里面的二分量理论是违反宇称守恒的(宇称守恒等效于镜面对称)。后来,1933年,泡利在他著名的《物理学手册》的文章里仍然批评二分量理论。1957年1月,泡利听说吴健雄等人关于弱相互作用中宇称不守恒的实验后(弱相互作用是主宰粒子衰变的基本相互作用),先是表示不相信宇称不守恒,十天后读了论文,才改变看法。
但是泡利看了外尔1929年第二篇规范理论的文章后,态度完全变了,又写了一封信 [19-20]:
“与我上次难听的话相反,我上封信的主要部分已经被否定,特别是被你在《物理学杂志》上的文章否定。因此我后来后悔给你写上封信。研究了你的文章后,我想说我真正弄懂了你想做的(根据你在《美国科学院院刊》上的短文,情况不是这样)。首先让我强调我所完全赞同的方面:你将旋量理论纳入引力理论框架。”
“这里我必须承认你的物理能力。你早期用gik′=λgik的理论是纯数学,没有物理意义。爱因斯坦对你的批评与责备是有道理的。现在你的复仇时刻到了。”
1930年,外尔去哥廷根大学任教,成为他的导师希尔伯特的继任者。
泡利成了规范理论的支持者。在上面所说的他1933年《物理学手册》文章中,也介绍了外尔的规范理论 [21]。
也是在1933年,外尔收到普林斯顿高等研究院的教授聘书,他没有接受。后来德国政治局势恶化,他接受了普林斯顿高等研究院再次相聘。他在那里工作到1951年退休,后来在苏黎世和普林斯顿两地生活,以苏黎世为主。
虽然经典电磁学中也讨论规范和规范变换,但是这个名词的使用是在1929年外尔用量子力学修改规范理论之后 [22]。
4. 克莱因和泡利
质子和中子统称为核子,通过强核力结合成原子核。1922年,考虑到强核力与每个核子是质子还是中子无关,海森堡提出同位旋的概念,类似于自旋,将质子和中子表示成同位旋的两种基本状态,而在强核力下,同位旋守恒。1936年,汤川秀树提出强核力的介子理论,即核子之间通过交换介子而产生强核力,正如带电粒子之间的电磁力通过交换光子而实现。光子没有质量,所以电磁力是长程的,但是介子是有质量的,所以强核力只能局限于很短的距离。
数学上,外尔的规范变换属于u(1)变换,只有1个波函数作一个相位变换。而核子的同位旋变换属于su(2)变换,对应于两个同位旋状态的2个波函数作满足一定条件的变换。对于某种变换而言,如果连续作两次变换的结果与顺序无关,就叫阿贝尔的,否则就叫非阿贝尔的。u(1)变换是阿贝尔的,su(2)变换是非阿贝尔的。
1938年,克莱因在波兰的一个会议上提出一个包含引力、电磁力和强核力的统一理论[20,23],将上面提到的卡鲁扎-克莱因理论中对第5维坐标的无关性改为依赖于某个相位因子,其中第5维坐标出现在指数上。这个新理论中,某些度规系数成为具有su(2)非阿贝尔规范结构的矩阵。克莱因将此理论用于核子。克莱因并不要求该理论具有su(2)规范不变性。不过他评论说质量项可能不需要,质量也许可以来自某种自能,这个猜想有点后来的希格斯机制的精神。克莱因的报告没有引起与会者多少兴趣,后来又只是发表在会议文集,再加上二战的爆发,这个工作没有引起关注。
1953年在莱顿召开的洛伦兹-昂内斯会议上,普林斯顿高等研究院的派斯(abraham pais)为了研究粒子分类,提出一个基于同位旋的场论,将每个时空点推广为一个2维球面,试图将外尔的电荷守恒推广到同位旋守恒 [20,24]。派斯只考虑了整体规范变换,也就是说,su(2)变换与时空坐标无关。泡利在场,他评论道 [20,24]:
“我有个关于介子和核子相互作用的具体问题……我很赞成将守恒定律和不变性质与大自然在数学上的变换群联系起来。如果除了能量守恒和电荷守恒,核子数的守恒和核力的电荷无关确定无误,那么它们确实必须与自然定律的群论性质联系起来,正如派斯现在试图用数学表达的……与此相关,我想问,是否这个常数变换群(同位旋群)能够扩大,与电磁势的规范群类似,从而介子-核子作用与这个扩大的群联系起来……”
泡利是在问,能否将与时空坐标无关的同位旋su(2)整体变换改为依赖时空坐标的su(2)局域规范变换。他自己立即研究了这个问题。泡利熟悉规范理论,以前也研究过引力和电磁力的统一理论 [24],也赞成外尔将电子旋量理论与引力理论结合起来。
在1953年7月和12月给派斯的两封信中,泡利描述了自己的理论,题为“介子-核子相互作用与微分几何”(meson-nucleon interaction and differential geometry) [20,24,25]。他也用卡鲁扎-克莱因理论,但是采用了两个额外维度。在他的理论中,电磁势不是来自度规,而是来自克里斯托弗联络。泡利在这里没有写下规范场的拉格朗日量以及场方程,也没有正式发表这个理论。但他在1953年秋天做过相关演讲,后来他的学生整理了讲义 [24]。1954年泡利在给杨振宁的一封长信中说,他的学生在这个讲义里讨论了规范场的拉格朗日量 [26]。1953年12月,泡利给派斯的另一封信中说 [24]:
“如果试图给出场方程,……那么总是得到静止质量为0的矢量介子。”
着重标志是泡利本人所加。这里以及后来泡利与杨振宁的对话以及给杨振宁的长信反映出,泡利意识到规范粒子的质量是个麻烦。这是因为如果规范粒子有质量,理论的规范不变性也就失去了;而如果规范粒子没有质量,就意味着规范场可以将作用力传递无限远,但是这与强核力的情况不符。
5. 杨-米尔斯理论
杨振宁当时是普林斯顿高等研究院的年轻成员,是派斯的同事,但是1953年夏至1954年夏,他在布鲁克海文实验室访问。杨振宁曾经回忆 [27]:
“我在昆明和芝加哥做研究生时,认真学习了泡利关于场论的综述文章。我对电荷守恒与理论在相位变化下不变的关系印象非常深刻。后来我发现这些思想来源于外尔。印象更深的是,规范不变性决定了整个电磁相互作用。”
杨振宁接着回忆,在芝加哥读研究生时,他就开始尝试将规范理论推广到同位旋。2005年出版的《杨-米尔斯理论50年》(50 years of yang-mills theory)收入了杨振宁在1947年的三页笔记 [28],编者特霍夫特(gerardus ’t hooft)说 “这是一个当时在为规范不变性概念而努力的研究生的笔记,距1954年的杰作还有一段长路。” 1947年后杨振宁还进行了很多不成功的计算。
后来随着实验上越来越多的介子被发现,杨振宁认为需要一个写下相互作用的原理。所以1953年夏天在布鲁克海文实验室,杨振宁回到这个问题。当时,他与即将在哥伦比亚大学博士毕业的米尔斯(robert mills)共用一个办公室。这一次,两人终于完成了规范理论的非阿贝尔推广 [27]。
杨振宁和米尔斯。图片来源:《杨振宁选集》
1954年2月,杨振宁回到普林斯顿高等研究院作学术报告,介绍这个理论 [27]。泡利在听众中,那个时期他与老朋友外尔一样在苏黎世与普林斯顿高等研究院之间“振荡”。犀利的泡利不断问杨振宁规范粒子的质量。杨振宁回答说不知道,曾经研究过,但是没有明确结论。泡利说:“这不是充分的理由。”第二天,杨振宁收到泡利的短信,去找泡利。泡利建议杨振宁去看薛定谔关于引力场中狄拉克方程的文章。杨振宁发现,里面的方程一方面与黎曼几何有关,一方面与他和米尔斯的方程类似 [27]。这个月,泡利还写了一封长信给杨振宁,将自己之前的结果在平直时空和其他条件下简化,与杨-米尔斯的结果一致,并说他的学生讨论了规范场的拉格朗日。泡利最后写道 [26]:
“但是我曾经而且仍然对粒子静止质量为零的矢量场感到反感和泄气(我不将你的‘复杂’之说当回事),而且也存在电磁场的特性导致的群的困难。”
杨振宁和米尔斯的工作与广义相对论完全无关,没有额外维度的负担。在他们的文章之前,除了伦敦的文章和泡利的综述,研究不可积规范因子和规范理论的论文都将规范场与引力纠缠在一起,这有一定误导性,但有一定技术上的优势。杨振宁和米尔斯在明确的物理动机下,提出清晰的非阿贝尔规范理论。但是因为他们当时不了解规范场的几何意义,不知道场强可以直接从协变导数的对易子得到。而克莱因和泡利的工作是在弯曲时空理论的框架中,所以很自然地通过协变导数的对易子得到场强。不过笔者注意到,在泡利当初介绍外尔规范场的综述文章中,对于通常的平直空间,也用协变导数的对易子表示了场强 [21]。杨振宁没有留意到这一点,否则推广的过程会顺利很多。
尽管受到泡利的批评,杨振宁依然认为想法很美,应该发表。这体现了巨大的勇气,因为泡利的批评有强大的杀伤力。比如1925年,乌伦贝克(george uhlenbeck)和哥德斯密特(samuel gouldsmit)提出电子具有自旋。这个贡献没有得到诺贝尔奖,因为克罗尼格(ralph kronig)大半年前提出同样想法,但在泡利、海森堡和克雷默斯(hendrik kramers)反对下没有发表。
2012年,杨振宁说 [29]:
“这篇文章是我一生最重要的工作。虽然未竟全功,但是决定当时发表是极正确的。”
1954年,杨振宁和米尔斯其实发表了两篇文章,提出杨-米尔斯理论。第一篇只是杨振宁在当年美国物理学会四月会议所作报告《同位旋守恒与推广的规范不变性》(isotopic spin conservation and a generalized gauge invariance)的摘要,发表在《物理评论》(physical review),很好地总结了杨-米尔斯理论的物理思想[30]:
“同位旋守恒与电荷守恒类似,显示存在一个基本的不变定律。在后者的情况,电荷是电磁场的源;这里的一个重要概念是规范不变性,它紧密相关于(1)电磁场的运动方程,(2)流密度的存在,(3)可能存在的带电的场与电磁场的相互作用。我们尝试将这一规范不变性的概念推广,以运用于同位旋守恒。结果表明,这个推广很自然。与电磁场类似的场是一个矢量场,即使其他场不存在,也满足非线性方程。(与电磁场不同,这个场具有同位旋,是它自己的源。)流密度自动存在,这个场与其他任意同位旋的场的相互作用具有确定形式(除了与电动力学中的反常磁矩作用相类似的可能项)。”
他们另一篇文章是详细的论文《同位旋守恒与同位旋规范不变性》(conservation of isotopic spin and isotopic gauge invariance),于6月28日被《物理评论》收稿。此文的摘要强调了局域变换 [31]:
“本文指出通常在同位旋旋转下的不变性原理与局域场的概念不融洽。本文探讨在局域同位旋旋转下的不变性。这导致建立了一个同位旋规范不变性原理和某个b场粒子的存在,它与同位旋的关系类似于电磁场与电荷的关系。b场满足非线性微分方程。b场的量子是自旋为1、同位旋为1、电荷为±e或0的粒子。”
文章最后说明,对于规范粒子的质量问题,还没有满意答案,并指出质量为零的选项面临发散的困难。
我们顺便提一下,整体对称也是合法的,不与规范对称矛盾,两种对称都存在,前者也可看成后者的特例,事实上电荷守恒正是整体相位变换不变性的后果。
虽然是一个很美的理论,但是杨-米尔斯理论没有能立即用到物理上。当时除了在普林斯顿,杨振宁只在哈佛大学作过一次介绍这个工作的演讲。
2012年,杨振宁评论 [32]:
“最近一些年,经常有人问我,为什么1954年泡利没有发表他关于规范场的计算,而米尔斯和我发表了。我认为答案在于我们关于以下两者不同的价值判断:(a)规范不变性的美和力量,以及(b)规范玻色子的质量问题。对于米尔斯和我来说,中心动机来自(a),正如我们的短摘要(译注:上文已引述)所表明的。至于(b),米尔斯和我探讨了各种可能性,在我们1954年的文章最后总结道:‘因此我们没有得到关于b量子的质量的任何结论。’也就是说,我们将(b)当作未来的问题。对于泡利来说,规范不变性的美显然没有被充分领会。他对整个想法有持续的负面态度。参见文章[85j]的脚注34。因此(b),质量问题,对于泡利来说,成为中心和决定性的。”
这里提到的[85j]就是杨振宁的《外尔对物理学的贡献》[4],里面的脚注34指出,泡利生前最后一些年对规范场的思想持负面态度,并提到1956年泡利曾经为他1921年的文章《相对论》写过一系列后记,其中关于“外尔的理论”的后记不再如他1921年的德文原文那样正面。
总之,杨振宁和米尔斯成为非阿贝尔规范理论的创立者,非阿贝尔规范理论也被称为杨-米尔斯理论。1999年,在美国物理学会成立100周年之际,杨振宁当初的同事和见证人派斯写了理论粒子物理的历史综述,其中写道 [33]:
“1954年,两篇精彩的短文标志着非阿贝尔规范理论的开端(译注:派斯在这句话后面引用了杨振宁和米尔斯的两篇文章)。它们处理一种全新的强相互作用,由零质量矢量介子传递。这个工作引起很大兴趣,但是如何应用这些深奥的想法是另一回事,那时没有矢量玻色子,更不用说零质量的矢量玻色子。问题一直被搁置到1970年代。”
杨-米尔斯理论的发表使得很多物理学家开始关注这个问题,成为一个候选理论,虽然并没有立即成功解决具体物理问题。杨振宁回忆:“1950年代后期,规范理论被用到强相互作用和弱相互作用。1960年,樱井(jun john sakurai)发表了一篇很热切的文章,提出强相互作用的非阿贝尔规范理论。” [27] 但是杨振宁认为樱井的做法破坏了规范不变性这一规范理论中最美妙的观念,认为不应当马马虎虎地将规范理论变为唯象的东西[34]。1961年,格拉肖 (s. glashow) 如樱井一样,硬行假设规范粒子具有质量,提出一个具有u(1)× su(2)对称性的模型,以统一电磁相互作用和弱相互作用。
另一方面,杨-米尔斯理论也引起一些纯理论的兴趣。1960年代,费曼(r.p.feynman)、德维特(b. dewitt)、波波夫(v. n. popov)和法捷耶夫(l. d. faddeev)研究了杨-米尔斯理论的量子化。
6. 粒子物理标准模型与杨-米尔斯理论的复兴
后来,经过其他很多物理学家多年的努力,在加入其他思想元素之后,杨-米尔斯理论成为粒子物理标准模型的理论架构。描述的对象有别于1954年时的设想。质子和中子不再是基本粒子,同位旋守恒只是近似的。轻子和夸克是基本粒子。核子由夸克组成,核子之间的强核力来自夸克和胶子的强相互作用。基本相互作用包括强相互作用以及统一了电磁和弱相互作用的“电弱相互作用”,它们分别由一个杨-米尔斯理论描述。
粒子物理标准模型。来源:wikipedia
除了规范对称性,粒子物理标准模型的另一个主要思想是自发对称破缺。这个思想最早出现在凝聚态物理中,特别是超导理论中,1960年由南部阳一郎(yoichiro nambu)首先引入粒子物理。他指出,真空不一定具有能量函数的对称性。
1963年,安德森(p. w. anderson)借鉴超导理论,指出规范对称的自发破缺会导致规范粒子获得质量。1964年,布劳特(r. brout)和英格莱特(f. englert),希格斯(p. w. higgs),以及稍后的古拉尼克 (g. guralnik)、海根 (c. r. hagen) 和基堡(t. kibble)三组研究者指出,在相对论场论中,规范对称的自发破缺使得规范粒子获得质量。这个机制也导致有质量的希格斯粒子的产生。正如杨振宁曾经评价的那样[34]:
“自发破缺的观念既解决了规范粒子的质量问题,又没有破坏对称精神”。
1967年,基于规范对称的自发破缺,作为轻子的模型,温伯格提出具有u(1)×su(2)规范对称性的电弱理论。萨拉姆在一个会议上也独立提出这个理论,并首次采用“电弱理论”之名[35]。自发对称破缺使得电弱作用的规范粒子(带1个正或负的单位电荷的w±和不带电的z0粒子)获得质量,理论此后的部分与格拉肖1961年建立在人为假设基础上的理论一致。1971年,温伯格又将此理论用于夸克。1971年至1972年,特霍夫特和维尔特曼(m. veltman)证明了杨-米尔斯理论的可重整化,这是一个重大突破,表明了电弱理论是一个自洽的量子场论。
粒子物理标准模型还有一个主要思想是所谓的渐进自由。1973年,格罗斯(david gross)和韦尔切克(frank wilczek),以及普利策(david politzer)发现杨-米尔斯理论具有渐进自由的性质,也就是说,距离越短,相互作用越弱。特霍夫特在前一年得到这个结果,但是没有发表。渐进自由的发现确定了量子色动力学的物理意义。这是弗里兹希(h. frizsch)和盖尔曼(m. gell-mann)1972年提出的、具有su(3)规范对称性的杨-米尔斯理论,通过被称作色的自由度描述强相互作用,其规范粒子就是胶子。在su(3)变换中,3个波函数作符合一定条件的变换。后来,格罗斯和韦尔切克以及温伯格提出,量子色动力学的规范对称没有破缺,因此胶子质量为零。轻子和希格斯粒子无色,因此不参与强相互作用。
1972年,小林诚(makoto kobayashi)与益川敏英(toshihide maskawa)在电弱理论框架中,提出一个3代共6种(这个种类叫做味)夸克微弱混合的模型,解释实验上观测到的弱相互作用的cp对称性破坏(这里的对称性破坏不是前面谈的自发破缺)。c指电荷共轭,就是在数学上将粒子变换为它的反粒子,p指宇称变换,cp指同时作着两个变换。1956年,李政道和杨振宁的理论分析表明,弱相互作用中宇称是否守恒有待实验检验,然后吴健雄通过钴60的β衰变实验,发现弱相互作用中p和c都是不对称的,李和杨因此获得1957年诺贝尔物理学奖。1964年,克罗宁(james cronin)和费奇(val fitch)在中性k介子的衰变中发现,cp也是不对称的,他们因此获得1980年诺贝尔物理学奖。
1974年,威尔逊(kenneth geddes wilson)发明了格点规范场论,通过将时空分立化,进行非微扰的计算。他1982年因为用重整化群研究相变获得诺贝尔物理学奖。
1970年左右,杨振宁认识到规范场的几何意义和不可积相位因子的重要性。他1974年发表了规范理论的积分形式,并提出引力就是一种规范场 [36]。1975年,杨振宁和吴大峻用不可积相位因子给出规范场的整体描述,并将规范理论与纤维丛理论的基本概念相对应 [37],促进了数学与物理学此后在这方面的成功合作。在此背景下,1985年和1987年,杨振宁在外尔和薛定谔的百年诞辰纪念会上讨论了相关的历史 [4,9]。
7. 实验给杨-米尔斯理论赋予生命
外尔从规范不变性得到电磁理论,窥视到大自然理论结构的一角,但是电磁理论早就从大量实验中被物理学家总结出来,由麦克斯韦集大成。杨-米尔斯理论能否成为描述基本相互作用的理论框架、标准模型正确与否都需要接受实验的检验,因此实验给杨-米尔斯理论赋予了生命。实验上的验证也给很多为建立标准模型作出重要贡献的物理学家带来诺贝尔物理学奖。
当初杨振宁和米尔斯的工作就受到实验上发现大量介子的驱动。介子先是在宇宙线中发现,1953年布鲁克海文实验室的质子同步加速器 cosmotron 投入运行后也发现很多介子。杨-米尔斯理论在提出后受到质疑,则是由于理论中的规范粒子当时在实验上不存在。
1970年代,电弱理论预言的中性流在欧洲核研究组织(cern)、费米实验室和斯坦福直线加速器实验室(slac)的很多实验中得到证实,因此,格拉肖、萨拉姆和温伯格分享了1979年的诺贝尔物理学奖。
格拉肖(glashow)、萨拉姆(salam)、温伯格(weinberg)。
图源:http://www.boiledbeans.net
1983年,电弱理论中的规范粒子w±和z0粒子在cern被发现,因此鲁比亚(carlo rubbia)和范德米尔(simon van der meer)分享了次年的诺贝尔物理学奖。w±、z0乃至其他粒子具体性质的计算(包括1995年才在费米实验室发现的顶夸克的质量)依赖于特霍夫特和维尔特曼的规范场重整化理论,因此他们“因澄清电弱理论的量子结果”而分享了1999年的诺贝尔物理学奖 [38]。
实验表明夸克不能孤立存在,只有在高能量时才能观测到,所以需要一个具有渐进自由性质的强相互作用理论。格罗斯和韦尔切克以及普利策的计算表明杨-米尔斯理论具有这样的性质,他们分享了2004年的诺贝尔物理学奖。量子色动力学经受了很多实验的检验,比如,用粲夸克及其反粒子的束缚态解释j/ψ粒子的行为,预言电子-质子深度非弹性散射偏离比约肯(james bjorken)标度并得到实验证实,以及对夸克喷注现象的解释。1968年,费曼曾用部分子模型解释比约肯标度,部分子很快被认为就是夸克 [39]。
南部阳一郎与小林诚(kobayashi makoto)和益川敏英(toshihide maskawa)的工作都使得规范对称框架下的标准模型能够解释不对称的实验事实,因此他们分享了2008年的诺贝尔物理学奖。1972年,小林诚和益川敏英的模型提出来的时候,只有3种已知的夸克。1964年比约肯和格拉肖曾提出第4种夸克,称为粲夸克。1970年,格拉肖、伊利波洛斯(jean iliopoulos)和玛雅尼(luciano maiani)用电弱理论表明,粲夸克的存在可以解释在弱相互作用下,奇异数的改变不超过1。1974年,丁肇中组和里希特(b.richter)组发现j/ψ粒子,确认了粲夸克的存在乃至夸克模型的真实性,被称为“十一月革命”。丁肇中和里希特分享了1976年诺贝尔物理学奖。1977年,伯尔(martin perl)组发现τ轻子(伯尔分享了1995年诺贝尔物理学奖),表明轻子有3代,莱德曼(leon lederman)组发现第5种夸克。这样,小林诚和益川敏英的模型开始得到重视。第6种夸克就是1995年才发现的顶夸克。
2012年, cern发现了希格斯粒子,次年英格莱特和希格斯分享了诺贝尔物理学奖(布劳特已于2011年去世)。
希格斯粒子的实验发现。来源:wikipedia
8. 诺贝尔奖获奖演讲中的杨-米尔斯理论
很多相关诺贝尔物理学奖获奖演讲中,都提到杨-米尔斯理论或者非阿贝尔规范理论[38]。笔者在“杨-米尔斯理论60周年”国际会议上曾将这些片段集中展示 [40],它们足以描绘一段精彩纷呈的历史。
格拉肖(1979年获奖):
“今天我们有一个被称作基本粒子物理学的‘标准理论’,其中强、弱和电磁相互作用都从局域对称原理给出……电磁力不仅是由光子传递,而且从局域规范不变性的要求得到。这个概念在1954年被用到非阿贝尔局域对称群。”
温伯格(1979年获奖):
“到更复杂的群的推广是1954年在杨和米尔斯的一篇重要文章中作出的,他们展示了怎样构造一个强相互作用的su(2)规范理论……在很大程度上,我们目前关于基本粒子相互作用的细节性理论可以通过演绎法理解,作为对称原理和对付无穷大的可重整化原理的后果。”
维尔特曼(1999年获奖):
“因此我作出结论,杨-米尔斯理论大概是对于重整化来说最好的理论……然后从探究杨-米尔斯理论中的费曼图开始,我确定了很多发散的消失,只要这些图的外腿在质量壳上。”
特霍夫特 (1999年获奖):
“1971年,我计算了场论的标度性质,我尝试的第一个理论是杨-米尔斯理论……量子色动力学是一种规范群su(3)的杨-米尔斯理论,它可以作为强相互作用的理论。”
格罗斯(2004年获奖):
“特霍夫特关于杨-米尔斯理论的可重整性的杰出工作将非阿贝尔规范理论重新介绍到业内……我们判断可以计算杨-米尔斯理论的贝塔函数……普利策作了他关于杨-米尔斯理论贝塔函数的计算……我们的摘要如下:我们证明了一大类非阿贝尔规范理论直到可计算的对数修正,具有自由场的渐进行为……他的摘要如下:具体计算表明,对于任何杨-米尔斯论和很多有费米子的杨-米尔斯理论来说,微扰论很好……”
南部阳一郎(2008年获奖):
“因此电磁学的漂亮性质被扩展到su(2)非阿贝尔规范场。”
小林诚 (2008年获奖):
“在规范理论的框架中,味混合源于规范对称性与粒子状态的不一致。”
益川敏英 (2008年获奖):
“我们开始在电弱统一规范理论中的四重夸克模型基础上研究cp破坏。”
英格莱特(2013年获奖):
“因为短程相互作用的正确理论显然要求有量子自洽性,我们自然地被引到量子电动力学的推广,即杨-米尔斯理论,作为相应的长程作用的模型……为了在杨-米尔斯理论框架中将长程作用转变为短程作用,只需要给这种广义的光子赋予质量,正如我们刚刚所提的,这个做法表面上是被局域对称性禁止的……因此南部-戈德斯通玻色子的消失是局域对称性的后果……因此原本的南部-戈德斯通玻色子与规范场的耦合一定使得后者获得质量。这就是布劳特-英格莱特-希格斯机制的要点。”
希格斯(2013年获奖):
“安德森说‘戈德斯通零质量困难并不严重,因为我们也许可以用杨-米尔斯零质量问题来抵消它’……施温格1962年写了文章来推翻坊间的一个传说,即规范不变性单独就要求光子质量为零……他提供了包含有质量的‘光子’的一个规范理论的性质……7月18-19日,我想到,施温格对规范理论的表述方式挖了用来证明戈德斯通定理 的公理的墙脚。因此规范理论也许可以挽救南部的计划。”
9. 对称性支配相互作用
1955年12月,外尔在苏黎世去世。此前不久,外尔将1918年的《引力与电》收入他的文集,并写了个评论 [20]:
“我的理论的最强论证是,规范不变性对应于电荷守恒,正如坐标不变性对应于能量和动量守恒。后来量子理论引入电子-正电子场的薛定谔-狄拉克势ψ;它具有有实验基础的规范不变性原理,保证了电荷守恒,而且将ψ与电磁势ϕi联系起来,正如我猜想的理论将引力势gik与ϕi联系起来,而且用已知的原子单位而非宇宙学单位作为ϕi的测度。我认为毫无疑问,规范不变性原理的正确领域在这里,而非如我1918年所相信的,在电磁力与引力的交融上。”
这里外尔提到了规范不变性与电荷守恒的对应关系。这在他1918年的文章里没有,但是在他1929年的文章以及泡利对规范不变性的介绍中都提到了,当时已经广为人知。
将外尔的此段总结与杨振宁和米尔斯文章的摘要相对照,更显有趣。用规范原理导出电磁学是在已经了解电磁学规律之后,只是厘清理论结构,但是正如坐标变换不变性决定了未知的引力,非阿贝尔规范不变性决定了未知的规范相互作用。
1979年,在纪念爱因斯坦诞辰100周年的一个会议上,杨振宁总结了“对称性支配相互作用”原理,指出第一个例子是爱因斯坦从坐标变换不变性得到广义相对论,第二个例子是外尔从阿贝尔规范变换不变性得到电磁学,第三个例子是从非阿贝尔规范变换不变性得到非阿贝尔规范场 [41]。今年也是“对称性支配相互作用”这一概括提出40周年。
在纪念外尔百年诞辰的演讲中,杨振宁说 [4]:
“经过理论和实验的发展,对称性、李群与规范不变性现在被确认在决定物理宇宙的基本力上扮演必不可少的角色。我将此原理称作对称性支配相互作用。”
戴森 (freenman j. dyson) 在普林斯顿高等研究院度过漫长的事业生涯,与外尔和杨振宁都很熟悉,是杨-米尔斯理论的另一位见证人。戴森曾经说 [42]:
“外尔离开普林斯顿不久,杨振宁从芝加哥过来,搬进了外尔的老房子。杨取代外尔,成为我这一代物理学家的领头鸟。”
戴森继续评论道:
“对称性支配相互作用的思想是杨振宁对外尔的评论(译注:指外尔所说的“规范不变性对应于电荷守恒,正如坐标不变性对应于能量和动量守恒”)的推广。外尔观察到规范不变性与物理守恒定律密切相关。外尔不能更进一步,因为他只知道对易的阿贝尔场的规范不变性。杨通过引进非阿贝尔规范场,做出强得多的联系。通过非阿贝尔规范场产生非平庸的李代数,场之间的相互作用形式被唯一确定下来,因此对称性支配相互作用。这个思想是杨振宁对物理学最大的贡献。”
2002年,杨振宁总结20世纪理论物理的三个主旋律:量子化,对称和相位因子[43,44]。
杨振宁先生曾经告诉笔者:
“1950年代,外尔每年来普林斯顿高等研究院只有几周。我与他的接触限于鸡尾酒会。我肯定他不知道我发表了一篇规范理论的文章。在我这边,我那时不知道他还对规范理论感兴趣。显然奥本海默和泡利都没有将我和米尔斯的文章告诉外尔。”
10. 规范理论与数学
“对称性支配相互作用”的三个例子体现了物理学理论之大美。另一方面,这三个例子又都体现了理论物理与数学的密切关系。广义相对论对应的数学黎曼几何(弯曲空间的几何)在十九世纪上半叶就由高斯(karl friedrich gauss)和黎曼(bernhard riemann)师徒创立,然后里奇(gregorio ricci)和乐维-齐维塔(tullio levi-civita)师徒发明了张量微积分这个分析黎曼几何的工具。爱因斯坦开始创立广义相对论时,他的同学格罗斯曼(marcel grossmann)告诉他,合适的数学就是黎曼几何。
关于规范理论的数学,杨振宁曾经写道 [41]:
“1975年,带着对于规范场就是纤维丛上的联络这一事实的深刻印象,我驱车前往位于伯克利附近el cerrito的陈省身家……当我们的交谈转移到规范场时,我告诉他我终于从吉姆·赛蒙斯(jim simons)那里了解到纤维丛理论和陈-韦伊(weil)定理的美。我说我觉得惊奇,规范场正是数学家不考虑物理世界而研究出的纤维丛上的联络。我接着说,‘这让人既激动又困惑,因为你们数学家凭空想出这些概念。’他立即抗议,‘不,不。这些概念不是凭空想出来的。它们是自然和真实的。’ ”
阿蒂亚曾经写道 [45]:
“1977年以后我的兴趣转向规范理论以及几何与物理的相互作用……1977年的激励来自两个源泉。一方面,艾沙道尔·辛格(isadore singer)告诉我杨-米尔斯方程,通过杨的影响,它正在向数学圈渗透。”
在杨振宁和吴大峻1975年的《不可积相位因子概念和规范场的整体形式》中 [37],有一个“字典”,把规范理论的基本概念“翻译”成纤维丛理论的基本概念。其中,规范理论中的源对应一个问号,因为当时数学家还没有研究与源对应的概念。无源情况的一种解是自对偶解,又叫瞬子解,这是只有单个奇点的极小作用量解,由贝拉凡(a. belavin)、普利亚科夫(a. polyakov)、施瓦茨(a. schwartz)和图普金(y. tyupkin)首先得到。
阿蒂亚与合作者研究了瞬子解的分类。他与希钦(nigel hitchin)和辛格合作,运用阿蒂亚-辛格指标定理(两人因此获得2004年阿贝尔奖),计算了瞬子模空间的维数。
阿蒂亚关于杨-米尔斯与规范理论的一个系列学术报告激发了凯伦·柯斯库拉·乌伦贝克(karen keskulla uhlenbeck,keskulla是婚前姓,她第一个丈夫的父亲就是自旋提出者之一乌伦贝克)对规范理论的兴趣。她将杨-米尔斯方程表示成一个椭圆系统,导致她所谓“曲率受限于lp的联络”的紧致定理,以及“被戳破的4维球上的杨-米尔斯方程的可去除奇点”的理论。她还证明,任何具有有限作用量和孤立奇点的解处于一个su(2)纤维丛上。陶布斯(clifford taubes)研究了瞬子模空间的边界和自对偶4维流形的粘结。
在阿蒂亚、凯伦·乌伦贝克和陶布斯等人工作基础上,唐纳森(simon donaldson)用瞬子模空间研究了4维微分流形的拓扑,得到了唐纳森定理,并与费里德曼(freedman)定理结合,发现4维欧氏空间上存在奇异微分结构,由此获得1986年菲尔兹奖。凯伦·乌伦贝克和丘成桐发现,复n维流形上的稳定全纯矢量丛上存在厄密杨-米尔斯联络。
威腾(edward witten)用规范场论(特别是超对称杨-米尔斯理论)研究低维拓扑等数学问题,他是唯一获得过菲尔兹奖的物理学家(因为证明了广义相对论中的正能量定理)。这说明广义相对论和规范理论都能反哺数学。
关于杨-米尔斯理论的数学,凯伦·乌伦贝克有过一段有趣的评论 [46]:
“规范理论怎么在几年内在数学中出现并成功?基本的数学要素都有了(纤维与矢量丛,联络,陈-韦伊理论,德拉姆上同调,霍奇理论)。事后想来,杨-米尔斯方程正等着被发现。但是数学家不能自己创造它们。规范场论是个领养的孩子。”
本文排版期间(2019年3月19日),“因为对几何偏微分方程,规范理论和可积系统的开创性贡献,以及在分析,几何和数学物理上的基本影响”,凯伦·乌伦贝克获2019年阿贝尔奖 [47]。
11. 规范理论的美与真
外尔曾经半开玩笑地对戴森说 [42]:
“我总是试图将真与美统一起来,但是如果我必须二者选一,我通常选择美。”
外尔对规范对称的执着深刻地反映了这一点。所幸,规范对称是美的,也是真的。安德森曾经说过 [48]:
“一个真正美的科学群是粒子物理的规范原理:所有已知的相互作用都是规范作用,将粒子耦合起来的力来自对称性,而不是反过来。”
爱因斯坦在广义协变原理的指导下成功创立广义相对论,乃至他后来对统一场论的执着,充分体现了他对自然定律美的信心。他在创立广义相对论的论文里写道 [49]:
“掌握它的人都不能逃脱它的魅力。”
对于物理学之美的追求贯穿了杨振宁的研究工作 [50],也反映在他对非阿贝尔规范理论的执着。杨振宁曾经感叹 [34]:
“一个科学家做研究工作的时候,当他发现到,有一些非常之奇妙的自然界的现象,当他发现到,有许多可以说是不可思议的魅力的自然结构, 我想,应该描述的方法是, 他会有一个触及灵魂的震动。”
泡利对规范理论的态度的演变则反映了他求真的一丝不苟。在泡利去世60周年之际,我们向这位天才大师致以深深的敬意。
非阿贝尔规范理论的美使得1954年的杨振宁相信它包含一定程度的真,尽管暂时不能解决规范粒子质量问题。杨振宁和米尔斯的论文最后关于这个问题的讨论和结论“我们不能对b量子(译注:指规范粒子)的质量作出任何结论” [31]富有预见性,因为后来发现规范粒子可以通过规范对称自发破缺而获得质量(w±和z0),也可以无质量(胶子)。将来标准模型被超越后,很可能规范理论依然重要。
规范理论最初提出后立即被否定,后来得到重生;非阿贝尔规范理论提出后立即遭到质疑,后来在加入其他思想元素后得到复兴,成为粒子物理标准模型的构架。历史表明,美与真能否统一,由实验决定。同样,理论的进一步发展,比如弄清规范对称自发破缺的奥秘、探索规范对称的起源、搞懂为什么中微子质量不为零,等等,也需要实验的进步。
本文在《物理文化与施郁世界线》(physicalculture)分章转载。