1. 引言
规范对称耦合 [1] [2] [3] [4] 是自然界四种基本相互作用(强、弱、电和引力)的拉格朗日密度的基本结构特点,它也是基本相互作用量子场论可重整性理论所需要满足的前提 [5] [6] [7] 。作为四种基本相互作用理论之一的麦克斯韦电磁场论是人类历史上第一个完整的规范相互作用理论,尽管它在1860年代正式诞生时人们并没有依靠“规范对称性”去建立它。自狭义相对论建立之后,借助牛顿引力理论、狭义相对论和黎曼微分几何三者作为立论基础,1915年爱因斯坦创建了引力的几何化理论即广义相对论。爱因斯坦的工作使得物质、能量、时空和引力统一在了一起,对物质世界获得了深刻的认识。爱因斯坦于是提出了“统一场论(unified field theory)”愿望,希望把万有引力和电磁力统一在一起。受爱因斯坦广义相对论和“统一场论”风尚的启示,魏尔在1918~1919年提出了一种尺度(标度)变换,作为对黎曼几何和广义相对论的推广,发现该引力理论在当保持这种标度变换下的不变性(对称性)时,电磁相互作用的存在是一种内禀(内在自然的)要求 [8] [9] [10] 。不过,魏尔的变换会使得量杆尺度与其存在的历史有关,违反经验 [9] 。但是在1925~1926年量子力学诞生后,当人们把魏尔的实数标度变换因子理解为对波函数的复数相位因子变换,借壳还魂,魏尔的理论获得了新生。此时,电磁场是一种规范场,这是对电磁场的进一步认识。由于在历史上,电磁学毕竟不依靠魏尔的“局域规范对称性”来建立,所以,规范对称性对于电磁学的重要性就没有像对后来发现的强、弱相互作用来得那样大 [5] [6] [7] 。但是,在近代物理学中,人们只有借助规范对称性才可以确定强、弱这两种基本相互作用的主要或核心数学结构,这就是杨–米尔斯非阿贝尔规范场论 [1] 。但这种广义的电磁规范场 [1] [11] [12] [13] ,其提出历史也曾颇为曲折,包括了克莱因、泡利的“高维引力”路子和杨–米尔斯路子 [14] [15] 。
规范理论中的规范场是基本的动力学物理场 [5] [6] [7] ,不过规范场并非只在基本相互作用领域作为自然界秉性出现。在不少应用物理系统尤其是在人为设计的电磁学和量子光学物理系统中会呈现人造的(artificial)或者合成的(synthetic)规范势 [16] 。本文作者根据自己以往研究经验,列举了一些电磁光学系统内的等效规范势例子。这些系统包括横截面非均匀波导系统、光–原子相互作用系统、各向异性电磁介质系统等。有了这样的等效的人造规范势,拓扑几何相位 [17] 、等效Aharonov-Bohm效应 [18] 等也会产生。需要指出的是,以上电磁光学中的人造规范势本身无拉格朗日动能项,它们作为一个物理背景场而存在、驱动其它场和波运动。在本文中,我们也研究具有拉格朗日动能项的等效规范场,即五维卡鲁扎–克莱因(Kaluza-Klein)理论中的衍生(呈展)规范场。在卡鲁杂–克莱因理论中,五维度规中的高维和低维之间的非对角分量被解释为四维电磁势,高维的希尔伯特–爱因斯坦引力作用量密度可以产生普通四维时空中的电磁场拉格朗日量密度,从而爱因斯坦引力理论与麦克斯韦电磁场论可以被统一起来。在该框架下,电动力学基本内容(电磁场作用量密度、电磁场方程、荷电粒子作用量密度和运动方程)可以从引力作用量密度、高维爱因斯坦引力场方程、高维时空线元、短程线方程这些高维引力理论核心构件分别推导出来。卡鲁扎–克莱因理论利用高维空间来统一基本相互作用的思想,在现代物理学(如弦论与M理论)中也被采纳,即高维统一是基本范式,它产生了深远影响 [19] 。
本文是一篇研究札记,介绍规范场论有关专题如电磁学和量子光学中的人造(synthetic)规范势(和人造“磁学”)与微分几何中的呈展(emergent)规范场(和引力–规范统一)的理论研究状况,评述总结了本作者的一些研究结果包括对一些课题前途的展望,对电磁学、量子光学、引力场论领域一些研究课题作了入门介绍,希望在一定程度上有利于拓展一些在人工电磁设计结构、光学电磁理论、微分几何之场论应用的研究人员的视野。本文介绍的重点是为了说明,规范场除了作为理论原生的基本动力学场(如在粒子物理学中的标准模型)以外,还可以“人造”(synthesis)和“呈展”(emergence)两种方式作为非基本、非原生的动力学场的身份出现。前者在一些应用领域(如电磁学、光学、凝聚态物理学)中吸引了不少研究人员的注意,后者则是以“引力–规范统一”为目的,在微分几何和广义相对论中以高维引力规范场的身份展现出来(它既可以被称为“呈展”规范场,意指由高维引力场呈现展示出来,也可以被称呼为“衍生”规范场,意指从母体中演变而产生。此处母体为高维空间引力场,杨–米尔斯规范场在本质上是引力场)。本文还对规范场论一些早期历史(如1918~1919年魏尔的规范场论、1921和1926年的卡鲁扎–克莱因关于引力和电磁力的高维统一理论、1938年克莱因的矢量规范理论和电磁力–核力统一之雏形理论等)进行评述,管中窥豹,部分领略到“20世纪物理学经常从错误的模型得到正确的理论”这一光辉激荡的岁月历史风貌。
关于本专题行文的一些说明:由于篇幅所限原因,本专题包含“规范场论札记”(I)和(II)两文。第(I)文主要包括光学和电磁学中的人造规范场(包括了作者本人的一部分研究)和对卡鲁扎–克莱因理论中的衍生规范场论的研究和评述,第(II)文包括电磁学中的局域对偶对称规范理论、卡鲁扎–克莱因理论的非阿贝尔版本(对杨–米尔斯规范场论的导出)和高维引力规范理论的介绍(“规范场论札记(II)”这三块主要为作者本人的研究总结)。本文涉及的知识范围包括电磁学或电动力学、量子物理学、规范场论、广义相对论和微分几何等。文中出现的一些中外研究者尤其是外国作者的人名和姓氏,凡是常见名姓,用其中文译名;对于非常见人名或者在文内只少许出现几次的,如缺少约定的翻译,则用其英文名或者直接沿袭其论文内的署名法,这也有利于读者可以方便检索有关原始文献。
2. 规范场论的历史起源
在广义相对论中,如果坐标微元满足变换规则 
  ,则我们有 
  和
  ,那么偏导数变换规则为 
  。于是一个标量算符的坐标变换规则为 
  ,即标量 
  满足变换不变性。
但这种标度变换并非魏尔所研究的变换,它在本质上仍然属于黎曼几何广义坐标变换。魏尔的标度变换与此有所不同。1918年魏尔提出的“纯粹无穷小几何”是黎曼几何的推广,也可以被称为魏尔几何 [8] [9] 。魏尔认为他的这种新几何除了要使用黎曼的二次型度规 
  外,还需要添加上一个线性型度量结构 
  [8] [9] 。根据黎曼几何,某个矢量 
  的无穷小平行移动(infinitesimal parallel transport)是用 
  表示,此平行移动不改变此四维矢量长度,只改变四维矢量方向。魏尔认为广义的几何(魏尔几何)还需要添加上一个改变长度的联络: 
  [8] [9] 。
从这里,我们也可以解读出量杆长度受到魏尔矢量场 
  的影响: 
  ,它携带了一个不可积衰减因子(根据现在的事后诸葛亮,如果指数部分乘上一个虚数单位,让 
  变为 
  ,这样的不可积相位因子代表了传播的德布罗意物质波与中介场 
  的耦合效应)。标杆长度的导数为 
  ,可以写为 
  ,也即 
  ,此意为传统的导数为 
  ,现在添加了一个标度因子
  ,但是其在效果上使得普通导数 
  变为了协变导数 
  ,宏观数学结构虽然不变,但是通过协变导数,引入了(电磁)相互作用。如果将魏尔的标度变换推广到函数的变换: 
  (魏
尔规范变换理论),引入协变导数 
  、 
  ,那么我们就有一个广义的导数 
  ,它可以写为
  ,
于是魏尔矢量势(魏尔认为这是电磁矢量势)满足变换规则 
  。在这样的变换下,电磁场强 
  具有(在魏尔的标度变换下的)不变性。
在魏尔理论中,度规的标度变换为 
  ,其中我们引入了一个参数 
  ,在与电磁学比较时,以便它能让有关函数保持量纲上的平衡。黎曼几何Levi-Civita联络为 
  。由于 
  ,于是在魏尔几何中,Levi-Civita联络为
  。
引力场中粒子的作用量为 
  ,将度规的标度变换 
  代入,我们得到 
  ,其中指数因子 
  可以近似写为 
  。如果 
  在点粒子局域上与电荷 
  有关,那么魏尔几何中的引力场中粒子的作用量 
  可以写为传统的经典粒子作用量 
  和电动力学带电粒子与电磁场的耦合作用量 
  之和。这意味着在魏尔理论中,电磁力(可以通过魏尔的标度变换不变性)以引力的身份呈现出来。
魏尔的方案尽管在理论上取得了成功,但是爱因斯坦对魏尔的指数标度因子 
  随意
破坏量杆长度颇为踌躇。时间到了1926年,薛定谔基于德布罗意物质波思想,建立了量子力学的波动力学版本。此时,福克(V. Fock)、伦敦(F. London)和魏尔(H. Weyl)本人领悟到,如果把魏尔的尺度变换因子由实数改为复数、变换的对象由标杆的长度取代为薛定谔的波函数,那么爱因斯坦所说的致命问题将不再存在,电磁相互作用的存在仍然是该规范变换下的内禀自然要求(这是魏尔理论的核心成果),为了保持电子波函数的薛定谔方程在该规范变换下形式不变必须要求存在电磁场。具体说来,福克认识到电动力学中的电荷机械动量 
  要用 
  代替,伦敦认识到量子力学中的带电粒子会具有
不可积标度(相位)因子 
  [9] 。不过此时两位还没有明确的局域相位变换思想,相位
变换最终是由魏尔本人在1929年发表的论文《电子与引力》中提出 [9] [10] 。魏尔终于承认,他原本希望与引力有关的标度变换,最终其实与引力无关,而是跟量子力学波函数有关。这样,在量子力学框架下,电动力学的规范场论版本建立起来。这是电动力学理论的第三次升华(第一次升华是麦克斯韦和洛伦兹根据实验建立起了经典电动力学,实验约束了电动力学的数学结构;第二次升华则是庞加莱、爱因斯坦和闵科夫斯基根据狭义相对论不变性重建电动力学理论,即电动力学的数学形式由相对论不变性来约束;第三次升华则是魏尔的局域规范对称性再次约束了电动力学数学结构),这是对电动力学本质的认识的深化。第四次升华可以是量子电动力学的建立以及电磁力与其它基本力的统一。
标杆的绝对长度是一个可测量,因此不允许牵涉魏尔的规范变换,但是波函数的绝对相位是不可测量,参与魏尔的局域规范变换是允许的。此时,魏尔的这种变换,其实应该叫局域“相位变换”才对,但是魏尔没有改变名称,仍然叫它局域“规范变换”,后人也沿袭了这个名称。在量子力学建立后, 
  中的 
  要变为虚数,如 
  ,那么波函数的规范(相位)变换为 
  。根据一般的电动力学和量子力学教材叙述,规范对称性要求经过局域相位规范变换前后的薛定谔方程在形式上不变,即
 
设波函数的规范变换为 
  ,那么协变导数的变换规则为
  。
如果三维磁矢量变换规则为 
  ,那么上述协变导数可以化为 
  ,它与波函数变换规则 
  在结构上一样(即协变导数与波函数在整体上都多了一个局域相位因子 
  ) [7] 。同理,设电标量势变换规则为 
  ,关于时间的协变导数变换规则为 
  ,它与波函数变换规则 
  在结构上亦同。在以上变换规则下,磁感应强度和电场强度具有不变性:
 
以上就是带电粒子电动力学在量子物理学中的规范变换,它们的运动方程和拉格朗日量密度都具有规范对称性。如电磁相互作用拉格朗日密度 
  的规范变换是 
  ,其中用到电荷守恒定律 
  。我们看到,电磁相互作用拉格朗日密度 
  的规范变换结果是一个全散度项 
  ,对于电荷运动方程和电磁场方程没有贡献,这就证明了这种电磁耦合满足规范对称性。
顺便说明:在初等的场论中,四维矢量势 
  是规范势,而场强 
  是规范场。但在较为高等的场论中, 
  被直接称呼为规范场,至于规范场强 
  (曲率张量、规范场张量)则是一个导出量。这是一个因人而异的非本质的习惯。
局域规范变换的物理意义是什么?这可以类比局域时空平移对称性和洛伦兹转动对称性来理解。在广义相对论中,这样的对称性导致引力(包括黎曼–嘉当曲率和挠率等)。绝对的位置不可测,绝对的相位也不可测,因此这允许我们对物理学方程施行这样的变换,它要求在变换前后数学结构不变。正如杨振宁所言:“对称性决定相互作用。”这曾为20世纪构造新物理学理论提供了线索。
3. 电磁学和量子光学中的人造规范势和人造“磁学”
从上面的规范对称理论看来,规范场驱动物质场运动,规范场是以协变导数的形式进入物质场的运动方程之中的,以这样的规范耦合方式参与与物质场的相互作用。受此启发,在其它非规范理论之中,也会存在这种等效的规范势,它们以协变导数的形式进入被研究对象(如原子和光场)的运动方程之中,呈现出人造规范势效应。这种规范势尽管并非基本,但是它们在应用领域可以根据人的意愿被设计并驱动系统运作,呈现出丰富多彩的几何和拓扑特色。
下面我们列举出电磁学和量子光学中的六个人造规范势例子。
3.1. 含时量子系统的等效规范势
在Berry拓扑(几何)相位理论中,几何相位起源于含时哈密顿量或者含有演化参数的哈密顿量 [17] 。为了求解具有含时哈密顿量的薛定谔方程的精确解,Lewis和Riesenfeld在1969年提出了一个使用李代
数解方程的方法 [20] ,他们不去直接求解含时薛定谔方程 
  ,而是改为求所谓的不变量算符 
  的定态本征方程 
  ,同时证明了含时薛定谔方程的解 
  与它对应的不变量算符 
  的本征态矢量 
  只差一个特定的相位因子。此相位因子的相位除了含有传统的动力学相位以外,还含有(非循回、非绝热)几何相位 [20] 。Lewis-Riesenfeld不变量算符 
  遵守守恒的量子力学运动方程 
  (量子刘维尔方程) [20] ,设不变量算符 
  的本征态为 
  ,于是含时薛定谔方程 
  的一个特解可以写为 
  ,它的总相位为 
  ,其中相位之一 
  是动力学相位,相位之二 
  具有规范势特性的“几何”相位(在非循环和非绝热过程之中) [20] 。需要指出,我们其实仍旧很难求解不变量算符 
  [20] 的含时本征态。于是Gao等人在1991年提出了一种对不变量方程进行么正变换的方法 [21] ,具体说来就是对Lewis-Riesenfeld不变量算符 
  的(定态)本征值方程 
  、不变量运动方程 
  [20] 以及含时薛定谔方程 
  三者一起施行该么正变换 
  [21] ,于是将含时的不变量算符 
  化成不含时的不变量算符 
  ,其效果是含时的不变量算符 
  和含时的哈密顿量算符 
  被对角化了,从而使得求解变得容易 [21] 。被施行么正变换之后,新哈密顿量算符的形式为 
  [21] ,其中新项 
  具有规范势特点,满足普通的规范变换规则。我们可以称呼这样的新项 
  为几何相联络(geometric-phase connection)或几何相规范势(geometric-phase gauge potential)。
在某些参数空间内,几何相联络的时间积分可以写为一个参数空间中的“磁矢量”的线积分,即 
  ,其中 
  正是参数空间中的“磁矢量”。模仿旋量场论中的自旋联络( 
  ),这一“磁矢量”中的么正变换 
  和 
  可以被看作不变量本征态空间复流形中的vielbein (标架场)。
含时量子系统在二十多年前本已经被研究透彻,但是后来因为在光学电磁介质领域、量子光学和原子物理学等中可以用人工手段设计宇称–时间对称结构、非厄密哈密顿量系统,含时量子系统又被不少作者所关心 [22] - [27] 。
3.2. 非共面螺旋形弯曲光纤中的等效规范势
光波在非共面弯曲的光纤中传播,除了得到传统的动力学相位外,还有与光纤几何形状有关的几何相位 [28] [29] ,故直线光纤和螺旋形弯曲光纤内的波传播性质并不完全一样。自从Berry在1984年提出绝热几何相位理论 [17] 后,Chiao和Wu提出了螺旋或者非共面弯曲光导纤维中的光子的几何相位测量方案 [28] ,Tomita和Chiao在实验上观察到了该拓扑几何相位 [29] ,它的数值大小与非共面弯曲光纤所张的立体角成正比,也与光通过的光纤螺旋匝数成正比。在这个问题中,前人作者通常把光子螺旋度(光子总角动量算符在其波矢量方向上的投影)作为其有效哈密顿量,但是Gao指出该计算方案的不足,提出螺旋度只是弯曲光纤中的光子的一个Lewis-Riesenfeld不变量算符,因此需要依靠该Lewis-Riesenfeld不变量理论再度构造一个哈密顿量,并系统地研究了这个问题 [30] 。假设弯曲的光纤曲率半径足够大,忽略由此带来的应力效应,光波的纵向(即光纤轴向)波矢量始终与弯曲的光纤相切,那么纵向波矢量只改变其方向、
不改变大小,由此得到纵向(即光纤轴向)波矢量 
  所满足的方程: 
  。此式等价于Lewis-Riesenfeld不变量方程 
  ,其中不变量算符为 
  (光子螺旋度)、光子有效哈密顿量为 
  (这里 
  为光子角动量算符) [30] 。上述方程(光的波矢量 
  所满足的方程)其实是一个数学恒等式,自身不带来任何有用的信息,但是它的“等效磁场”却可以用光波路径来表示,因此具有计算思想方法论意义。将此方程与荷电粒子在磁场中的运动方程 
  作比较,我们发现, 
  好似一个等效“磁场”,由此可以定义等效的“磁
矢量势”。该方法除了对于弯曲光纤中的光波适用外,它也可以适用于沿着曲线路径传播的玻色–爱因斯坦凝聚体。
在近年来使用新的设计工艺,光纤内的几何相位研究在理论和实验上又受到关注,这对于量子物理基础和应用研究都有借鉴意义 [31] [32] [33] [34] 。
3.3. 原子–光场相互作用中的等效规范势
自旋–轨道耦合在量子物理、冷原子物理和凝聚态物理等领域吸引了广泛兴趣 [35] [36] 。自旋–轨道耦合的哈密顿量 
  可以化为 
  ,它表现为速度或动量 
  与一个矢量规范势 
  的耦合,它类同于电磁相互作用势能密度 
  或者 
  。原子–光场耦合包括电偶极矩和磁偶极矩耦合。由于原子有动能,原子在实验室参考系和原子在自身参考系中与光的耦合哈密顿量并不相同,例如实验室内和原子参考系内的电场满足变换关系 
  ,于是在实验室坐标系中,原子–光场的电偶极矩耦合势能为
  ,
其期待值为 
  。这里出现了与原子速度 
  耦合的矢量势 
  [37] 。众所周知,在四维形式中,电磁相互作用势能密度是 
  或者
  。将它与上面的原子–光场的电偶极矩耦合势能比较,我们可以得到等效的矢
量规范势 
  。设原子能态为 
  ,那么原子的跃迁电偶极矩期待值为 
  。这样一来,所展现的等效规范势 
  是一个非阿贝尔规范势 [37] 。为了方便,我们忽略标量势,则原子的拉格朗日量为 
  ,正则动量为 
  ,原子的哈密顿量为
  。
这哈密顿量在形式上与非相对论电动力学中荷电粒子的哈密顿量形式一样。
上面所考虑的是原子与光场之间的电偶极相互作用。对于磁偶极相互作用,其实验室参考系内的哈密顿量为
  。
同理,我们也可以得到等效的规范势 
  [37] 。
3.4. 截面非均匀波导中的等效规范势
当存在相互作用时,薛定谔方程(当然也包括其它波动方程如克莱因–戈登方程和狄拉克方程)需要遵守局域规范变换下的不变性(对称性),取代其普通偏导数 
  的是带有规范势 
  的协变导数 
  。下面我们来证明:在一些人造规范势系统中,如果它的微分方程解不可按照自由度被分离变量,不同自由度之间有耦合,那么该物理系统会展现等效的规范势。这里的推导思路是基于“有限元”思想方法 [38] [39] 以及本作者多年来对含时演化系统、等效规范势、标架场、规范群流形等的思考和研究经验。我们研究一个例子(横截面为非均匀的金属波导),假设该系统内的光传播演化可被大致区分为快变和缓变两个过程,于是可以证明那个快变过程会出现有效的人造规范势 [40] 。
在横截面非均匀的金属波导内,波导壁由金属构成,内为真空介质。设电磁场在波导纵向坐标 
  (传播方向)上快变,与此同时,波导因为有非均匀横截面(即截面边长为纵向坐标 
  的函数),那么电磁波在横截面(坐标为 
  或 
  , 
  )上的横向波数是波导纵向坐标 
  的慢变函数(如果横截面x边长为 
  ,那么x方向上的驻波波数为 
  , 
  为自然数。对于横截面非均匀的金属波导,横截面x边长 
  为波导轴向或纵向坐标 
  的函数, 
  )。对于熟悉含时哈密顿系统和几何相位理论的读者,此时可以顿悟出为什么这样的“截面非均匀波导”内的光场的方程内会呈现出等效规范势:把波导横截面边长 
  中的 
  看作演化参数(“时间”),含 
  的哈密顿量或者场方程是一个含有演化参数的体系的哈密顿量或者场方程。根据以往经验,这样的体系是可以含有拓扑相位因子的 [16] [17] [21] ,这也意味着含有等效规范势。
我们将纵向坐标 
  截成密集的离散格子,每一格子自有其时空坐标数值(如 
  , 
  和时间 
  ),格内的解为 
  (下标 
  表示该态矢量全部相关自由度如TM和TE模式,坐标 
  的每一数值表示每一个格子位置)。将逐个离散格子内的缓变参数(如坐标 
  )暂作定值,求解快变过程得到 
  ,最终格内的完整解为 
  ,其为波动方程 
  在该格内特解,整个体系通解可写作
  (为了表达式尽可能简化,有关线性叠加系数已经被合并吸收入 
  了),要求通解 
  遵守波动方程 
  。我们来看等效的或者人造的规范势如何呈现。先研究偏导数:
  。
在上述表达式两边左乘一个慢变的态矢量 
  (它在坐标 
  上慢变,它是在每一格子内的横截面上的解。 
  是该解的变量,而 
  只是 
  的一个可调参量),我们可以得到
 
需要指出, 
  系以波导横截面坐标变量 
  作为积分区间的内积,坐标 
  当作格子内的定值(慢变参量)。借助正交条件 
  ,我们立即可得 [40]
 
需要交代,在上面最后一步中我们使用了爱因斯坦(重复指标求和)规则(也就是关于相同指标 
  需要求和,但为简化我们已省求和符号)。这样,我们得到了一个重要关系
  。
该关系显示,快变解 
  的导数不再是普通的偏导数,而是协变导数(它包含一个等效的规范势项 
  ,其中规范势定义为 
  。如果自由度指标众多,该规范势还是非阿贝尔的)。再经过进一步的推导 [40] ,带有普通导数的原始波动方程 
  最终可化作为新的携带协变导数的方程
  。
因为所有慢变解 
  (波导横截面方向上的态矢量)为线性独立,故快变解 
  遵守方程 
  。
其效果是,我们将原先的方程 
  与现在获得的 
  的方程进行比较,看上去虽然它们在形式结构上仍然一样,但后者的普通导数算符项多出了一项等效规范势( 
  )。
根据有效规范势(“磁矢量”)定义 
  ,模仿旋量场论中的自旋联络( 
  ),这一“磁矢量”中的 
  和 
  也可以被看作vielbein (标架场)。原先不带有“磁矢量”的方程解( 
  的组合)与现在带有“磁矢量”的方程解( 
  的组合)之间相差了一个么正变换(标架场),它们(么正变换前后情形)是彼此线性组合的关系。这是对“磁矢量”来源的一个认识。么正变换可以对角化哈密顿量 [21] 或者对角化场方程,将耦合的自由度“脱耦”,让某些自由度遵守自由的方程。不过,它只是表观自由(赝自由),并非完全自由,只是把一些耦合效应通过“磁矢量”藏匿到协变导数中去而已。
3.5. 冷原子物理学人造“磁学”中的规范势
中性原子因为不与电磁场发生直接的(电单极)耦合,因此冷原子和玻色凝聚体在电磁场中不会呈现类似规范耦合的效应,但是中性原子和电磁场能发生电、磁偶极耦合(原子能级能发生电、磁偶极容许跃迁),因此能表现出丰富的物理效应。美国马里兰大学和美国国家标准技术研究所的Spielman小组发展了超冷原子物理学中的人造磁学和人造电学技术 [41] [42] [43] [44] 。Zhai综述了有关自旋–轨道耦合量子气体的工作,包括Spielman小组实验工作的理论机制 [45] 。基于Spielman小组 [41] [42] [43] [44] 和Zhai的文章 [45] ,下面我们以一个简化的模型(二能级原子系统与光场的拉比耦合)来说明为什么这样的体系可以呈现人造(合成)“磁”学,也即论证人造“磁矢量势”如何在光与原子耦合中产生。
众所周知,根据量子光学,二能级原子和光的相互作用哈密顿量算符可以为原子动能算符和二态体系布居拉比振荡哈密顿量之和(半经典、半量子哈密顿量):
  ,
其中 
  为拉比振荡频率、 
  为频率失谐。如果 
  含有空间坐标,在这个系统中,原子二能级体系的布居振荡与原子本身的质心运动会耦合在一起。为了让它们“脱耦”,我们要采用么正变换(根据以往经验 [21] ,么正变换可以对角化哈密顿量,或者让一些原本耦合的矩阵元解耦,从而简化问题)。参照Zhai的方法,为了简化上述耦合的哈密顿量,研究者采用一个么正变换 [45]
  , 
  ,
就可以得到新的哈密顿量 
  。么正变换中的相位角 
  待定。下面我们实际是要计算 
  。先不妨计算 
  :
 
再将 
  右乘在上述 
  算符上,得到
 
进一步得到
 
现在可以计算 
  ,结果为
  。
同理, 
  。于是我们得到
  。
如果取在么正变换中的相位角 
  ,上式可以简化为
  。
于是在么正变换之后,新的哈密顿量为 [45]
  。
在新的哈密顿量中,原子二能级态矢量和原子质心运动之间在表观上是“脱耦”的,质心运动的动能算符协变导数中含有等效规范势 
  。 
  内的 
  可以是非解析的,故而 
  。当然,二能级态矢量和原子质心运动其实并没有完全脱耦,处于上、下能级的原子质心所受到的等效规范势 
  符号相反(由泡利矩阵 
  决定),因此处于上、下能级的原子质心运动轨迹并非相同,这意味着这里有能级–路径的纠缠效应,这有点类似斯特恩–盖拉赫实验(处于不同内禀角动量状态的银原子在非均匀磁场中分束运动)。在量子光学中,用狄拉克表象,诸原子能级构成一个抽象的希尔伯特态矢量空间。借助原子能级–路径的纠缠效应,可以将原本发生在抽象的态矢量空间的原子能级布居概率(包括粒子数反转)的量子塌缩–复苏现象发生在空间路径上。
上述哈密顿量可以用于研究光晶格中的玻色–爱因斯坦凝聚体的Aharonov-Bohm效应。当然前人研究的模型和性质 [41] [42] [43] [44] [45] 要比上面的二能级模型复杂很多,他们的研究不但包括二能级体系,也包括三能级冷原子体系的人造“电学”和“磁学”。需要指出,其它粒子如低速中子磁矩与电磁波的相互作用,也具有上述哈密顿量结构,因此也有类似的对应的人造“磁学”效应。
3.6. 各向异性电磁介质中的光学规范势
各向异性电磁介质与各向同性电磁介质比起来,电磁波仿佛是在一个等效的规范势中传播,其最终效果是电磁波方程内的普通导数需要用带有等效规范势的协变导数代替 [46] ,从而可以呈现拓扑几何相位,光子好似带电粒子一样,也能呈现Aharonov-Bohm效应,这也是一种人造“磁学”。Liu和Li证明在各向异性电磁介质中存在这样的“光学规范势” [46] 。他们的方案也可以被推广到“非阿贝尔光学规范势”情形 [47] 。下面的方案是基于Liu和Li的阿贝尔规范势方案基本思想 [46] ,但是具体细节又有所不同,故而我们推导详细,有助于读者理解一些人造(各向异性)电磁介质阿贝尔和非阿贝尔光学规范场概念 [46] [47] 。
在双各向异性电磁介质中,旋度形式的麦克斯韦方程为
  , 
  ,
其中介电张量 
  和磁导率张量 
  分别是
  , 
  。
我们先来看介电张量中的非对角贡献与电场的耦合 
  ,它的显式为
  。
让我们回忆一下,叉乘矢量 
  三个分量是 
  、 
  、 
  。不妨将它与 
  比较一下,我们发现 
  与 
  有相同的数学结构(这一点在本方案中至关重要):
  ,可以得到 
  、 
  ;
  ,可以得到 
  、 
  ;
  ,可以得到 
  、 
  。
于是, 
  。我们简化介电张量的对角分量,假设三个对角分量相等 ( 
  ),因此介电张量对角部分可以化为一个单位矩阵,即 
  ( 
  为对角化部分, 
  为非对角化部分)。于是旋度方程 
  可以化为
 
也即得到
 
同理, 
  可以化为
 
我们对此进行论证:磁导率张量中的非对角元与磁场的耦合 
  为
 
它可以被写为矢量叉乘形式 
  。 
  三个分量是 
  、 
  、 
  。我们将 
  和 
  比较一下:
  ,可以得到 
  、 
  ;
  ,可以得到 
  、 
  ;
  ,可以得到 
  、 
  。
于是 
  。我们简化磁导率张量的对角分量,假设三个对角分量相等 ( 
  ),因此磁导率张量对角部分可以化为一个单位矩阵,即 
  (其中 
  为对角化部分, 
  为非对角化部分)。
这样一来,上述两个旋度方程变为
 
这里 
  、 
  。对于第一个式子两边,我们乘虚数单位 
  ,于是上述两个旋度方程进一步可变为
 
然后将它们相加或者相减,得到
 
为了进一步合并同类项,我们假设所设计的材料满足 
  ,于是上面方程可以简化为
  ,
还可以进一步得到
 
在前面我们研究介电张量和磁导率张量时,我们已经证明非对角部分满足反对称性质,如 
  、 
  ; 
  、 
  ; 
  、 
  。另外,要求该电磁介质是无损介质,这就要求介电张量和磁导率张量是厄密矩阵,也就是非对角项矩阵元互为复数共轭,如 
  。既要求 
  (复数共轭),又要求 
  (反对称),那么这要求 
  和 
  必须为纯虚数。为此,参数 
  只能取虚数,于是我们设 
  。这样一来,各向异性材料内的电磁波传播方程可以化为如下一个携带有协变导数的薛定谔型方程
  。
现在,介电张量 
  是
  .
在 
  中, 
  ,于是 
  变为 
  ,那么磁导率张量 
  为
 
在上述光场方程中,方程左边项(两个旋度叉乘) 
  可以简写为 
  (其中 
  为三维空间内的全反对称Levi-Civita符号),它可以进一步化为
 
借助这一关系,可以简化上述带有协变导数的光场波动方程。
我们在上面综述和研究了六种在电磁学和量子光学体系中产生人造规范势的方法,每法各有其使用领域和特征,但它们也有一些共性。第一种(含时量子系统的等效规范势)和第二种(非共面螺旋形弯曲光纤中的等效规范势)是早年(如1980和1990年代)人们结合几何相位研究的常用体系;第三种(原子–光场相互作用中的等效规范势)和第四种(截面非均匀波导中的等效规范势)作为诱导规范势,为作者曾经所感兴趣和研究,它们亦具有一定的典型意义;第五种(冷原子物理学人造“磁学”中的规范势)和第六种(各向异性电磁介质中的光学规范势)是在当前文献中研究的产生规范势的比较新的方法。此六种引入人造规范势的方法,可以分为三大类,例如么正变换型引入(第一、四、五法)、自旋–轨道耦合型引入(第二、三、五法)、各向异性(或者张量)耦合引入人造规范势方法(第六种)。其中,么正变换型引入法将相互作用“吸收”入协变导数,自旋–轨道耦合型引入法使得体系哈密顿量出现自旋算符或泡利矩阵(与赝自旋算符有关),各向异性(或者张量)耦合引入人造规范势方法在将各向异性电磁学方程化为各向同性时,各向异性耦合被分离出来附在了协变导数之中。总的说来,人造规范势在理论原理上,是将含有相互作用的哈密顿量、场方程或运动方程,通过适当改造(如么正变换或数学上的恒等变换),变为“自由”形式的哈密顿量、场方程或运动方程,但是其关于时间和空间的普通导数项变为了包含人造规范势的协变导数项。由此,我们就可以方便研究这些物理体系中的以几何相位和广义的Aharonov-Bohm效应等为代表的人造“磁学”和拓扑特性。
需要说明的是,在以上各种人造规范势系统中,规范势只是一个相互作用背景,本身并非动力学的主角,也即不存在人造规范势的运动方程,当然也无人造规范势拉格朗日密度动能项。在接下来的专题(卡鲁扎–克莱因理论)中,等效的规范势是有运动方程和拉格朗日密度动能项的,它们由高维广义相对论引力理论展现出来。
4. 阿贝尔版本的卡鲁扎–克莱因理论
除了魏尔用他的规范变换理论来解释电磁场在引力场中的起源,与此同时,其他人沿着不同路径,也在做“统一场论”工作,如卡鲁扎–克莱因理论。下面我从个人理解的角度,来讲述卡鲁扎–克莱因理论的缘起:广义相对论引力理论用度规分量 
  描述引力。在欲将电磁力和引力理论统一起来的理论中,一个自然的想法就是将 
  分解为 
  。这种方法的目的是想将引力理论分解为电动力学的形式(笔者在大学时代的思路)。这样的分解法确实有两条:1) 弯曲时空的狄拉克矩阵 
  满足 
  ,其中弯曲时空的 
  可以用平直时空中的狄拉克矩阵 
  进行线性组合表示出来,即 
  ,此处 
  为标架场(vierbein);2) 度规分量也可以直接表示为 
  。此二法其实等价。现在,引力效应就被藏匿在标架场 
  之中了。但是这样的改写(如 
  和 
  ),无法统一电磁场和引力场,而且最终也无法将引力理论化为电动力学形式(本作者在1998~1999年也思考过这一方案)。因此,人们只能反过来,要求将电动力学纳入引力理论。显然,如果要在引力理论中引入电磁场,无疑还要引入新的时空自由度。如果引入一个额外维度,那么标架场 
  将具有电磁势 
  的功能。这与魏尔引入一种新的对称性(标度变换不变性)来引入规范势的思路不同。
在历史上,卡鲁扎在四维时空广义相对论中引入了第五维度,把电磁相互作用统一在了五维爱因斯坦相对论引力理论之中(1919年)。高维统一,是一种非常巧妙的方法,因为它经济、简单,不改变原先理论范式,不对已有理论伤筋动骨,仅仅增加一个维度,以最小的代价解决物理之谜(这是理论物理学家们的期望)。高维空间也是一个自然的概念,像回答诸如“现实空间为什么是三维”这样看上去简单的问题也需要在高维空间理论中去寻求答案。1919年,卡鲁扎将自己的论文寄给了爱因斯坦,爱因斯坦两年后回复表示这一思想确实让他很震惊。1921年卡鲁扎发表了他的论文(论文由爱因斯坦递交给普鲁士科学院发表) [48] 。1926年克莱因也独立提出了用高维空间来统一电磁场与引力场的思想 [49] 。他从别人处获悉卡鲁扎几年前已经发表了这样的研究,但克莱因经过钻研卡鲁扎的工作,认为自己的想法与卡鲁扎还是有点不同,主要是对于第五维度,卡鲁扎使用了柱坐标系(可以称为维度的柱坐标紧致化),而克莱因使用了圈坐标系[第五维度好比一张毛毯(毛毯代表普通四维时空)上的一条条圆圈形绒线],克莱因还讨论了电荷量子化起源。此两理论的共同点都是通过引入第五维度、用五维广义相对论来统一引力场与电磁场, 因此卡鲁扎和克莱因的工作被后人合称为卡鲁扎–克莱因理论 [48] [49] 。
下面我们根据前人文献来简述、介绍五维(阿贝尔)卡鲁扎–克莱因理论 [50] [51] ,也包含了本文作者自己的思考,如粒子力学短程线方程、作用量、标量物质场协变导数的产生等,最终目的是要把它推广为非阿贝尔情形,以便统一广义相对论与杨–米尔斯规范理论[此将在下篇“规范场论札记(II)”中讲述]。
在五维(阿贝尔)卡鲁扎–克莱因理论 [48] [49] 中,普通四维时空被称为外部时空,第五维(高维,也叫额外维)称为内空间。高维内空间中的引力场在普通的四维时空内表现为麦克斯韦电磁场、高维的引力表现为电磁力。卡鲁扎–克莱因理论中五维体时空(bulk spacetime)的五维度规可以写为 [50] [51]
  ,
其中 
  ( 
  )是由第五维的度规分量 
  衍生出来的四维电磁矢量势(U(1)规范势); 
  是伸缩子(dilaton)标量场。为了理论的自洽性,这种标量场是必须的。有人建议认为这种伸缩子标量场可能用来作为暗物质的候选者(但是这样的建议可能已经在2017年8月17日双中子星合并事件引力波和伽马射线爆双星使观察中被否定)。协变度规张量 
  的逆(即逆变度规张量)可以写为 [50] [51]
  。
我们可以验证 
  和 
  确实满足互逆关系:
 
注意上面的伸缩子(dilaton)项 
  也可以写为 
  。
下面我们来看五维(广义相对论)引力理论中的Levi-Civita联络 
  。其中尤其重要的是 
  。我们设度规分量不是第五维坐标的函数,即 
  (柱坐标条件),那么 
  的显式为
 
从这个表达式可以看出,Levi-Civita联络 
  产生了电磁场张量 
  。当然它也产生了其它项(与伸缩子dilaton标量场有关的其它项)。
我们来讨论如何从五维引力作用量密度中导出电磁场的作用量密度。广义相对论黎曼微分几何中的Ricci曲率标量是 
  。在我们关心如何从高维引力场中呈现出电磁场的主题之中,其引力拉格朗日量密度即Ricci曲率标量内共有四项:前两项为Levi-Civita联络的线性项,后两项是Levi-Civita联络的二次项。从直观角度讲,因为电磁场的拉格朗日量密度是电磁场曲率(场强)平方项,故我们先看二次项,即第四项有可能产生电磁场的拉格朗日量密度项: 
  。 在五维引力理论中,爱因斯坦–希尔伯特引力作用量密度是
 
其中 
  为电磁场张量(由高维Levi-Civita联络 
  产生)。如果 
  (这种定义是可以做到的,至少在近似意义上是成立的),那么五维广义相对论的爱因斯坦–希尔伯特作用量密度 
  就含有了麦克斯韦电磁场的拉格朗日作用量密度 
  ,这意味着电磁场被统一进入(高维)引力场。
不过,前面考虑的仅仅是Ricci曲率标量 
  中的两个Levi-Civita联络的乘积项(二次项)。Ricci曲率标量另有一个Levi-Civita联络的线性项 
  其实也可以产生电磁场的拉格朗日量密度,其不应该被忽略。这个联络线性项 
  可写为 
  ,其中第一项 
  是全散度项,所以我们仅需要考虑第二项 
  :
 
现在在五维时空中分析上面这一项(为方便,我们省去了有关字母上方用以表示五维时空物理量的波浪线)。与“呈展电磁势”(emergent electromagnetic potential)的产生有关的分量是当其取指标 
  和 
  为第
五维度时的那些项。由于在 
  中指标 
  和 
  地位对称,所以我们只需考虑其中之一指标(如 
  ),然后乘上一个因子2即可。设 
  (柱条件),那么从上面 
  的展开式可以得到我们需要的项:
 
这里,我们已经采用卡鲁扎–克莱因理论中的“度规–规范势”取代规则: 
  、 
  和 
  。 
  和 
  取普通四维时空指标 
  。
爱因斯坦引力场方程是 
  。在五维时空中,它的高维与低维之间的非对角分量即 
  ( 
  取普通四维时空指标 
  )的线性近似形式正是麦克斯韦电磁场方程。略证如下:交叉分量 
  中最重要的一项是第二项 
  。在柱条件 
  下,它可以被展开为
 
至于物质场的能量–动量张量的高维–低维非对角项,它是 
  ,正比于电流密度 
  (电流密度 
  , 
  是电荷固有密度)。这样一来,麦克斯韦方程 
  便可以从高维广义相对论方程 
  中获得。
以上就是传统的五维卡鲁扎–克莱因理论要义,它表明在相对论普通四维时空之上引入第五维,那么可以在五维的Levi-Civita联络中呈现电磁场张量(电磁场强) 
  ,且五维爱因斯坦–
希尔伯特引力作用量密度 
  中可以产生麦克斯韦电磁场的拉格朗日作用量密度,这样五维卡鲁扎–
克莱因引力理论(五维广义相对论)把四维时空内的爱因斯坦广义相对论引力场与麦克斯韦电磁场统一在了一起,电磁场只是高维引力在低维(普通四维时空)中的“投影”而已。
以上介绍了卡鲁扎–克莱因理论中的引力场部分。卡鲁扎–克莱因理论还有几个漂亮的结论,如五维时空线元含有带电粒子与电磁场的耦合拉格朗日量,五维短程线方程含有带电粒子的洛伦兹力项。因此,在粒子力学中,我们还可以进一步证实此五维广义相对论确实可以实现引力–电磁的“统一”。
下面我们从粒子在引力场中的作用量得到带电粒子在电磁场中的作用量,电荷的本质也昭然若揭。广义相对论中五维时空线元是
 
它可以写为
 
其中箭头符号表示我们采用了级数展开并取一级近似(我们假设第五维修正项对时空线元的贡献都比较小)。在上面结果中,五维时空线元 
  除了产生普通四维时空线元 
  外,还能产生带电粒子和电磁场的耦合项。普通四维时空线元平方是 
  ( 
  是四维时空坐标的指标),四维速度定义为 
  ,第五维速度定义为 
  。于是,广义相对论中的粒子的五维作用量是
  。
此处 
  为粒子静止质量,其中普通四维线元可以写为 
  。五维修正项是 
  ,其中非协变的速度是 
  。如此,粒子的五维作用量退化为
  。
为了方便,我们已经将四维时空内的爱因斯坦引力隐去。如此,上述正是带电粒子作用量(它来自五维时空中的粒子作用量),于是带电粒子的拉格朗日量是
  。
它可以写为电动力学中标准的带电粒子拉格朗日作用量形式
  ,
其中带电粒子电荷 
  (粒子电荷由伸缩子标量场 
  即dilaton与第五维速度 
  决定)。如果考虑德布罗意物质波性质,普通试验粒子波函数在第五维形成了驻波(按照量子力学),那么第五维速度 
  是量子化的。如果第五维是一个长度为 
  的一维线腔(大致相当于卡鲁扎原始思想),那么第五维上的粒子动量为 
  ( 
  为自然数, 
  为约化普朗克常数);如果第五维是一个半径为 
  的圆周(相当于克莱因的假设),那么第五维上的粒子动量为 
  。由此可以看出,第五维速度 
  是量子化的,也就是电荷 
  是量子化的。实际观察到的电荷确实是量子化的,因此当年克莱因认为这个思想可以用于解释电荷量子化现象。如果第五维是前述两种结构的杂糅,即具有螺旋形状,那么第五维速度 
  会有更复杂形式,但仍旧有量子化特性。还可以证明,第五维度的动量在四维时空内看来,是一个静止质量(这类似光纤横截面上的驻波横向动量让光纤内的光子带上了等效的静止质量),所以第五维度的存在,也会出现(静止)质量量子化效应。同一种基本粒子,可以具有不同的质量(对应 
  中的整数 
  )。这被称为“卡鲁扎–克莱因质量塔”效应 [52] 。如果找到了这样的现象(基本粒子质量量子化),那就意味着探测到了第五维的存在。但目前还没有这样的证据,也许第五维太小了,故而第五维动量巨大,导致基本粒子(静止)质量巨大,无法在普通的加速器中产生这样高能的粒子。高维对基本粒子的静止质量贡献仅仅是零(即 
  )。
我们也可以从广义相对论中的五维短程线方程出发,得到带电粒子在电磁场中的运动方程。五维短程线方程是 
  ,其中 
  的显式是
  。
前面已经求得,与电磁力有关的Levi-Civita联络是 
  ,它的显式是
  。
于是我们自然从(第五维度)引力相互作用中得到了洛伦兹力项 
  ,它所包含的 
  就是带电粒子受到的四维洛伦兹力(电动力学)。
在量子力学中,我们需要考虑粒子的波动方程。我们仅仅考虑最简单的标量场 
  。在弯曲时空中,它的导数是 
  。该导数可以化为 
  ,其中含有 
  (其它项 
  , 
  ,属于普通四维时空内引力势与引力磁矢势与粒子的相互作用,这里略去)。于是 
  ,其中我们采用了行波解 
  。如果 
  ,那么 
  。可以看出,如果粒子向前传播时电荷为正,那么向后传播,电荷就为负。我们也可以采用克莱因的圆圈维度紧致化方案,那么高维圆周上的波函数是 
  ,其中角度 
  , 
  为圆周半径,那么 
  。可以看出,如果粒子在高维克莱因圆周中作逆时针运动时电荷为正,那么粒子在高维克莱因圆周中作顺时针运动时电荷为负。这相当于利用高维区分了正反粒子(或者正负电荷)。如此,一个弯曲空间内的标量场协变导数 
  可以自然化为电磁场中带电粒子的具有U(1)规范对称性的协变导数 
  。如果粒子不带电,意味着第五维动量为零。在卡鲁扎–克莱因理论中,粒子的电荷的本质是第五维动量(或角动量),电荷的正负符号与第五维动量或角动量方向有关。这就是卡鲁扎–克莱因理论中电磁相互作用的(高维)引力本质。
5. 早期规范场论历史述评
经典规范场论按照历史顺序,可以分为魏尔阿贝尔电磁规范场论(1918~1919,1929年)、克莱因(1938年)和杨–米尔斯(1954年)非阿贝尔规范场论与对广义相对论中的规范场论特性的揭示(1956年之后)等工作。
魏尔推广黎曼几何的工作主要包含在他1918~1919年的三篇论文之中,该三文的题目分别是《纯粹无穷小几何》、《引力与电力》、《相对论的一个新推广》 [9] 。魏尔把这种不变性叫作“标度不变性”(德文是Eich Invarianz [9] ,英文是Gauge Invariance,汉语翻译为“规范不变性”)。他把自己的方案告诉了爱因斯坦,爱因斯坦尽管表示赞赏,但是却认为它违反经验论,指出魏尔的方案有一个致命的缺点,那就是一根标杆的长度将依赖于它的路径历史,这种不自然性质也会影响原子光谱线,这是不可思议的。魏尔与爱因斯坦之间展开了讨论。魏尔认为爱因斯坦的诘难是经验论性质的,但是他无法放弃数学的美感。为了克服爱因斯坦所说的疑难,魏尔一直在作不屈努力 [9] 。量子力学诞生后,包括魏尔在内的当时的人们才明白,标度变换不应该针对量杆,而应该针对波函数,这样魏尔的困难(量杆的尺度会与路径历史有关、原子光谱线会因为受到魏尔的标度变换影响而显得没有规律)等荡然无存,魏尔的规范变换理论获得了新生,成为揭示量子力学和电动力学之间关系的一把钥匙,物质波与电磁场的耦合受到魏尔规范变换对称性的约束。魏尔的思想(电磁场与标度对称性有关)和推广的几何(魏尔标度不变性几何)尽管在数学上漂亮 [9] ,但在一开始受爱因斯坦等人的不待见。这段魏尔理论的发展经历给我们以启示:在基础科学研究中,一个漂亮的结构尽管暂时违反经验,但是如果它具有揭示某些现象的核心本质的意义(如魏尔规范变换能揭示电磁场的本质和确定电磁耦合的唯一数学形式),那么它必然是有前途的,稍微斧正(如将魏尔标度变换因子由实数变为复数值的相位因子),就可以获得涅槃重生。所谓涅槃,指魏尔原先的统一场论(统一引力与电磁力)目标遭遇了挫折;所谓重生,指它促进了对量子力学和电动力学的理解,建立了两者之间的联系。
魏尔的电磁规范理论是阿贝尔群规范场论,它虽然漂亮,也提升了物理学家们对量子力学建立后的基础物理学的理解,但是它本身不带来任何实用意义,因为正确的电动力学和量子力学此时已经建立,不需要依靠魏尔的规范对称理论来重建。不过,非阿贝尔规范理论却不是如此。非阿贝尔规范理论首先由瑞典克莱因在1938年波兰华沙一次物理学会议上提出(借助同位旋守恒、规范对称下的协变导数等要件) [11] [12] [13] ,1954年杨振宁与米尔斯 [1] 用群论再度系统地提出 [14] [15] 。可以说,非阿贝尔规范场论是电磁相互作用理论的“远房表兄”:电磁场是阿贝尔规范场,它的规范势满足交换对称性,而传递强、弱相互作用的中介场是杨–米尔斯非阿贝尔规范场,它的规范势不满足交换对称性 [5] [6] [7] 。
在20世纪物理学史上,引力理论和规范理论之间互有反哺,如克莱因与泡利等人曾经从引力理论出发,得到了后来的杨–米尔斯规范理论。下面对克莱因的早期“非阿贝尔卡鲁扎–克莱因理论”作一些评述。
在非阿贝尔规范理论的研究中,我们应该承认几位前人的贡献。根据历史,非阿贝尔规范理论可以分为三大类:1) 1938年克莱因和1953年泡利的非阿贝尔卡鲁扎–克莱因理论;2) 1954年的杨–米尔斯规范理论;3) 1970年代之后的引力规范理论。此分类法并非唯一,它只是属于作者本人的一种梳理。对第三种类,本人有研究,但在这里不予讨论。
通常认为1954年杨振宁与米尔斯提出了SU(2)非阿贝尔规范理论 [1] 。但是实际上,早在1938年,瑞典克莱因在波兰华沙一次物理学会议(1938年5月30日~6月3日召开)用法语发表了一个“广义的电磁场规范理论”,作为统一当时的核力(其实是中微子和电子的弱相互作用力)、电磁力和引力的一个模型 [11] [12] [13] 。仔细比对,可以发现克莱因1938年得到的广义的电磁场规范场强与后来(1954年)杨–米尔斯SU(2)规范场强在数学上精确一致,分毫不差 [14] [15] 。克莱因在1938年还把电子和中微子看作同位旋二重态,当作是他的广义电磁场的源,而这在1960年代弱电统一理论中被看作是格拉肖所为 [2] 。克莱因1938年工作正相当于同时提出了20世纪下半叶粒子物理理论中最为重要的两个工作(非阿贝尔规范理论和弱电统一理论),他几乎成为Yang-Mills和Glashow-Weinberg-Salam的合体 [1] [2] [3] [4] 。只是他的理论缺少产生规范粒子质量的Higgs机制。对于这个问题,克莱因在他的1938年的论文中虽然无具体机制提出,但是叙述却相当明晰。他认为存在某种“自能”机制可以让他的矢量规范粒子带上质量 [11] [12] [13] (而20多年后的Higgs机制确实属于动力学标量场的真空“自能”机制)。现代人认为,克莱因没有用到Higgs机制,直接让规范粒子带上质量,破坏了规范对称性,因此克莱因绝对不可能比杨–米尔斯早16年提出非阿贝尔规范理论,只是他的场强“有点像后来的杨–米尔斯规范场强而已,但其实不是杨–米尔斯规范场强”。这种观点多少是从事后诸葛亮(基于后来的规范群的规范对称性范式)角度来理解,没有考虑到历史事实的逻辑,因此这造成对克莱因的冤枉。因为首先,克莱因的规范场强与杨–米尔斯规范场强表达式分毫不差; 其次,克莱因在文内也多次提到规范对称性,因此他并没有意图直接引入规范粒子质量来破坏规范对称性,相反,他提出可能存在某种“自能”机制可以让规范粒子带上质量的愿望(这正是20多年后由Higgs机制实现的结果)。
当然,纵观克莱因1938年全文,他确实没有明确提出“SU(2)规范对称群”这样的1954年杨–米尔斯理论中的标志性术语 [1] 。但是我们认为,没有明确提出这样的术语,不等于他在理论推演中没有用到这样的术语所包含的思想与方法。其实,克莱因在他的文内已经把电子和中微子看作同位旋二重态、考虑概率守恒(么正性)以及将他的规范场写成了二维矩阵形式,这些都自觉或不自觉地导致了他在1938年确实建立了正确的SU(2)非阿贝尔规范理论 [14] [15] ,比杨与米尔斯早16年,但克莱因的工作却几乎完全没有被承认,在一些科学史和科普书籍中,相反,它还被当作一个反面例子或规范理论“黎明前的黑暗”时期一个失败了的例子来看待。本文作者已经从历史背景、方法论、物理意义、后人评价 [14] 、被曲解因缘、教训总结 [15] 等角度具体介绍、评述过克莱因理论,对其迷雾辨析,本不必在此再置喙,但是近来翻阅一些量子场论、粒子物理学历史或科普书籍,时不时仍然能看到更多作者在提及规范场论历史时,有成见地认为克莱因只是对广义的电磁场(非阿贝尔规范场)作了尝试性的失败研究。可见在过去大半个世纪,对克莱因1938年理论的误解已经成为理论物理之场论共同体“公共知识”的一部分。趁本作“规范场论札记”对早期规范场论(如魏尔理论、卡鲁扎–克莱因理论等)作评述,且克莱因1938年矢量规范理论也确实属于该评述主题无法绕过去的内容,于是本文作者再就克莱因1938年理论予以说明;同时,作者也为了删繁就简地澄清这个问题、直击这一事例核心本质,让读者能快速领略克莱因1938年的矢量规范理论面貌及立即明白为什么它与后来的杨–米尔斯理论确实具有相同的数学形式,特简述如下:克莱因1938年的矢量规范理论基本要件(拉格朗日量密度和克莱因的规范场张量 
  、 
  和 
  )为 [11] [12] [13] [14] [15]
 
在克莱因之原文内 [11] [12] [13] ,时空指标用拉丁字母表示,但为与现在的教材和文献习惯一致,我们将克莱因时空指标改为希腊字母。在上面表达式中, 
  、 
  和 
  是克莱因的SU(2)群矢量规范理论的三种“光子场”,不过克莱因本人没有在他的文内指明这是SU(2)规范群,但是他解释它们的源是中微子–电子同位旋二重态列矩阵,这在实际上就等价于引入了SU(2)规范对称群。克莱因的 
  为电磁势,以电荷 
  为耦合系数 (需要指出的是,在当今的Weinberg-Salam弱电统一模型中, 
  应当是弱味荷, 
  应当是SU(2)中性矢量玻色子,而弱味荷与U(1)弱超荷的线性组合,才得到电荷。在1938年波兰物理学会议上,当克莱因的报告结束后,听众缪勒提了一个问题,克莱因说缪勒的问题可以通过添加一个U(1)矢量规范场来解决。翌年在巴黎出版的论文集中添加了这一条说明。如此一来,克莱因的矢量规范场模型,也就是广义的电磁场论,与后来的Glashow-Weinberg-Salam SU(2) × U(1)弱电统一理论更为接近,只是克莱因还没有可靠的Higgs自能机制来产生规范粒子质量,尽管克莱因在文内多次提到某种自能机制可以办到);克莱因引入“广义”的规范场 
  和 
  是作为传递弱力(电子–中微子耦合)的中介场。因此,克莱因的该广义电磁场理论被推广到了电子与中微子弱同位旋二重态,他欲将电磁相互作用和弱相互作用统一起来 [14] [15] 。
再来看杨–米尔斯场论 [1] [5] [6] [7] 。在自然单位制( 
  )下,杨–米尔斯规范场强为 
  ,其规范势为 
  。这里, 
  为SU(2)群生成元( 
  为三个泡利矩阵, 
  ),群生成元满足对易子 
  ( 
  为SU(2)群结构常数,它是全反对称的,其中定义分量为 
  )。因此,杨–米尔斯规范场强(规范场张量、曲率)为
 
该规范场的拉格朗日作用量密度是 
  。可以定义一对互为复数共轭的规范势: 
  、 
  ,这样一来,可以推导出规范场张量的新的形式
 
进一步可以证明杨–米尔斯场 
  内的 
  项可以化为
  ,
于是杨–米尔斯理论中的规范场强之第三分量可写为
 
由此我们可以来比较克莱因理论(1938)和杨–米尔斯理论(1954) [14] [15] :杨–米尔斯规范理论内的矢量规范势 
  与克莱因理论的 
  对应,而杨–米尔斯理论的规范势 
  对应于克莱因理论的另一个规范势 
  ,杨–米尔斯第三分量规范势 
  对应于克莱因理论当时的电磁规范势 
  ;至于场强,杨–米尔斯的 
  对应于克莱因的场强 
  ,其复数共轭 
  对应于克莱因的场强 
  ,杨–米尔斯第三分量规范场强 
  对应于克莱因理论(当时的电磁场张量) 
  ,杨–米尔斯理论的规范耦合系数 
  对应于克莱因理论中的耦合系数 
  。这样一来,我们发现,克莱因的广义电磁场理论(1938)与杨–米尔斯规范场论(1954)其实在数学结构上是完全一致的。
值得一提的是,实事求是,我们也要指出克莱因1938年理论 [11] [12] [13] 中也存在两个错误:规范场作用量密度中存在一个两倍系数的失误(这点是瑕疵,但因为容易被纠正,所以不算大错);在考虑狄拉克场与他的广义电磁场(其实就是SU(2)非阿贝尔规范场)耦合时,因为他的目标过于庞大(想把电磁力与弱力统一起来),但缺少Higgs机制,而实际电子和中微子作为同位旋二重态却所带电荷不同,这导致他的理论在这一点上难以自处、无法自圆其说,于是他引入了一个电荷矩阵(以体现电子与中微子电荷的不同),这让他的这个电荷矩阵耦合破坏了规范对称性(也就是说,原本满足规范对称性的耦合是十分简单的,但克莱因却将它搞得十分复杂且错误 [14] [15] 。这是由于历史原因造成的。后来的Higgs机制就可以解决这个问题,既满足规范对称性,又自动地、自然地产生电子与中微子同位旋二重态正确的电荷矩阵)。总的说来,克莱因该理论主要缺少的是Higgs机制。
很遗憾,克莱因过早地发表了他的研究(而且是发表在了会议论文集之中),没有受到重视。他把非阿贝尔规范理论和电磁力–弱力统一理论雏形合在一起发表,比后来广为接受的Yang-Mills规范理论和Glashow-Weinberg-Salam弱电统一模型的提出早了16年和20多年。泡利在1953年也提出了类似理论(指规范理论部分),但是因为该理论在规范粒子质量问题上与实验有冲突,泡利没有发表,只是把他的理论写在了一封给派斯的信中。克莱因与泡利都得到了正确的杨–米尔斯规范场强。此外,Salam学生Ronald Shaw也在同时期建立了非阿贝尔规范理论,作为他的博士论文附录的一部分。我们在这里把克莱因与泡利的理论划入“非阿贝尔卡鲁扎–克莱因理论”,因为这两个理论实际上都是以高维引力理论作为依托的,非阿贝尔规范场是作为引力理论的一部分而提出(这与1954年的杨–米尔斯规范理论有区别。后者没有用引力作为依托,而是直接引入非交换的规范对称性,规范场是“横空出世”的)。从他们的理论描述看,克莱因1938年理论中的时空仍旧是五维的,而泡利1953年理论中的时空似乎是六维的。泡利提到了Killing矢量,因此泡利的理论含有了“非阿贝尔卡鲁扎–克莱因理论”关键构件。但克莱因没有提到Killing矢量,尽管他的电磁力–弱力统一模型是悬挂在五维时空中的(这个做法可能起源于他在1926年研究卡鲁扎–克莱因理论后的思维惯性),但是看起来他的“电磁力–弱力”与引力联系并不紧密 [14] [15] ,例如对于引力和弯曲空间中的旋量数学,他只是简要提及了一下,这些要件并非主角 [11] [12] [13] 。因此,虽然克莱因1938年理论可以勉强被看作是一个“非阿贝尔卡鲁扎–克莱因理论”,但当作其是“非阿贝尔规范理论”其实也妥当。
但是,目前克莱因理论只是被当作1954年杨–米尔斯理论出现之前(黎明前的黑夜)时期中的一个反面配角(现代人认为克莱因在1938年只是作了错误的尝试,得到了有点像杨–米尔斯理论的结构但其实根本不是正确的理论)。这个观感是不符合真实历史事实的。至于克莱因的理论中意图用广义电磁场(非阿贝尔规范场)统一普通电磁场与弱力场这种弱电统一先驱性尝试,也就更加直接被后人无视 [14] [15] 。在规范理论发展史上,克莱因的理论被后人大为误解和矮评,我们需要纠正这种曲解。对于科研人员而言,对一些经验教训也值得深思,例如因自己的研究结果过早地发表在非著名期刊,让时人无法及时消化而被忽视,而其他后人在新的机遇和途径中重新研究、发表在著名期刊从而导致发现权转移,对于如何避免这种境况,需要斟酌思忖。
6. 结论和讨论
本文从一个侧面论述了规范场论起源及其早期发展简史,评述了魏尔规范理论和卡鲁扎–克莱因理论,叙述了规范场论的一些应用型课题如在电磁光学中的人造(synthetic)等效规范势效应和引力理论中的呈展(emergent)规范场论研究状况。
在应用电磁学、人造电磁结构或者电磁特异材料(metamaterials)领域、量子光学以及冷原子物理学中,人造(artificial)或者合成的(synthetic)规范场效应是引起广泛研究兴趣的专题。在理论上,获得人造规范势的方式有很多,如用么正变换来分解或者对角化哈密顿量或者对多自由度体系之间的相互作用进行“脱耦”处理。尽管这种人造规范势并非基本的规范场,但是其所表现的“人造磁学”或者拓扑效应与真正的磁场表现相似。不过,我们也需要指出,这样的人造规范场只是起着驱动原子和光场传播的背景作用,它本身不是一种动力学场,因为它不具有拉格朗日动能项。为了产生规范场的拉格朗日动能项,我们考虑了五维的卡鲁扎–克莱因理论,以它作为例子,验证了希尔伯特–爱因斯坦引力作用量密度确实可以产生电磁场的拉格朗日量密度,也从高维时空线元、粒子短程线方程这些高维引力理论核心构件出发,推导出电动力学的基本内容,亦可说进一步论证了“电磁规范场如何从引力理论中产生”这个卡鲁扎–克莱因机制。我们推导比较详细,有助于读者了解和理解“高维统一”这一专题的部分内容。基于Killing矢量方法 [53] ,非阿贝尔性质的卡鲁扎–克莱因理论可以将“爱因斯坦引力”与“杨–米尔斯规范耦合”统一起来。此主题将在下文“规范场论札记(II)”中阐述,包括介绍笔者的一些研究结果。
魏尔的规范场论起源史和卡鲁扎–克莱因理论发展史再次证明了近代物理学史上的两个特征:1) 从错误的模型得到正确的数学理论或方程;2) 引力理论和规范场论互相竞争和反哺。
回顾相互作用和规范场论研究简史不无裨益。在历史上,牛顿引力定律(17世纪)是人类历史上第一个完整的基本相互作用理论。牛顿引力定律的场论哺育了电磁学的发展,如根据牛顿引力定律,在质量球壳空腔内(空心位置)引力场强为零。在电学中,富兰克林在研究带电球壳内的电场时,也发现电场为零,他受到“质量球壳空腔零引力场”这一性质的启发,萌发了点电荷附近的电场随着距离也满足平方反比的定律,这就是库伦定律。安培作为“电学中的牛顿”,建立了电流的静磁学定律,也深受引力场论启发。故一开始牛顿引力场论哺育电磁场论。18世纪下半叶麦克斯韦–洛伦兹电动力学的建立导致庞加莱–爱因斯坦狭义相对论诞生,于是电动力学和相对论开始反哺于引力理论,导致爱因斯坦在1915年创建了广义相对论。相对论引力定律的建立反过来再来促进对电磁学的理解,这就是魏尔规范场论(1918~1919),它是对黎曼几何二次型度量的推广,也是对广义相对论引力理论的推广,引入了一个标度变换,要求引力理论满足该标度变换下的对称性,于是电磁场的存在是一种自然需求 [8] 。尽管魏尔的做法被爱因斯坦批评为违反了经验(如量杆的长度与它的历史有关、原子光谱线变得不再有规律),但是魏尔的“标度变换不变性”思想在量子力学创立后,获得了新生,量子力学波函数有相位自由度,能承担魏尔变换,波函数及其方程恰好满足这样的标度(规范)变换。于是从广义相对论出发,经过魏尔的巧手,规范场论诞生,它对电动力学重新作了诠释,并最终导致了正确的强、弱力理论的创建(即杨–米尔斯规范理论,它是麦克斯韦电磁理论的“远方表兄”) [1] [2] [6] [7] 。杨–米尔斯规范理论反过来又促进了对引力理论的理解,即人们认识到引力理论也是一种规范场。自旋联络引力规范理论以洛伦兹转动群作为基本的规范群,其高维自旋仿射联络具有杨–米尔斯规范场特征 [26] [54] [55] [56] ,因此它可以统一引力理论和杨–米尔斯理论 [57] 。此主题将在下文“规范场论札记(II)”中评述总结。
在历史上,卡鲁扎–克莱因的引力–电磁统一方案(1921,1926年)不同于魏尔方案(1818~1919年),前者没有像魏尔那样引入新的标度对称性,而是通过引入第五维度的方式,将五维广义相对论中剥离出四维时空引力场方程和麦克斯韦电磁学方程。此时的高维引力理论还没有包含强、弱相互作用。在1938年,克莱因把强、弱力也放进他的高维统一方案之中,于是以高维引力作为外壳,克莱因引入了电子–中微子二分量同位旋守恒定律、规范场论协变导数思想,将他的规范场写成了二维矩阵形式,提出了广义电磁场概念 [11] [12] [13] ,导致了他在1938年在效果上建立了正确的SU(2)非阿贝尔规范理论 [14] [15] 。值得一提的是,尽管克莱因以引力理论作为他的矢量规范理论的外壳,但是其实并无必要,他只是想用这个外壳作为他的广义的矢量规范理论的物理起源,他需要为粒子的同位旋寻找一个寄主。克莱因1938年理论 [11] [12] [13] 不仅是一个非阿贝尔规范理论,也是一个将电磁力和当时的核力(这里指导致质子–中子同位旋衰变或者中微子–电子同位旋发生相互作用的弱力)统一起来的理论。
现在可以总结一下历史上的规范耦合引入机制:魏尔范式和卡鲁扎–克莱因范式是两种引入规范场的方法,也是引入新的动力学自由度的方式。魏尔直接引入新的自由度的新的对称性,要求新自由度满足新的变换下的不变性,这其实是学自微分几何和广义相对论,每一种变换不变性意味着一种对称性,每一种对称性对应于守恒的物理量(Noether定理)。卡鲁扎–克莱因没有引入新的对称性(仍旧沿袭广义相对论的对称性),但是通过引入高维空间来引入新的自由度,于是将电磁场与引力场统一了起来。在1938年克莱因矢量规范理论中他仍然继承了这一思想,希望用高维来承载弱作用同位旋自由度,这也符合他的“统一场论”希望。而1954年的杨–米尔斯理论实际上采用了魏尔范式,直接引入同位旋自由度和规范对称性,不寄希望于用引力来承载弱作用同位旋自由度。虽然克莱因理论的出发点是高维引力,但其内广义电磁场与(电子–中微子、中子–质子)同位旋二重态的规范耦合内容与引力理论也是可以独立的。
规范理论除了在纵向物理研究领域(如量子场论、粒子物理标准模型、广义相对论论、超对称、超引力、弦论)之中成为核心或重要构件外,近年来在其它领域如固体凝聚态物理、玻色凝聚量子物态领域、光量子物理、复杂系统物理学和各种交叉研究领域等也引起了广泛兴趣,有的研究方向获得了有趣的研究结果 [58] - [63] 。在这些专题中,规范场论具有方法论意义,有助于从新角度加深对其中的物理原理的理解,或者在计算求解和简化模型上带来方便,或者因为这些领域本身出现等效规范场现象,研究人员探索人造“磁学”和拓扑特性,将自然界的基本物理现象在应用领域中“复现”出来,给人以启发性意义。基础物理和应用物理各领域之间的交叉研究,让研究人员得益于思想借鉴,有助于提出新的物理学原理。