量子演化系统微分几何概念札记(II):标架场、自旋联络、旋量与挠率
A Note on the Differential Geometry Concepts in Quantum Evolutional Systems (II): Vielbein, Spin-Affine Connection, Spinors and Torsion
DOI: 10.12677/MP.2021.116016, PDF, HTML, XML, 下载: 157  浏览: 308 
作者: 沈建其:浙江大学光电学院,浙江 杭州
关键词: 非厄密哈密顿量规范标架场自旋联络旋量挠率复流形Non-Hermitian Hamiltonian Gauge Vielbein Spin Connection Spinors Torsion Complex Manifolds
摘要: 一个物理体系,如果相互作用哈密顿量算符含有演化参数,那么其可以被称为量子演化系统。这样的(参数)演化系统可携带几何或整体特性,体现其拓扑效应。研究量子演化系统的前人理论方法包括Lewis-Riesenfeld不变量理论及基于此理论的一种么正变换方法。我们以最简单的二态体系旋量(可用于手工计算)为例,旋量可以用于构造此么正变换,我们探究该么正变换方法的物理含义,发现其可以用于表示规范群空间标架场,构造Yang-Mills规范势。由此我们可以定义非阿贝尔规范群空间的平直与弯曲度规,研究该规范群空间中的复Levi-Civita联络以及自旋联络,也可以计算其存在的扭率和挠率。本文从探讨非厄密哈密顿量系统的一般性质出发,研究了非厄密薛定谔方程和非齐次薛定谔方程的求解方法,然后以二态体系哈密顿量、Lewis-Riesenfeld不变量及其本征态作为基本素材,构造规范标架场、联络、曲率等,再将规范群空间与高维引力规范理论内空间对接起来。我们把非阿贝尔规范场论写成复流形微分几何,而高维引力规范理论内空间正是一个复流形,此为理解和建立引力场和规范场的统一理论奠定数学基础。本文内容的应用并不仅限于规范理论和引力理论。如果将此套方案用于量子力学,可以定义所谓的薛定谔联络。本文得到结论:凡是线性微分方程组,无论是否齐次,均可以定义其数学空间内的“旋量”、标架场、联络、曲率和挠率;即使对于单一的微分方程,只要它含有两个或两个以上自变量(如二维和三维空间中的电磁学和声学Helmholtz方程)且无法用分离变量法求解,那么其中必然会呈现出等效的规范势,而该等效的规范势(联络)也可用标架场表示出来,从而度规、曲率和扭率或挠率均可以定义和计算。本文专题对量子力学、量子光学及电磁理论中部分问题的理解亦有参考价值。
Abstract: A physical system could be referred to as a quantum evolutional one if its interaction Hamiltonian operator contains some evolutional parameters. Such an evolutional system can carry geometric or global characteristics, reflecting its topological effects. Theoretical methods for studying quantum evolutional systems include Lewis-Riesenfeld invariant theory and an invariant-based unitary transformation approach. Taking a kind of simplest two-state system spinors as an example (which can be used for manual calculation), the spinors can be adopted for constructing a unitary transformation. We explore the physical meanings of such a unitary transformation method and find that it can be used to express the mathematical form of Yang-Mills gauge potentials. Then we can define flat and curved metrics of its non-Abelian gauge group space, and study complex Le-vi-Civita connections and spin-affine connections, where the existing contortion and torsion can also be calculated. In this paper, general properties of non-Hermitian Hamiltonian systems will be discussed, and the methods for solving non-Hermitian Schrödinger equation and inhomogeneous Schrödinger equation will be investigated. The Hamiltonian operators, Lewis-Riesenfeld invariants and their eigenstates of such two-state systems will therefore be utilized as elementary tools aiming at constructing the relevant vielbein fields, affine connections, curvatures and so on for the present gauge group space, which is then connected with inner spaces of a higher-dimensional gravitational gauge theory. The non-Abelian gauge field theory can be rewritten as complex manifold differential geometry, and since the inner space in a higher-dimensional gravitational gauge theory is just such a complex manifold, it lays a mathematical foundation for understanding and establishing the theory of unification of gravitational field and gauge field. The application of this paper may not be limited to gauge theory and gravitation. If the scheme is employed in quantum mechanics, a so-called Schrödinger connection can be defined. Some conclusions in this paper can be drawn as follows: In all linear differential equations, whether homogeneous or not, the “spinor” field, vielbein, connection, curvature and torsion in their mathematical (group theoretical) spaces can be defined; even for a single differential equation, which contains two or more independent variables (such as electromagnetic and acoustic Helmholtz equations in two- and three-dimensional spaces) and it is unable to be solved by using the method of separation of variables, an equivalent gauge potential will unavoidably emerge, and such an emergent equivalent potential (connection) can also be expressed in terms of the vielbein fields. Therefore, the metric, curvature and contortion or torsion can be defined. The topics in this paper would also be of interest for understanding some issues in quantum mechanics, quantum optics and electromagnetic field theory.
文章引用:沈建其. 量子演化系统微分几何概念札记(II):标架场、自旋联络、旋量与挠率[J]. 现代物理, 2021, 11(6): 126-178. https://doi.org/10.12677/MP.2021.116016

1. 引言

本专题上一篇论文研究了量子系统在演化过程中会涉及到的若干微分几何概念及其应用,包括几何相联络、规范势、度规和曲率张量等 [1]。本文继续此专题,内容包括旋量、标架场、自旋联络、曲率和挠率等性质。这些知识具有比较广泛的适用性,在含时量子系统、量子光学、拓扑物理系统(如凝聚态、光学、声学领域)、规范场论、引力理论以及“引力–规范统一”理论中都会有应用价值。Kleinert在这方面已经写了一本专著 [2],尽管本文处理方法与它有很大不同。Kleinert专著主题为“多值场论在凝聚态、电磁学和引力理论中的应用”,内容包括凝聚态中的缺陷和位错的挠率、曲率和规范理论、超导超流的多值场论处理、时空晶体中的引力理论等 [2]。将各种物理现象和效应用微分几何和规范场论思想来处理是该专著的主要精神,根据不同现象找共同秉性,从而让读者对看似无关的物理现象有一个更为本质的理解。本文则研究含演化参数的量子力学系统以及一般光学、声学材料系统,研究其复流形微分几何性质包括标架场、度规、自旋联络和曲率等,构造规范群空间和规范势联络。

本文的切入点是二体系统的哈密顿量算符体系。尽管量子力学中常见的哈密顿量体系都是厄米的,但是本文有意从非厄米哈密顿量体系出发。究其原因是,一方面非厄米哈密顿量体系代表之一即所谓的宇称–时间对称性结构系统是当前的研究热点之一 [3] [4] [5] [6] (包括量子力学、光学甚至声学系统之内),另一方面由本作者所研究的基于厄米哈密顿量体系的复流形规范标架场、度规、联络和曲率理论概念和数量关系对于非厄米哈密顿量体系其实也是成立的,因而值得在一般情形中亦研究。

二体量子哈密顿量系统的代表性例子有很多,如电子、中子或质子的自旋磁矩和磁场的相互作用体系、经典光场与原子二能级体系的相互作用 [7]、超导约瑟夫森结系统、双耦合介观电路或超导电路 [8]、双耦合波导体系 [9] 等,它们的哈密顿量算符具有相同的数学结构,例如都是SU(2)群李代数生成元的线性叠加。当然,如果研究经典光场与原子能级体系的相互作用,或者由个耦合介观电路构成的体系,或者由个耦合波导构成的体系等,那么它们的哈密顿量算符具有SU()群结构。在本文中,为了使得手工计算得以进行,我们考虑最简单的SU(2)群结构,但是其思想具有一般性,即也适用于哈密顿量均具有SU()群结构的体系。具有SU(2)群结构的哈密顿量算符的本征态矢量是旋量。这样的旋量可以当作是SU(2)规范群空间的标架场(半度规),我们称之为规范标架场(gauge vielbeins)。于是,SU(2)规范群空间内的平直度规、弯曲度规、自旋仿射联络、曲率张量等都可以被定义出来,它们均可以用这些旋量表示出来。这正是一个复流形的微分几何。这里的自旋仿射联络具有Yang-Mills规范势的地位。由此也说明,如果把普通的四维时空的引力理论推广到高维复空间(允许标架场为复数),那么其自旋联络正是Yang-Mills规范势,从而在引力规范理论中,可以把引力场和Yang-Mills规范场统一在一起 [10],即Yang-Mills规范势正是高维自旋联络(高维复Lorentz联络)在低维(四维)普通时空内的反映,高维曲率张量是低维普通时空内的Yang-Mills规范场张量,物质场的高维自旋流密度是低维普通时空内的Yang-Mills规范荷的流密度 [10]。本文把非阿贝尔规范场论写成了一个复流形微分几何,而高维引力规范理论的内空间正是一个这样的具有非阿贝尔群规范对称性的复流形。

值得一提的是,目前引力理论(和广义相对论)一般教材与前沿文献之间其实是有所脱节的,亟待教材升级。例如目前的教材在阐述微分几何和爱因斯坦引力理论时,主要还是围绕度规、Levi-Civita联络、黎曼曲率张量来展开,所用的物质场要么是经典粒子和流体,要么是最简单的标量场。这对于研究天体物理与宇宙学而言,确实是足够了的。但是,对于引力理论本身的发展而言,以上内容还是相当古旧的,至少在引力理论文献中,所遇到的问题却是涉及比较复杂的旋量物质场,描述引力场的数学语言是标架场、自旋仿射联络、引力规范场曲率张量、挠率等(标架场、自旋仿射联络、引力规范场曲率张量分别代替了前述的度规、Levi-Civita联络和黎曼曲率张量)。尽管在某些场合下,这两套语言是等价的,新的或旧的语言并无特别优势,但在其它场合下,非得用“标架场、自旋仿射联络、引力规范场曲率张量”语言不可。例如,当物质场是旋量场的时候,其场方程中会有自旋联络(体现自旋与引力场的耦合),而自旋联络需要用标架场(半度规)表达。按照爱因斯坦–嘉当(Einstein-Cartan)引力理论 [11] [12] [13],自旋流密度张量还是挠率之源,所以时空会出现挠率(尽管这一思想被Yang-Mills型引力规范理论所不容)。Yang-Mills型引力规范理论要求挠率是时空平移规范场强 [13],时空平移对称性所对应的Noether流是物质的能量–动量张量,所以能量–动量张量才应该是挠率之源;黎曼曲率张量是洛仑兹时空转动对称性规范场强 [13],时空转动对称性所对应的Noether流是物质的自旋流密度张量,所以自旋流密度张量是曲率张量之源。

下面我们将从非厄米哈密顿量体系(其代表为宇称–时间对称性的哈密顿量体系 [3] [4] [5] [6] )作为出发点,从平凡例子到非平凡结果,研究其旋量解、复流形空间内的(规范)标架场、度规、自旋联络等。为复流形规范场理论建立了数学基础之后,就可以将它与高维引力规范理论 [10] 对接,因为高维引力规范理论的复空间微分几何正是上述复流形规范场理论,于是普通的规范场就可以被统一在引力(规范)理论之中 [10]。值得一提的是,本文的写作思路并非唯一(作者的实际研究过程却是与上述写作思路相反),上面的写作思路只是为了说明微分几何思想方法在诸领域具有比较广泛的适用性。

2. 非厄米哈密顿量体系的简单例子:宇称–时间对称电磁或声表面波

根据量子力学基本原理,可测力学量算符必须是厄米的(即力学量算符或者矩阵的转置再取复共轭后,仍旧是该算符本身),否则它的本征值就是复数,而物理可测量必须是实数,因此可测力学量算符必须是厄米算符。普通量子力学一直奉行着这条“金科玉律”。但实际上,这条要求太严格了,其实它可以放宽一下。一些人发现,只要力学量算符(如哈密顿量)满足一定的对称性,尽管它并不厄米,但其本征值仍旧可以为实数(实数本征值谱) [3] [4],这样的对称性叫宇称–时间对称性[parity-time (P-T) symmetry]。P-T对称系统可以用人工方法构造,在固体微结构、光学或声学材料结构中可以被设计出来 [5] [6]。在光学或电磁材料中,一个最简单的P-T对称系统是:如果介电系数的实部是空间坐标的偶函数,虚部是空间坐标的奇函数,那么就可以说这样的材料界面结构具有P-T对称性质,界面上的电磁波本征模式的相位常数仍旧是实数(不带虚部),即表面波在界面上传播时不会被损耗 [14] [15] (我们在该两文 [14] [15] 中虽然研究的是声P-T对称表面波,但是实际上缘起正是受到了来自电磁P-T对称表面波的启发)。具体举例说明:这样的界面材料结构的介电系数为(在区域), (在区域)。所谓P-T对称操作是:。当对介电系数完成P-T对称操作后,界面材料结构的参数仍旧为本身,例如(在区域)在P-T对称操作后变为(在区域); (在区域)在P-T对称操作后变为 (在区域),这与对称操作前的结果其实一样。满足这样的性质的界面就是P-T对称电磁材料界面。

作为对以上抽象观点的实战演练,我们以表面电磁束缚态(表面倏逝波) [15] 和一维光子晶体为例来说明光学或电磁P-T对称结构的若干特性。

表面等离极化激元 (surface plasmon polaritons, SPPs)是一种麦克斯韦方程在(具有负介电系数的)金属表面上的电磁束缚本征态(表面电磁波模式) [16]。该表面电磁模式因为场强很强,且对外部环境比较敏感,在光学、材料、化学、生物检测领域有重要应用价值 [17]。我们先来研究一下表面电磁波模式的一般理论,然后把它推广到P-T对称表面电磁波模式。

图1是P-T对称界面结构,介质1 (位于y-z平面上方)和介质2 (位于y-z平面下方)的介电系数和磁导率各自互为复数共轭()。我们可以研究简化的情形,即介质1和介质2的相对磁导率为1,只有介电系数为复数共轭()。我们设表面电磁波(束缚本征态)的传播方向为z方向;在y方向上电、磁场均匀,也即电、磁场关于y坐标的导数为零。根据麦克斯韦方程,界面附近的介质1和介质2内的电磁场分布为 [16]

Figure 1. Parity-time symmetric interface. The surface electromagnetic bound state can be sustained at the interface (y-z plane) between medium 1 (located in the half space of x > 0) and medium 2 (located in the half space of x < 0), if the dielectric coefficients (or the magnetic permeability) of medium 1 and medium 2 satisfy the condition of parity-time symmetry, and the electromagnetic wave can be confined on the interface in the form of surface evanescent wave

图1. 宇称-时间对称界面。如果介质1 (位于x轴的正轴区间)和介质2 (位于x轴的负轴区间)的介电系数(或者磁导率)满足P-T对称条件,则介质1和介质2之间的界面(y-z平面)上会呈现表面电磁束缚态,电磁波能以表面倏逝波的形式被约束在界面上

在上面表达式中,介质1和介质2内的电磁波(倏逝波)在x方向的衰减系数为(注:为真空波数)。根据电磁边界条件,电场强度在界面上的切向分量必须连续,即;磁场强度在界面上的切向分量也需要连续,即。这意味着。由于已经有,故而这意味着我们就有 [16] [17] [18]。需要指出的是,该电磁场的表面本征态是TM模式(因为,非零磁场仅在垂直于入射面即z-x平面的y方向上) [16]。从关系式(由电磁场的边界条件得到),我们可以得到表面电磁本征态(在方向上的束缚态)在方向上的相位常数: [16] [17]。计算过程如下:关系式可以被化为。将衰减系数平方代入进去,我们就有,于是。这样,我们得到

,从而表面电磁本征态在方向上的相位常数就这样可以得到。

讨论方向上的相位常数有特征意义:如果介质1和介质2内的介电系数互为复数共轭, (即满足P-T对称),那么就为纯实数,也就是说,P-T对称体系也可以承载表面电磁束缚态,介质1和介质2内的电磁衰减系数是互为复数共轭的关系。由此也可以发现该电磁波模式的振幅(除去公共因子)在x轴正区间和负区间也具有复数共轭的关系 [15]。

承载传统的表面等离极化激元的界面条件是需要有金属的负的介电系数(如金属、普通介质) [16] [17],现在我们这里不需要负的介电系数,也可以承载电磁表面波。另有一个重要的不同点是:在传统的光滑金属表面上是无法直接激发出表面等离子波的,因为,所以在光滑金属表面上的波数无法提供足够的光子动量来产生表面等离子波的波数(需要依靠棱镜耦合器来提供多余的波数 [16] [17] )。但是在P-T对称界面结构上,这一条件不再需要,因为其中之一介质内的波数(如)足够提供界面上的表面电磁波的波数

我们还可以考虑复杂的情形。针对图1介质1和介质2的介电系数和磁导率均各自互为复数共轭的情形(),此时界面上允许有两种表面倏逝电磁波模式(横磁TM和横电TE模):TM倏逝表面电磁波()的相位常数是;TE倏逝表面电磁波()的相位常数是。可以看出,如果介质1和介质2的介电系数和磁导率均

各自互为复数共轭(),那么上述TM和TE模在P-T对称界面上的相位常数也都为实数。

除了P-T对称电磁表面波外,我们曾提出和研究了P-T对称声表面波,指出它也可以在声学参量互为复数共轭的声学材料界面上存在 [14] [15]。在声学超材料中,质量密度是一个动力学参量,允许其带有虚部,如果两种声学介质的动力学质量密度互为复数共轭(P-T对称),那么在由该两种声介质构成的界面上的声表面波的相位常数也是纯实数(其中为此两种声学介质的体模量,我们暂时设它们相等 [14] [15]。当然它们一般是不等的。即使它们不等,它们之间的界面也允许有这样的声表面波模式)。对于这种P-T对称声表面波,我们可以使用类比的方法很容易来理解:我们设介质1和介质2的相对磁导率为1,介质1和介质2的介电系数互为复数共轭。对于TM模(磁场垂直于入射面即z-x平面),我们有,其中,且(这是TM模特征)。我们定义一个矢量,那么的散度等于,它是旋度的y方向。根据麦克斯韦方程,的y方向等于(也即。本例这里和下面所用的磁导率和介电系数都是指绝对磁导率和绝对介电系数),所以。与此同时,安培环路定律微分方程可以化为:。由于我们已经设表面电磁波(束缚本征态)的传播方向为z方向,在y方向上电、磁场均匀(也即电、磁场关于y坐标的导数为零),那么上述方程对于TM模可以简化为:。此可以进一步写为。现在我们有结论: (来自TM模的法拉第电磁感应定律)和(来自TM模的安培环路定律)分别可以写为

同时,我们可以回忆起声学横波的方程组 [19] [20]

其中第一个方程与质量守恒定律有关,第二个方程为牛顿–欧拉方程。在上述声学横波的方程组中,为声压,为流体声学介质质量元的速度或者固体弹性位移的时间导数即(说明:流体内难以定义弹性位移,因为弹性位移是质量元离开平衡位置的矢量距离,而流体内处处是平衡位置,但是质量元的速度仍旧可以定义。故流体力学及其微挠方程即声学方程内的可测物理量是,而不是);为声学或弹性介质质量密度,为体模量,声速平方为。可以发现,上述TM模电磁波的方程组与声学横波的方程组在数学结构上是一模一样的:磁场在y方向的分量类似声压,矢量类似质量元速度矢量,介电系数类似声学或弹性介质质量密度,磁导率类似声学介质内的。有了这样的类比关系,那么对表面电磁波的所有性质 [16] [17] 的理解可以很容易被移植到声波中来理解 [14] [15]。

下面看P-T对称光子晶体。将两种介质周期性排列、组装起来,形成ABABAB……型结构,如果晶格常数的数量级与光波波长同数量级,那么这构成一维光子晶体 [21] [22] [23] [24]。已知一维(无穷长)光子晶体内的电磁波的色散关系是 [25]

这里,设这两种介质的折射率为,其长度分别是,晶格常数为。电磁波在两种介质内的波数为。根据上述色散关系,我们可以求出电磁波在一维光子晶体内的波数 [23] [24]。假设这两种介质的折射率为纯实数(虚部小到可以忽略不计),根据上述色散关系可以看出,波数要么是纯实数,要么是纯虚数。如果求出来的波数是一个纯实数,那么这个对应的频率范围为电磁波的“导带”;如果求出来的波数是一个纯虚数,那么这个对应的频率范围为电磁波的禁带。如果带有虚部,且虚部满足一定的条件(如P-T对称,即的实部相等,虚部互为相反数,且介质周期),那么以上性质仍旧保留,即波数要么是纯实数,要么是纯虚数,故而P-T对称光子晶体仍旧可以保留普通光子晶体的一般性质。简要数学分析如下:在P-T对称光子晶体中,互为复数共轭,那么为纯实数;也互为复数共轭,那么也为纯实数,于是根据前述光子晶体色散关系,这要求也为纯实数,设,则,结果为。要求它为纯实数,只有两种可能:要么,要么,所以光子晶体内的波数要么是纯实数(光波“导带”),要么是纯虚数(光波“禁带”)。

3. 宇称–时间对称性及对一般非厄米哈密顿量体系的分类

上面已经讲了宇称–时间对称性在电磁学和声学中的实例 [14] [15]。下面来讲宇称–时间对称性的一般理论。我们从量子力学能量本征值方程的角度来考虑有关P和T变换。在本征值方程两边左乘算符,得到,它可以化为,其中新的哈密顿量算符为。有两种典型情况值得专门考虑:(i) 当本征值(能量本征值是实数)且(哈密顿量具有P-T变换不变性或P-T对称性),那么我们就可以得到,将此方程与原方程比较,就可得到(态矢量具有P-T变换不变性);P-T对称哈密顿量所满足的关系等价于或者(变换算符与哈密顿量对易,这说明算符有确定的本征值,是一个守恒物理量) [3] [4] ;(ii) 本征值(能量本征值是纯虚数)且(哈密顿量具有反P-T变换不变性或反P-T对称性 [26] [27] ),那么我们就可以得到,将此方程与原方程比较,我们得到;关系式意味着,即或者

当然我们还可以考虑更为一般的情形: (为实数)。它进一步变形为,其中新的哈密顿量算符为。该新方程也可以写为。于是将它与比较,我们得到,即,或者。当,分别对应于前面的P-T对称 [3] [4] 和反P-T对称 [26] [27] 情形。对于的情形,我们可以称之为“分数P-T对称”。

上面讲的都是在坐标系统中的P-T对称。推而广之,P-T对称也可以在二态体系中实现。这样的体系的哈密顿量(二维矩阵)的对角元的实部相等,但虚部为互为相反数。二态体系的例子很多,如二能级原子体系、磁场中的磁矩、超导约瑟夫森结、耦合波导 [5] 等。P-T对称的哈密顿量也可以被推广为反P-T对称的哈密顿量 [26] [27]。如此,这类物理系统就有P-T对称、反P-T对称、厄米、反厄米哈密顿量四种可能性,我们可以用哈密顿量矩阵表达式将它们分别表示为

在此基础上,我们可以考虑如下四种组合:

(1)体系:总哈密顿量为P-T对称哈密顿量算符和厄米算符之和,例如。对此哈密顿量施行P变换操作,就是把矩阵元素指标1和2互换,即,得到;施行T变换操作,就是对各个参数取复数共轭,于是得到,它与原哈密顿量算符一样,这就是哈密顿量算符的P-T变换对称性,本征值方程为。让其本征值方程算符的行列式为零,即,我们就可以得到及哈密顿量本征值。当时,本征值为纯实数;当,本征值为复数,即此表示P-T对称体系会发生破缺,这种形式的P-T对称哈密顿量可以在双耦合波导内添加适当的增益机制来实现,前人对此已有研究 [5]。

(2)体系:总哈密顿量为P-T对称哈密顿量算符和反厄米算符之和,例如。我们要求其本征值方程算符的行列式为零,即,我们从而得到本征值。无论关系如何,本征值总是复数。

(3)体系:总哈密顿量为反P-T对称哈密顿量算符和厄米算符之和,例如。如果本征值方程算符的行列式,那么本征值方程为,我们可以得到本征值。无论之间的关系如何,本征值总是复数。

(4)体系:总哈密顿量为反P-T对称哈密顿量算符和反厄米算符之和,例如。对此哈密顿量施行P变换操作,就是把矩阵元素指标1和2互换,即,得到;施行T变换操作,就是对各个参数取复数共轭,于是得到。如果本征值方程算符的行列式,那么本征值方程为,我们可以得到本征值。当,本征值为纯虚数。该体系的一个特点是其中一个模式的衰减率为正,另一模式的衰减率可正可负(即);当时,本征值为复数,即此反P-T对称体系发生破缺。设,这种哈密顿量可以写为

这正是一般的反P-T哈密顿量形式 [26] [27]。

我们研究任意情形的哈密顿量及其本征值方程算符的行列式:

这可以得到本征值所满足的方程,其中系数可以进一步写为

,这是P-T对称所需要的条件;当,这是反P-T对称所需要的条件;当,这是传统厄米性要求;当,这是反厄米性要求。此形式将上述四种情形写在了一起。

二能级体系的裸态和缀饰态之间的转换是么正变换,么正变换不改变哈密顿量本征值。由于反厄米耦合的哈密顿量算符的本征值是,由此我们推断出只能由来生成它(对于负的衰减系数,需要专门的设计来实现)。考虑到

其右边第一个矩阵与单位矩阵成正比,右边第二个矩阵为P-T对称矩阵,这说明反厄米耦合的哈密顿量算符正是构成P-T对称的哈密顿量的配件。

在二态体系中,如果演化方程为

其中衰减项为

那么演化方程可以化为

如果能设法(设计合适的外部调控条件)去掉非齐次项,如让能级2 (或态2)向第三个能态衰减(衰减速率为),那么这就得到一个反P-T对称体系。

如果一个二态体系满足方程,它可以进一步化为

如果能设计适当的调控条件去掉,那么这就是一个反P-T对称体系。具体说来,可以建议这样来办到:哈密顿量中这一需要被去掉的项具有对角化结构,它在形式上具有二态(二能级)体系的自由哈密顿量特点,因此我们可以采用“在外加磁场中的塞曼能移效应”或“在外加电场中的斯塔克能移效应”来将其抵消,即:设两个能级有相反的磁量子数(一般总是可以找到),那么它们有相反的磁矩(),在外磁场内的能级各自会移动频率(塞曼能级移动效应),因此我们取适当强度的外加磁场就可以让精确相等,从而由外磁场引起的二能级体系哈密顿量与前述需要去掉的项精确抵消,使得剩余的哈密顿量算符具有反P-T对称结构。

反P-T对称方程也可以在超导隧道结内的准粒子输运过程中实现。描述该准粒子输运过程可以借助Bogoliubov-de Gennes方程 [28]

其中分别系电子与空穴波函数,为电子和空穴化学势,为超导能隙 [28]

我们已经在此方程组中添加了耗散(衰减)项(原方程组 [28] 内无此二项),此方程也就具有反P-T对称形式。我们认为,在具体实践中,这种在Bogoliubov-de Gennes方程 [28] 中被添加的耗散(衰减)项可以用温度效应(空穴–电子复合)来产生。

4. 具有非厄米哈密顿量的薛定谔方程解

上面我们已经提出了具有非厄米哈密顿量的体系的分类和特性。下面我们就来求解其薛定谔方程的解。我们以二态体系为例,研究具有如下哈密顿量算符

的含时薛定谔方程。此处已经被假定为纯实数。如果极角(polar angle)和方位角(azimuthal angle)都为实数,这样的哈密顿量用于表示电子、中子或质子的自旋磁矩和磁场的耦合,亦可描写经典电磁波与原子二能级体系的相互作用(拉比振荡)、约瑟夫森隧道电流穿透效应、耦合波导等 [7] [8] [9]。这样的哈密顿量是厄米的(),很多人研究过其定态与含时薛定谔方程的求解 [29] [30] [31] (以及见此几文所引用的其余若干文献。该二态体系有三个生成元。我们曾研究过任意三生成元李代数哈密顿量系统的薛定谔方程的求解 [31] )。含时的哈密顿量很容易得到,以经典光场与二能级原子相互作用为例,设光场为,那么大家熟知的经典光场与二能级原子相互作用哈密顿量算符为

其中拉比频率为 [7]。将此哈密顿量与前面的哈密顿量一般形式比较,我们可以得到。如果经典光场是两个时谐波的合成:,那么我们得到合成的光场为。于是受调制的波幅为。这样一来,在前面的哈密顿量一般形式中,有关参量就含有了时间参数。

在我们的本专题上篇 [1] 之中,含时薛定谔方程的解为具有如下结构的态矢量的线性组合:

需要说明的是,这是两个最简单的二分量的旋量(旋量是半阶张量,因为将极角增加只是反了一下号;只有当其转动弧度,即极角增加才恢复为转动前态矢)。Lewis-Riesenfeld不变量算符 [32] 为。上述是该不变量算符的本征态 [1],含时薛定谔方程的通解是的线性叠加:

其中允许增加各自的含时相位因子。根据薛定谔方程,利用前人方法 [32] [33] [34],含时相位因子所满足的方程是(在我们的本专题上篇 [1] 计算出)

其中(如果初始数值为零,那么可以认为它们差一个负号,但绝对值相等)。由不变量所满足的方程 [32],不变量算符内的角参数必须满足方程 [1]

需要注意的是,上面哈密顿量算符内的极角和方位角都为纯实数。由于我们在前面考虑了P-T对称物理系统,其哈密顿量不再厄米,因此我们也要研究一下非厄米哈密顿量算符,此时哈密顿量的极角和方位角可以为复数,那么以上结果(如表达式以及)该是如何选取呢?我们要证明,其实上述表达式仍旧成立。但需要小心的是,态矢量的厄米共轭怎么取?已知当极角和方位角都为实数时(从而也为实数),态矢量的厄米共轭是,态矢量的厄米共轭是,这样的满足正交、归一、完备性条件即 (为单位矩阵)。当为复数时(从而也为复数),态矢量

的厄米共轭必须仍旧取上述形式(即),因为普通三角函数关系(例如)即使在为复数时仍旧成立。但如果按照一般的取厄米共轭操作(转置和取复数共轭)方法来得到的厄米共轭态,结果是,利用这样的厄米共轭态,将不再能满足正交、归一、完备性条件,因为,所以,需要保留哈密顿量为厄米情形时的解的结果,但是改变厄米共轭的定义(实际上其目的仍旧是为了保留哈密顿量为厄米情形时的厄米共轭态的数学形式,只是参数允许取复数)。具体操作是:先将参量看作实数,对不变量本征态求厄密共轭,再将结果中的参量看作为复数。此为求解复哈密顿量系统的第一种方法。但是这种方法毕竟改变了厄米共轭的定义,我们能否有一种系统的办法来得到的厄米共轭态呢?这是有的,前人已经给出了系统的方法 [33]:先写出哈密顿量和不变量算符的厄米共轭形式

同时Lewis-Riesenfeld不变量算符所满足的方程的厄米共轭形式是 [33]。新的不变量的本征态是

于是态矢量的厄米共轭是的厄米共轭是

。这与前面当哈密顿量厄米时,的厄米共轭的厄米共轭刚好是一致的。这样,利用新的不变量的本征态,上述做法 [33] 就规范系统了。

不变量本征值方程是。两边左乘,我们可以得到;另一个不变量本征值方程是,两边左乘,我们得到。于是。将所得到的两个结果相减,推出。由于,所以(正交条件) [33]。

如果指标,那么不变量的本征值。这很容易理解,如果是厄米的(参数角为实数),则不变量本征值是实数;当内的参数为复数时(参数角为复数),我们要计算本征值方程 [33]。可以看出,的数学结构一样,只是有关参数变为了复数共轭而已,那么求的本征值,无非就是把内的原本是实数的本征值内有关参数变为复数,所以,其实就是,那么,而同时允许(归一化条件)。

在前述哈密顿量算符中,为互为相反数,这比较特殊,不具有一般性,因此还需要添加上一个单位矩阵算符(,其中为实数),因此一般的哈密顿量算符应是

这里含有四个参量,外加实数三个,共计七个独立参量,但是的独立参数一共八个(),这说明应该取复数为好,如。这样上述用表示的哈密顿量算符就具有一般性了。如果为复数,,那么

其中,实数待定,而复数不变。而在上面矩阵方程内,独立的方程一共有六个,即下述三个方程的实部和虚部各自成立:

。由于每个方程内左右两边的实部和虚部要各自相等,因此上述方程其实一共有六个,这意味着我们无法将因子消去,但可以通过某个么正变换(如 [34] )

将该因子消去。不过上法(求解复哈密顿量系统的第一种方法)对于为复数的情形也仍旧成立,所以其实也不必消去因子再来求解。

5. 一些非厄米哈密顿量体系的具体实现方案(二能级原子体系)

我们先来看反厄米耦合如何产生。反厄米耦合可以在一定条件下的二能级(或二态)系统中产生。下面提出一个方案。一个典型的二能级体系的哈密顿量可以写为

裸态和缀饰态可以互相表达(选取为纯实数,为复数,满足):

自由哈密顿量内的算符和跃迁算符可以用缀饰态表示出来,结果是

在自由哈密顿量算符中,的系数是

的系数是

这样,用裸态表示的相互作用哈密顿量可以被用缀饰态表示为

在缀饰态基矢表象下,它可以被写为矩阵形式,其中的四个矩阵元为

我们可以看出,内的内的互为复数共轭,它们只产生厄米共轭的哈密顿量。为了得到非厄米(如反厄米)的哈密顿量,我们只要令。它有多种可能性:如果,那么复数共轭为零,此时。剩余的量是(这两个非对角矩阵元具有反厄米形式)。这时,。最终我们得到的在缀饰态基矢表象下的哈密顿量算符为

如果,那么上述哈密顿量与结构一样,这正是一般的反P-T哈密顿量形式 [26] [27]。

我们再回到一开始用裸态表示的哈密顿量。它的矩阵形式是(以裸态作为基矢量)

设能量本征值为,那么。于是本征值所满足的方程为。态矢量为

,其中系数为

,其中系数为

与缀饰态比较,我们有缀饰态内的裸态系数

我们在缀饰态表象下得到了二能级原子体系的反P-T对称的哈密顿量算符。我们可以看到,在两个缀饰态之间的拉比振荡,是反P-T对称的拉比振荡。以上只用到半经典理论方法(驱动两个裸态之间的跃迁的光场是经典场)。如果使用全量子理论方法来处理,那么也可以得到类似的反P-T对称的哈密顿量算符,于是这可以让我们研究反P-T对称的二能级原子布居数量子塌缩–复苏效应。

6. 一些非厄米哈密顿量体系的具体实现方案(Ilinski的金融市场模型)

在非物理领域,我们亦可以见到非厄米哈密顿量体系的例子。下面举一个金融物理学例子。在金融市场中,研究现金和股票的交易,从业人员需要分析短时间内的动态行为,如果将分别称作现金和股份的“流场”,分别表示资金流的密度,金融学的规范理论研究者Ilinski建立了分析该交易市场演化的动力学方程 [35] [36]。我们发现该方程在形式上很类似关于超导隧穿电流的约瑟夫森效应费曼唯象方程,只要把有关参量(如耦合系数、能级能量、库伯对波函数相位)由纯实数变为纯虚数即可。我们先来看超导约瑟夫森效应方程。

两块超导材料之间靠近时(用金属或绝缘体相隔)会表现出弱接触现象,具体体现为超导库伯对电子可以穿过隔绝层材料发生隧道贯穿效应 [37] [38],两块超导体之内的超导电子对波函数的相位之间有关联,这就是约瑟夫森效应 [37] [38] [39]。如果两块超导材料之间用绝缘层相隔,则绝缘层材料厚度可以为十纳米到几十纳米就可以发生弱耦合;如果用金属材料相隔,那么金属层厚度可以取几微米量级,即当隔绝材料自由电子数密度越大,厚度更大也能实现弱接触 [38] [39] ;如果采用半导体材料作为两块超导材料之间的隔绝层,那么材料厚度需要介于两者之间(如0.1微米到1微米之间)。

分别是左右两块超导体内库伯电子对的波函数,那么约瑟夫森效应的费曼唯象方程(phenomenological equation)是 [39]

之所以称之为唯象方程,是因为该方程不探究约瑟夫森效应的本源和具体机制(本源机制要用量子场论探讨)。所谓唯象方法、唯象理论,是指先不关心物理过程背后的本质,只利用一些对称性、守恒量等对表面上的现象建立起数量联系。在超导约瑟夫森效应中,表面上的现象是隧穿过程中库伯对数守恒。我们知道,在二能级原子布居数概率的拉比振荡中,上下两能级的电子概率之和是守恒的(),遵守这样的规律的哈密顿量一般为SU(2)群三个生成元的叠加。由此可以受到启发,人们也可以直接写出上面的费曼唯象方程。费曼唯象方程与二能级原子布居数概率的拉比振荡方程是一模一样的。根据传统做法,令两个库伯电子对波函数分别为,费曼唯象方程可以被化为 [39]

上述第一个方程两边除以(为了方便,我们取耦合系数或者隧穿系数为实数),于是得到

上述方程的实部和虚部分别为

同理,对于上面第二个费曼唯象方程,我们也很容易得到

上面四个方程是约瑟夫森效应应用研究中被常用到的四个方程 [39]。

下面我们作推广。如果(纯虚数), (纯虚数), (纯虚数), (纯虚数), (纯虚数),于是前述方程需要变为

所满足的方程为

这里的方程只有两个,而变量却有四个()。不妨引入几个其它条件,例如(虽然这里有两个等式,但由于暂时未知,故这里实际上相当于只引入了一个条件),将上述所满足的两个方程相减,得到

再假设(引入第二个条件),那么。于是上式变为

将前述所满足的两个方程相加,我们得到,即。于是,化为

,也即

同理,我们也可以得到

以上关于的方程正好就是经济学(金融物理学)中体现现金和股份“流场”的演化方程 [35] [36],但我们的上述推导方法与Ilinski的方法 [35] [36] 不同。

虽然我们看不出P-T对称和反P-T对称有何真正重要的基础原理意义,也看不出其在应用上的真正的实用价值(它们的哈密顿量或电磁介质的介电系数实部和虚部要求精确满足一定的条件,但这些条件在实验上可能并不稳定)。尽管略带讨巧取宠的概念会引起兴趣从而成为热门的点子,但毕竟其作为一个存在,它推广了传统量子力学的厄米对称性的约束要求,研究它亦有一些意义,如我们可以从新的角度看待量子力学的原理(其中一条原理要求量子力学的力学量必须要用厄米算符表示)。我们也可以推广粒子拉格朗日量的质量项或者相互作用项,例如薛定谔方程的拉格朗日量密度为,其中P-T对称的相互作用势能项可以为。但这个相互作用拉格朗日量密度不是实数,我们还必须要加一个复数共轭,于是得

,其中相互作用耦合项为

。但这样一来,与有关的贡献自动消失。如果在拉格朗日量密度中不添加的复数共轭项,这样的相互作用拉格朗日量密度就不具有么正性。所以,P-T对称无法出现在实数的拉格朗日量密度中,它只能被手动(by hand)放入场方程或运动方程之中。同样的道理,在Klein-Gordon场和Dirac场的拉格朗日量密度中,内的与P-T对称有关的贡献项也是自动消失的。

7. 非齐次薛定谔方程的解

在量子力学中,薛定谔方程通常为齐次方程,即右端源项为零。但是,在较为复杂的系统中,非齐次薛定谔方程也是常见的,例如一个大系统内的子系统所满足的方程,一般是非齐次的。比较典型的情形是体现量子相干性的三能级原子系统的“电磁感应透明”效应(描述此三能级系统与两个光场的耦合作用的薛定谔方程本身是齐次方程,但是如果我们令大多数原子布居在基态能级,那么两个高能级的概率幅所满足的方程是非齐次薛定谔方程;在用密度矩阵表示的方程中,也出现了非齐次源项)。半导体受到光学或热学激发,电子–空穴对产生,自由粒子数不守恒,这也可以对应非齐次薛定谔方程。至于在光学中,非齐次薛定谔型方程就更常见了,因为麦克斯韦方程本身就是非齐次方程(由于电流密度项的存在),而在一定条件下,麦克斯韦方程可以改写为薛定谔方程的形式。

我们来研究一下获取非齐次薛定谔方程的解的一般方法。显然,因为齐次方程的解本身满足完备性条件,那么非齐次方程的解可以用齐次方程的解来展开,只是展开系数并非是常系数了,而是时空坐标的函数。展开系数最终由源项和哈密顿量算符一起决定。例如,对于一个二态系统,齐次方程的解为

它们满足齐次薛定谔方程:。于是上述非齐次薛定谔方程的解可以写为。我们将它代入非齐次薛定谔方程之中,得到

方程左边展开为

方程左右两边消去相等项,得到(即展开系数不再是常系数,而是由源决定)。然后在两边左乘,利用正交条件,得到

于是我们就可以得到非齐次方程的解中的叠加系数(展开系数),其中常量由初始条件决定。由于由齐次方程的哈密顿量决定,故而我们说叠加系数最终是由源项和哈密顿量算符一起决定。

8. 等效规范势产生的条件与一般性证明

量子力学和经典场论内的薛定谔方程、克莱因–戈登方程、狄拉克方程都满足规范对称(不变)性。在没有相互作用时,这些场满足整体规范(相位)变换不变性(规范对称性其地位与时空平移对称性等同);当涉及相互作用时,这些方程需要满足局域规范对称性,其普通导数要用协变导数代替。电磁场和Yang-Mills场是最常见的基本规范场,但是实际上,在物理系统和其它系统(例如金融物理学 [35] [36] )有很多规范场存在的例子。由于我们已知规范势起着协调不同时空点上的场量的相位关系和起着粘接场量(波函数)的作用,本作者又受到“有限元”方法思想的启发,于是给出一个一般性论证,提出和证明了一个定理:一个用微分方程描述的物理系统,如果其解不可分离变量,就会呈现有效规范势。作为一个特例,如果系统内的演化可以被近似划分为快变和缓变(绝热)两类过程,那么快变过程就会呈现有效规范势。需要说明的是,前人已经发现和应用此特例内容,例如在处理分子内原子振动问题的波恩–奥本海默近似中表现出来的诱导规范势等问题 [40] [41] [42] [43]。虽然这一绝热方法是贝利几何相位研究的重要路子 [40] [41] [42],但下面将证明,有效规范势的存在与系统过程是否绝热(或者是否可以被划分为快变和缓变过程)无关,或者说这些条件 [40] [41] [42] 不是本质的(使用这些绝热条件,只是为求解问题带来方便而已)。

在工程领域,有限元(分析)法是一种用于求解各类偏微分方程的重要数值(近似)方法 [44]。在求解过程中,研究者对所关心的时空区间进行离散化,即求解区域由很多有限元(子域或单元)组成,对每个子域或单元求解,再获得整域的总解,即用有限数量的离散子域解的组合去逼近真实系统的解 [44] [45]。本作者受到这一观念的启发,认为有限元思想可能其实就是规范场思想,同时根据其“对时空区域进行离散化”的精神,认为离散格子之间需要规范势粘接和协调,本作者给出了如下证明有效规范势存在的数学论证。

我们研究一个一般的体系,设其场方程或运动方程为。在一个体系内,如果坐标变量可以分为两类:类和类(或类和类),且解关于的过程可以分为快变和缓变两类(例如在非均匀波导内,电磁场随着波导纵向坐标为快变,但波导有非均匀横截面边长,这导致电磁波横向波数随着波导纵向坐标而发生慢变),我们可以将纵向坐标分成一个个离散的小格子,每一个格子有时空坐标数值(和时间)。求解具有缓变参数的过程,得到格子内的解(下标表示各种本征态矢量指标。是该格子区域子系统内的空间和时间坐标),在每个格子内将缓变参数(如坐标)暂时当作定值,然后计算求解快变过程方程,得到。这样,某个格子内的完整的解是 (的每一个数值代表一个格子),它是方程在这个格子内的特解,那么整个体系的通解为(为方便,已经把线性叠加系数合并入)。不可分离变量(似“纠

缠态”),因为都含有。解满足方程。为了方便,我们先研究解的导数:

对它两边左乘慢变态矢量(它关于坐标慢变),我们得到

内积是关于指标的内积,而坐标是它的慢变参量。再利用正交条件,我们可以得到

注意,最后一步使用了爱因斯坦重复指标求和规则(关于相同指标求和),故而省去了求和符号。于是我们得到重要关系

该式显示,待求的快变解的导数变为了协变导数(包含了规范势项)。我们再得到

。这里仍旧使用关于重复指标求和规则和完备性条件(单位矩阵),那么。与上面计算类似,我们得到结果

注意:上面使用了重复指标求和规则。再在上面结果左乘,获得。考虑到完备性条件(关于重复指标求和),我们得到

依此类推,设的任意函数是,那么可以化为

这样一来,原先的(仅含有普通导数算符的)方程,现在就可以化为新的带有协变导数算符的方程

由于所有的慢变解线性独立,所以,快变解只能满足方程。也就是说,原始方程比起现在得到的的方程来,形式一样,只是在普通导数项上多了一项规范势()。需要指出的是,坐标变量分为两类:类和类。内不含类坐标,所以方程可以简化为:

。又因为呈现的(emergent)规范势是,其中确实是规范势,但是其实不是规范势。可以设(其中的特征值),那么原方程可以被化为如下形式

我们从所呈现的规范势看出,该等效规范势来自于一个条件:原始方程的解无法分离变量,即原本出现在快变函数类坐标也出现在(关于类坐标的慢边函数)。整个体系的通解正是一个关于快变和慢变过程的“纠缠态”(由于关于一切态矢量求和的存在,“纠缠态”无法被写成类解和类解的直积形式,也即它无法被分离变量)。上面我们关于“快变函数”和“慢变函数”的用词,只是一个因历史习惯而产生的称呼(因为前人文献如 [40] [41] [42] [43] 以及所引用的其它文献中一般会涉及绝热条件假设)。上面的结论实际与“快变”和“慢边”过程无关,只要解无法分离变量即可。规范势是用来调整、粘接格子与格子之间的解的,每个格子内的解独立,但是作为整体的解,它们需要被粘接起来。起着粘接作用的衔接场正是这里的等效规范势。在量子场论中有格点规范理论 [46],作为一种正规化手段,用来研究低能强相互作用,其也将空间分成离散的格子。类似这里的做法,在格点规范理论方法中,也可以有这样的等效规范势效应。

作为上面理论方法的一个实例,我们来具体考虑横截面渐变的波导内的波动方程。波导内的Helmholtz方程为。先考虑均匀波导。它的解一般可以写为如下分离变量的形式,其中分别为传播方向(轴方向)上的波函数

和横截面上的波函数,为矩形横截面边长。于是Helmholtz方程写为

它可以分离变量为两个独立方程(传播方向和横截面上的方程各自独立):

这是传统电磁波理论或电动力学内关于均匀波导的基本解算方法。

但是,现在我们考虑一种情形,波导在电磁波传播方向(轴方向)并不均匀,如矩形横截面边长随着纵向传播方向(坐标)而变,即都是的函数。那么在这种情况下,求解就十分复杂。不过由于横截面上的波函数(态矢量)满足正交、归一、完备性条件,那么非均匀波导内的场波解必然可以用展开。我们把展开式写为。将这试探解代入Helmholtz方程(左边),得到

我们设仍旧成立,只不过现在需要写为(即横截面上的所有参量均是的函数)。为了方便,我们把上式指标中的改为(即用统一代表波导横截面诸类指标)。于是Helmholtz方程(左边)为

上述关系可以进一步化为

最后一步插入了完备性条件(单位矩阵)。我们定义一个规范势。利用正交归一条件 (),最后一式的前半部分可以写为,进一步可以化为;另外,上述矩阵元最后一式的后半部分为。于是我们就可以得到

我们将左乘到前面的,就得到

它可以化为

由于,那么我们就有

每一个对应一个。上式写成矩阵形式是

注意:是方矩阵,而是列矢量(列矢量每一个分量都对应于一个)。上述是矩阵方程,且携带了协变导数,协变导数中出现了规范势。与前述均匀波导内传播方向上的方程比较,我们发现横截面随着坐标渐变的波导内传播方向上出现了等效规范势,而且还是非阿贝尔的规范势,此规范势的维度由波导截止频率和所用电磁波自身频率决定(决定出允许存在的模式有多少)。规范势内的指标代表诸类指标,如横截面的指标从零取到最大值(由满足的最大整数数值决定。为波导填充介质内的电磁波相速度)。需要说明的是,在上面的“呈现的规范势(emergent gauge potential)”计算过程中并未使用任何近似,也即无论非均匀波导横截面(随着波导纵向坐标)慢变还是快变,波导内的场的纵向波函数均有这一“等效规范势”结果。

以上针对的是一维传播方向(轴)。如果考虑的是无穷大平行板波导,电磁波传播方向是在-平面上,在方向上受限(两块平板之间距离为)。这是我们所熟悉的情形。现在我们考虑方向上的两平板间隙的函数,那么在-平面上的波函数将受到一个规范势。由于现在是二维情形(-平面),那么性质将会比一维情形丰富很多,包括非阿贝尔Aharonov-Bohm效应等也可以呈现。

通过以上论证我们可以看出,即使在单一的方程(即不必是方程组)之中,只要含有两个或两个以上坐标自变量(如电磁学和声学Helmholtz方程),且该方程无法用分离变量法来求解,那么体系内的方程在化解过程中必然会呈现等效的规范势。因为等效的规范势(联络)可以用标架场表示出来(对于上述非均匀波导而言,横截面上的波函数就可以构成这样的规范标架场),则复流形内的度规、曲率和扭率或挠率均可以被计算出来(其复流形由其内可以直接求解的本征基矢量即横截面上的态矢量所张成)。非均匀波导横截面边长随着纵向坐标而变化,那么横截面边长本身就是演化参数的函数,非均匀波导及内电磁波构成一个复数演化体系。

9. 复流形微分几何:复标架场与复度规

在前述诸二态体系中,我们已经构造了哈密顿量,其本征态正是旋量解,将这些旋量解作为复流形空间内的(规范)标架场,那么二态体系复流形空间的度规、自旋联络、曲率张量等都可以计算出来。如果哈密顿量含时,那么就要用Lewis-Riesenfeld不变量 [32] 的本征态来代替哈密顿量的本征态(对于哈密顿量含时的情形,哈密顿量本征态是没有多少意义的)。下面我们就来给出这一方法的一般计算过程。

在非阿贝尔规范理论中,本作者提出了规范标架场(vielbein)的概念 [47] [48],它也可以被称为Yang-Mills规范群内空间中的标架场或简称Yang-Mills标架场。

在“与不变量有关的么正变换”方法 [34] 中,哈密顿量么正变换是:

。这一数学结构与自旋联络类似,因此么正变换具有标架场的作用。利用文献 [1] 的的表达式,在SU(2)Yang-Mills非阿贝尔规范理论中规范标架场可以表示为

这里,。我们知道,建立了平直和弯曲空间矢量之间的关系,也具有这个功能。利用Lewis-Riesenfeld不变量算符的本征态

,我们可以发现。我们就有运算规则:。这说明,为规范群弯曲空间内的态矢量,它们与平直空间内的态矢量可以互为变换。我们可以看到,将“涉及不变量的幺正变换方法” [34] 应用到本文简单的SU(2)群结构系统中去,就可以得到SU(2)非阿贝尔规范标架场。基于上面的论证,结合前人已经有的工作 [29] [30] [31],可以发现,由该旋量(Lewis-Riesenfeld不变量算符的本征态)可以组建一个幺正变换将非对角化的哈密顿量化为对角化的哈密顿量 [29] [30] [31] (此幺正变换正是属于文献 [34] 提出的幺正变换特例),因此它具有非阿贝尔(规范)标架场的意义,从而我们可以定义二态体系的非阿贝尔规范群空间中的弯曲和平直度规。这是本文的一个重要的研究主题。

下面我们专门来讨论一下SU(2)非阿贝尔规范标架场及其相关性质。为了简化,上面的不变量本征态可以写为(不变量本征态),那么含时薛定谔方程的两个正交归一解为(作为标架场vielbein之定义的素材)。当然,它们也可以不必归一化,即它们也可以被取为(它们是彼此正交的,但不归一)。

还有一种更一般的选取法值得提及:

下面我们来讨论一下的完备性条件与正交性条件。完备性条件可以写作

其中是单位矩阵。正交性条件可以写作

当然,也可以不必归一化,即我们可以选取

如果不为常数(即它们是时间的函数),薛定谔方程中的普通时间导数需要用协变导数代替,也即它们可以被理解为在协变导数意义上是“常数”。于是我们可以用带有非常数的构造SU(2)非阿贝尔规范标架场:

它们的乘积(可以看作“正交性”条件)是

如果不是常数度规,那么这意味着它只能在协变导数意义上是“常数”,这类似广义相对论中的metricity条件()。

需要指出的是,是一个Lewis-Riesenfeld不变量。这容易证明:设是薛定谔方程的解,满足。那么我们计算得到

它可以进一步化为

于是得到Lewis-Riesenfeld不变量方程(量子Liouville方程) [32]。经过幺正变换 [34] 后,可以变为“局域惯性系”中的不变量

但是以上取法还是比较狭隘,因为由此生成得到的度规(SU(2)非阿贝尔规范群空间内的度规)是对角化的,不具有一般性(一般的度规,还应允许有非对角项)。由此说明,我们其实可以任意地定义两个(不需要正交的)含时薛定谔方程(带有协变导数)的解:

(它们既不正交也不归一)。那么我们可以构造新的SU(2)非阿贝尔规范标架场:

它们的乘积(可以看作“正交性”条件)是

其中内积为

同理,。于是SU(2)非阿贝尔规范群空间内的度规是

这是复流形内空间的度规,此内空间是SU(2)非阿贝尔规范群空间。

下面我们要计算上述度规的逆。我们先计算其行列式(determinant)

于是我们可以立即写出上述度规的逆

其中分母就是逆变度规的行列式。我们验证一下是否可以化为单位矩阵:

其中各个矩阵元分别是

我们可以看出都等于的行列式(即)。故而,命题得证。

既然我们已经有了标架场以及度规,那么我们就可以构造出SU(2)规范群空间中的平直度规:

如果为实数,那么为复数(它们满足),则上式结果可以写为

利用含时薛定谔方程(带有协变导数)的解(不需要正交):

我们可以计算得到

于是在

之中,方括号内的表达式可以被化为

它进一步可以被写为

在上面结果中,的系数含有

的系数含有

其中。可以看出的系数含有以上这部分的项刚好是相等的。

下面来证明的系数为零。先计算的系数,结果是

同理,可以计算得到,的系数也为零。

总之,现在我们有

这里的分母就是的行列式(),即它是

其中圆括号内的项为

这说明(SU(2)非阿贝尔规范群空间内的平直度规,它是一个对角单位度规)。

这样我们可以看出,以上体系是自洽的。需要说明的是,我们在以上论述时使用了均为实数、为复数的假定,这已经具有一般性。以上的数学内容尽管是对最简单的SU(2)非阿贝尔规范群空间进行论述的,相信对于任意复杂的规范群也应该有上述性质,但是具体显式会很复杂。此论题(把非阿贝尔规范场论写成复流形微分几何)的应用在于“引力–规范统一”,即Yang-Mills规范场可以用高维引力规范理论中的标架场表达出来,而高维引力规范理论内空间正是一个复流形;非阿贝尔规范群空间作为一个曾经的数学空间,它在引力规范理论中,其实就是一个高维物理空间。

下面我们构造不变量:利用

任何类似如下的组合

(是常数)

均可以被看作为不变量。以作为基,构造不变量,可以作为Higgs粒子的伴随表示(如果vielbein是Higgs场的基础表示的话) [47]。这种机制的主要思想是认为:标架场的协变导数类似Higgs机制中对称破缺时Higgs场取势能极值而自己的时空导数为零这一情形。但在对称破缺前,Higgs场的时空导数不为零。与此类似,标架场的协变导数也没有必要始终为零。我们举一个例子来说明:根据metricity条件,度规的协变导数为零,也即。我们其实没有必要让(它们不是的必要条件)。我们可以设。由此,。因此,只要关于反对称,那么为零也可以让成立。将推广到高维空间中去,我们计算(为高维Lorentz指标)。于是标架场拉格朗日量密度中的动能项可以包含。在“引力–规范统一理论”中,已经是Yang-Mills规范势。之后再把引进去,于是中就可以产生Yang-Mills规范势平方项,这意味着规范场携带上了质量项。此方案并非是要取代传统的Higgs机制,只是为了提供一个启发性思路。

10. 薛定谔联络:用规范标架场vielbein表示的联络

下面我们将提出和研究“薛定谔联络”的概念。薛定谔联络是复标架场vielbein协变导数中的Levi-Civita联络。为什么会有薛定谔联络?这是因为我们取了含时薛定谔方程的解的组合:

这里,此二态矢量不正交,这导致复流形的非对角度规;也不为常数(它们是时间的函数),这样,薛定谔方程中的时间导数必然需要是协变导数,也即它们只可以被理解为在协变导数意义上的“常数”。此时,含时薛定谔方程的普通时间导数需要被修改为协变导数。在前述非齐次薛定谔方程中,非常数系数来自于源项;而在这里,非常数系数与二维态矢量空间中的弯曲度规有关,因此普通导数算符要改为协变导数算符,即它携带了薛定谔联络。下面我们具体来讨论这个问题(该问题的结果可以用在规范群空间复流形,从而与“引力–规范统一理论”研究有关)。

我们来定义复流形内的协变导数。为了方便,我们选取空间坐标(逆变矢量)为实数(如果是复数,理论将极为庞杂),而度规以及标架场可以为复数。在这样的前提下,Levi-Civita联络为两种复数(但它们彼此复数共轭):

在上述关系中的指标上标注有横线和竖线。指标上的横线表示该指标所对应的矢量为横矩阵,指标上的竖线表示该指标所对应的矢量为列矩阵。利用metricity条件,我们可以得到(普通的或引力场的)规范群空间中的复数Levi-Civita联络

其中为扭曲张量或组合挠率(contortion),满足。由于

,我们可以看出两种Levi-Civita联络与两种扭曲张量各自都满足复数共轭关系:。结合,由此说明。从这点可以看出,的实部关于反对称,其虚部关于对称。

对于复数vielbein,我们也可以定义其Levi-Civita协变导数

需要指出的是,四维时空内的标架场用vierbein表示,维数超过四维的时空内的标架场用vielbein表示[在德语中,bein是指leg (腿足),vier表示four,vielbein表示many]。在本文中,凡是非四维的时空(无论四维以下还是四维以上)的标架场,我们都称之为vielbein。标架场的带有(复Lorentz群)自旋联络(如)与Levi-Civita联络(如)的协变导数定义为

上面式子可以写为

于是我们可以写出用规范标架场vielbein表示的(复Lorentz群)自旋仿射联络:

① 据,可以得到,进一步得到以及。再利用,可以有。这样我们就有用规范标架场vielbein表示的(复Lorentz群)自旋联络

② 根据,可以得到;再使用,可以得到。于是我们就有用规范标架场vielbein

表示的(复Lorentz群)自旋联络

③ 根据,我们可以得到。我们再利用,就有。于是我们得到用规范标架场vielbein表示的(复Lorentz)自旋联络

④ 根据,我们可以得到。我们再利用,就有。这样我们就得到了以规范标架场vielbein表示的(复Lorentz)自旋联络

11. 具有联络的薛定谔方程

前面我们已经得到含时薛定谔方程(带有协变导数)的如下解

如果不为常数(而是时间的函数),那么必然只能在协变导数意义上是“常数”。是含时薛定谔方程(不带有协变导数)的解,由于可以选择为常系数,故而也满足含时薛定谔方程(不带有协变导数)

下面我们来研究含时薛定谔方程(带有协变导数)的解(为了方便,令):

于是得到含时薛定谔方程(带有协变导数,即含有联络)

我们由此可以定义协变导数。此时含时薛定谔方程是

(带有协变导数)。

需要注意的是,可以被理解为标架场。根据其协变导数定义,我们可以有(使用了)以及

这里,我们要专门交代一下指标和符号体系:通常的复Lorentz时空(不分内外空间),我们用表示弯曲爱因斯坦时空指标,用表示平直洛伦兹时空指标;在引力–规范统一方案中,当复Lorentz时空紧致化为内外空间后(即外空间就是普通1 + 3维时空,内空间为Yang-Mills规范群空间),我们仍旧用表示弯曲爱因斯坦时空指标(外空间),用表示平直洛伦兹时空指标(也是外空间),但是对于(高维)内空间为Yang-Mills规范群空间的情形,我们用表示(高维内空间)弯曲爱因斯坦指标,用表示(高维内空间)平直洛伦兹时空指标。与四维时空比,Yang-Mills规范群空间当然是内空间。在引力规范理论中,把普通四维时空称作外时空,把高维空间称作内空间。在引力–规范统一方案中,这种高维内空间正好就是Yang-Mills规范群(内)空间。Yang-Mills规范群(内)空间作为一个曾经的数学空间,在引力规范理论中,它是一个高维(额外维)的物理空间。

最后,我们还要关心一下Levi-Civita联络。由于可以忽略不计,又由于可以设,那么,但是不可不计(一般在复流形内,必须要有扭曲张量)。于是,我们就得到了

12. 复空间内各种标架场的协变导数

根据协变导数定义,复空间内的标架场vielbein的协变导数

其中

这样我们就有

我们希望,于是得到

又由于,我们有

与前面已经得到的比较,我们可以知道:

联络就是哈密顿量,且

下面研究一下高维内空间(规范群空间)中的自旋联络。自旋联络可以展开为

因此,联络就是哈密顿量,这是完全自洽的。

现在,我们已经得到

我们也可以得到

上面两个式子可以写为

它们的厄密共轭是

利用可以构造不变量,如。这样其协变导数就是

于是我们就有。这是Lewis-Riesenfeld不变量方程(但却带有协变导数算符)。

我们有如下四个vielbein协变导数

改变有关符号,我们得到规范群空间(Lorentz群内空间)内的表达式

于是

利用,从上面式子我们可以进一步得到

于是我们就有

这与前面得到的Lewis-Riesenfeld不变量方程一致(前面已经得到,联络就是)。

以上关于SU(2) 规范标架场vielbein的构造,可以推广到任意其它李群中去,如SU()群。我们所提出的规范标架场有两个用途:1) 用于引力–规范统一(本例只是一个玩具模型——SU(2)规范群空间内的微分几何);2) 如果规范标架场可以作为Higgs场,那么Higgs伴随表示,可以用形如不变量的量来承担(这在前面已经有叙述)。

13. 讨论不变量理论与规范场论之间的相似关系

从不变量理论可以看出,含时薛定谔方程与Lewis-Riesenfeld不变量方程 [32] 其实具有等价性(不变量算符可以用含时薛定谔方程的解来构造,含时薛定谔方程的解也可以用不变量的本征态来构造,因此含时薛定谔方程与Lewis-Riesenfeld不变量方程 [32] 可以互相推导出对方)。含时薛定谔方程与Lewis-Riesenfeld不变量方程分别可以理解为同一物理事物的不同表示(如矢量表示和张量表示,或者基础表示和伴随表示)。

含时薛定谔方程与Lewis-Riesenfeld不变量方程这一组方程,其地位意义也可以理解为狄拉克方程与Yang-Mills非阿贝尔规范场方程的联立。已知在Lewis-Riesenfeld不变量理论 [32] 中,我们需要构造一个不变量,使之满足哈密顿正则方程的量子版本即Lewis-Riesenfeld不变量方程(令),即下面第二个方程(量子Liouville型方程)

在规范场理论中,狄拉克粒子方程与Yang-Mills非阿贝尔规范场方程分别是

不过稍微有点区别的是,前者薛定谔方程的解并不反作用于规范场,而后者狄拉克方程的解产生了一个流源,反作用于非阿贝尔规范场。

建立不同领域之间的类比、对应关系对于理解概念十分重要。在历史上,不少学者如杨振宁、陈省身等指出规范场物理理论与微分几何数学之间的类比(对应)关系,将几何相位与纤维丛几何联系起来 [40]。纤维丛的基底空间是四维时空,纤维主丛对应各个规范场的规范空间 [49],联络对应规范场,纤维丛的截面是带有荷的物质场是截面的改变量 [35] [36] [40] [49],那么规范场论、引力理论和微分几何之间的联系,尤其是建立它们之间的同一性或统一性关系,也是自然的了。

14. 引力–规范统一理论:规范场复流形空间与高维引力规范理论内空间之间的关系

本文主题采用了便于计算操作的二维简单矩阵来演绎有关旋量、标架场、自旋联络、曲率等的性质,数学上虽然简单,但已经有助于理解复杂高维、高自由度的微分几何概念,从而为引力规范理论服务。引力规范理论的目的之一是为了统一引力场与Yang-Mills规范场 [50] [51] [52]。在引力规范理论中,我们可以将传统的四维时空中的(黎曼)曲率张量(局域Lorentz转动规范对称性下的规范场强) (其中为自旋仿射联络)推广到高维(内)空间(它实际上就是Yang-Mills规范群对称空间),从而使之变为(其中为Yang-Mills规范群内空间平直坐标之指标) [50] [51] [52],显然具有Yang-Mills非阿贝尔规范理论中的规范场强(曲率或规范场张量)的结构。在这一“引力–规范统一”理论中,高维空间转动对称群是低维四维时空中的Yang-Mills规范对称群,高维空间内的自旋联络是Yang-Mills非阿贝尔规范理论中的规范势,高维曲率张量是低维四维时空中的Yang-Mills规范理论中的规范场强,引力物质场(即引力源)的高维自旋流密度是低维普通四维时空中的Yang-Mills规范流密度。由于常见的Yang-Mills规范群是U或SU群,为了在引力规范群中衍生出U或SU群,我们需要选取复厄密度规和复数标架场,则所选取的引力规范群是SU(1,)群(这在复厄密度规和复数标架场理论中自动产生),高维自旋联络(Lorentz联络系数,即局域Lorentz转动下的联络)是其子群(即Yang-Mills局域规范群U或SU群)的规范势 [10]。通常Yang-Mills规范对称群空间可以看作是一个数学上的抽象空间,但实际上,在“引力–规范统一”理论看来,Yang-Mills规范群对称空间其实是一个在物理上的高维内空间,它是一个真实的空间,只不过是高维的(普通四维时空内的Yang-Mills规范场是高维自旋联络规范场)。值得一提的是,复厄密度规和复数标架场的微分几何数学形式十分繁琐 [10],例如Levi-Civita仿射联络个数比起熟知的普通广义相对论中的Levi-Civita仿射联络个数来多出了几倍(因为出现了复数Levi-Civita联络,一些指标有互为厄密关系),且时空内必然含有挠率(因为Levi-Civita仿射联络为复数,它们之差必然非零) [10]。如果我们选取另一种引力规范群方案,即度规与标架场仍旧为实数的情形,也即广义的转动群SO(1,)或SO()的模型,那么这会大大简化问题。在这样的引力–规范理论中,Yang-Mills局域规范群(内空间的对称性)是SO()广义(洛仑兹)转动群,例如,假设,那么可以从以上新引力规范理论中呈现出SO(10)群大统一理论(将电磁场、弱力场和强力场统一起来) [53] ;如果关于强、弱、电相互作用的大统一理论的规范群天然是局域SU(5)群 [54] [55],又因为SU(5)群属于SO(10)之子群,为避免上述的SU(1,)复度规理论(或复流形理论)的繁琐,我们可以用SO(1,)或SO()“引力规范群”来代替上面所讲的SU(1,)群;如果关于强、弱、电的大统一理论群天然是局域SO(10)规范对称群,我们自然就采用能统一电磁、弱力和强力场的引力规范群即广义的转动群SO(1,)或SO()群。这就是“引力–规范统一理论”的基本思想。

通常人们用非阿贝尔规范对称性如Yang-Mills规范对称性(涉及么正变换、规范群、联络、协变导数等)获得普通规范场的理论形式 [55]。下面我们指出,引力规范理论 [50] [51] [52] 可以将Yang-Mills规范理论呈现出来,从而统一引力场与规范场。

我们曾经提出一个引力规范理论,其引力场拉格朗日量密度和作用量为如下形式 [50] [51]

其中张量和标量以及

示楔积。反对称张量,其中四维时空中的(黎曼)曲率张

量(局域Lorentz转动规范对称性下的规范场强)为(为自旋仿射联络)。于是引力规范理论的引力场拉格朗日量密度的显式为

以上为紧凑的引力场作用量密度表述 [51]。我们的文献 [50] 内的引力作用量密度不紧凑,但是与紧凑的引力场作用量密度 [51] 相差一个全散度项,因此它们 [50] [51] 其实等价。我们引入一种静质量为普朗克质量量级的重场,添加上它与普通物质场的交叉耦合(cross coupling)的作用量密度 [50] 后,关于自旋联络求变分,我们可以得到自旋联络引力场方程

这里,为爱因斯坦张量。上述自旋联络引力场方程的首次积分正是爱因斯坦广义相对论方程:,其中起着积分常数功能的能量–动量张量满足方程的最简单解就是宇宙常数项:

该引力规范理论的特点 [50] [51] 是:(i) 爱因斯坦广义相对论方程是自旋联络引力场方程的首次积分解;(ii) 巨大的量子真空能的能量–动量张量不产生任何引力效应,因为其协变散度为零,它从而不在自旋联络引力场方程中出现。这解决了量子真空零点能量的引力发散之谜;(iii) 自旋联络引力场方程的首次积分解携带宇宙常数项,因此在这里,宇宙学常数是一个积分常数。

我们知道,Gauss-Bonnet项关于自旋联络的变分是一个全散度项,因此其不对引力场有贡献。于是我们可以在自旋联络作用量密度加上一项Gauss-Bonnet项,得到新的引力场作用量密度 [10]

上述是局域SO(1,3)洛仑兹转动群规范对称引力理论。我们把普通四维时空推广到高维,即局域SO(1,3+)洛仑兹转动规范对称性引力理论,其中1 + 3是普通四维时空维数,是高维内空间维数。普通四维时空内的洛仑兹平直指标用等表示,高维内空间中的平直洛仑兹指标用等表示。这样,上述引力场作用量密度在高维空间包含有一项Yang-Mills规范场作用量密度,其中曲率张量(也是SO()群Yang-Mills规范场张量)为。这里。由于SU()群是SO()群的子群,所以普通的SU()群Yang-Mills规范相互作用可以从上述SO(1,3+)局域洛仑兹群转动规范对称性引力理论中呈现出来 [10] [50] [51],也即该模型可以将引力场和规范场统一起来,Yang-Mills非阿贝尔规范场是高维洛仑兹群(引力)规范场。与此同时,对于物质场而言,高维自旋流密度便是低维Yang-Mills流密度。

上述理论是局域时空Lorentz转动规范对称引力理论,没有考虑到局域时空平移对称性。在五维de Sitter时空内,可以将四维Lorentz转动规范对称性和四维时空平移对称性统一在局域五维时空Lorentz转动规范对称性之内,它包含了曲率和挠率 [10]。这样的理论其实也包含了下面要评述的爱因斯坦–嘉当理论 [11] [12] [13],但前者更复杂。

15. 一个最简单的引力规范理论即爱因斯坦–嘉当理论:旋量场与挠率的关系

在普通黎曼几何和爱因斯坦广义相对论引力理论中,时空无挠,Levi-Civita仿射联络表示为

,它为黎曼对称联络(Christoffel符号)。但是当时空具有挠率时,Levi-Civita联络是非对称的,即。这里为组合挠率(contortion),而挠率(torsion)由两个组合挠率之差来定义:。需要指出的是,contortion的前缀con-有“相与、组合”的含义,所以它被译为组合挠率。名词contortion的另一个意思是“扭曲”,由于torsion已被称为“挠率”,那么本作者认为contortion亦可被译为“扭率”。

既然在微分几何和引力理论中涉及到挠率,那么这就意味着需要使用引力规范理论思想。1923~1925年法国数学家嘉当提出了第一个这样的理论,此理论被称为爱因斯坦–嘉当引力理论 [11] [12] [13]。我们把爱因斯坦–嘉当引力理论看作是一个引力规范理论,其中洛仑兹时空转动群是引力规范群之一,时空平移群是引力规范群之二,它们的动力学变量分别是自旋仿射联络(洛仑兹联络)和正交标架场(半度规)。洛仑兹时空转动群和时空平移群合成庞加莱群。标架场遵守关系式,自旋联络可表示为,其可以被展开为。这里涉及到Levi-Civita联络的项为

,也即自旋仿射联络内包括了一项。所以,当关于组合挠率求泛函变分时,其实也是在关于自旋仿射联络求泛函变分。但是,爱因斯坦–嘉当引力理论的引力场拉格朗日量密度并非曲率和挠率的二次项,实际仍旧是爱因斯坦–希尔伯特引力作用量密度(引力常数)。虽然这一引力作用量密度系用度规和Levi-Civita联络来表示出来的,其实它也可以被改为使用标架场和洛仑兹联络来表示,表达式是,其中(与洛仑兹时空转动群对应的规范场张量),由标架场表示的张量为。这样的作用量密度的动力学变量是正交标架场和洛仑兹联络

对引力拉格朗日量密度和物质场的拉格朗日量密度计算关于自旋联络的变分。我们采用(表示全散度项divergence term),

其中协变散度为(表示具有挠率的四维协变散度),其具体展开

式是(注意:)。这里定义了一个“广义”的挠率张量:以及矢量挠率。于是,对于引力场和物质场的作用量密度计算泛函变分,我们可以得到如下结果

由泛函作用量变分极值原理关于自旋联络的变分后的方程是。为了容易看明白,我们具体写为

这就是第一个引力规范理论(爱因斯坦–嘉当理论)的关键场方程(挠率方程)。为物质场的自旋流密度张量(下文会以狄拉克旋量物质场为例计算其自旋流密度张量)。

对引力拉格朗日量密度和物质场的拉格朗日量密度计算关于标架场的变分,结果为

由于可以得到爱因斯坦方程(也称为爱因斯坦–嘉当方程) (这是关于正交标架场的变分结果)。与传统无挠广义相对论引力理论不同的是,这里挠率会出现在Ricci曲率与曲率标量之内。

由爱因斯坦–嘉当第一方程,具有自旋的物质场的自旋流密度决定了时空挠率()。一般说来,由宏观平均而言,自旋流平均贡献为零(例如因自旋粒子的热运动,粒子不可能让自己的自旋发生定向极化),因此不产生挠率。因此从爱因斯坦–嘉当引力理论角度看,正因为这个原因,传统的爱因斯坦广义相对论没有考虑挠率。爱因斯坦–嘉当理论自动回答了为什么时空挠率为零。这是它的一个优点。而广义相对论先验地令挠率为零,没有回答为什么挠率不存在。在庞加莱规范对称引力理论 [10] 中,必须将曲率和挠率以同等地位看待。

作为引力源之一的自旋粒子,具有自旋流密度的自旋粒子包括矢量粒子和旋量粒子(规范粒子除外)。例如,作为旋量场,对称形式的狄拉克拉格朗日量密度可以写为。狄拉克场的协变导数写作,其内的自旋仿射联络写作,洛仑兹群生成元是(用旋量表示)。我们求狄拉克拉格朗日量的泛函变分(关于自旋仿射联络求变分),可得

将这一结果与前述对应,那么作为引力源的狄拉克旋量物质场的自旋流密度可以写为

需要说明,流行的爱因斯坦–嘉当理论版本并非只有一种,例如有的还以挠率作为动力学变量来变分。比起以扭率或自旋联络作为变量来,用挠率作为变量,变分将十分复杂,因为挠率张量本身是自旋联络和标架场的函数。以挠率和标架场作为引力场的动力学变量,违反引力的规范对称原理,所以我们不予采纳。

爱因斯坦–嘉当理论有其成功之处,但其缺点是它与Yang-Mills规范对称原理脱节,具体说来就是:标架场和挠率本是局域时空平移对称性的规范势和规范场张量 [13],其源应该是物质场的能量–动量张量,但是在爱因斯坦–嘉当理论中,其源却是自旋流密度 [13] ;自旋联络和曲率张量本应该是局域洛仑兹转动对称性的规范势和规范场张量,其源应该是物质场的自旋流密度,但是在爱因斯坦–嘉当理论中,其源却是物质场的能量–动量张量 [11] [12] [13]。造成这种脱节的原因是爱因斯坦–嘉当理论缺少曲率平方形式的引力拉格朗日作用量密度。更为复杂的引力规范理论(如文献 [50] [51] [52] 及引用的其它文献)引入了曲率平方形式的作用量密度,克服了这个问题。

16. 卡鲁扎–克莱因理论与规范场论的关系

卡鲁扎–克莱因(Kaluza-Klein)理论是五维时空中的广义相对论,第五维上的引力在普通四维时空内表现为电磁力,因此它将引力与电磁力统一了起来 [56] [57]。下面我们来看其要义。五维引力场理论中的Levi-Civita仿射联络是(我们用带波浪线的符号表示它是定义在五维时空中的),其中分量可以呈现麦克斯韦电磁场张量。卡鲁扎曾经设第五维是一个柱坐标,普通四维时空是五维时空内的一张膜,可设第五维上物理量均匀,如度规分量不再是第五维坐标的函数,即,则Levi-Civita仿射联络的显式为

其中度规分量是一种标量场,称为伸缩子(dilaton)。于是从Levi-Civita联络中自动产生了麦克斯韦电磁场张量(就是四维电磁势)。下面我们来看黎曼微分几何所定义的Ricci曲率标量,其可以写为。由于目前我们仅关心从高维引力场中如何展现出电磁场,我们暂时忽略Ricci曲率标量内的前三项之和即(它们主要是广义相对论引力效应)。我们只需要来分析第四项,也即。于是在五维广义相对论引力理论 [56] [57] 中,爱因斯坦–希尔伯特(Einstein-Hilbert)引力拉格朗日量密度可以退化为

其中正是电磁场张量(它由高维Levi-Civita仿射联络展现)。如果前面的系数(需要说明,只要通过适当的参数选择,这种定义可以允许,至少它在近似意义上可以成立),则五维引力拉格朗日量密度内就自动含有了普通的电磁场的作用量密度[具体说来,就是五维引力拉格朗日量密度可以被分解为普通四维时空的引力拉格朗日量密度和麦克斯韦电磁场的拉格朗日量密度。还有伸缩子(dilaton)的拉格朗日量密度也会呈现。此外,将粒子的五维时空线元定义退化到四维时空,就得到电动力学的带电粒子与电磁场的耦合作用量;将五维的测地线方程(引力场内粒子的受力方程)退化到四维时空,我们也可以得到普通四维时空内的Lorentz力项(),其中所包含的一项正是电动力学中荷电粒子在四维电磁势场中所受到的四维Lorentz电磁力。总而言之,从五维广义相对论(卡鲁扎–克莱因理论) [56] [57] 中可以推导出普通四维时空内的麦克斯韦电磁场方程和荷电粒子运动方程,也即引力场与电磁场可以被统一在五维时空之内,普通四维时空内的电磁相互作用是第五维的引力相互作用 [56] [57]。

众所周知,电磁场只是一种最简单的规范场(阿贝尔规范场),电磁场作为Yang-Mills非阿贝尔规范场的一个子群U(1)规范场,已经在1960年代被统一在其它的非阿贝尔规范理论即格拉肖–温伯格–萨拉姆SU(2) × U(1)弱电统一模型之中 [58],而弱电统一模型与强相互作用(量子色动力学SU(3)群规范场论)在1974年也被统一在SU(5)或SO(10)群大统一理论之中 [53] [54] [55]。尽管它们预言的质子衰变现象没有得到实验验证,但是理论物理学家认为通过引入超对称,可以解决(缓冲)理论和实验之间的矛盾问题。虽然无直接的实验证据(由于大统一能标太高),但是可以认为这样的大统一理论必然是正确的方案。它们的正确性由它们的美学价值保证,更是由这样的方案的唯一性身份所保证。理论物理学最怕的研究状态是一个实验现象由几十种完全不同的理论出来解释。每当一个实验事实出来,往往多种理论都宣称自己完美解释了实验(或者多家理论可能会自信地“冒认”同一个实验结果,但真理性解释只能有一个)。譬如现在为解释星系平坦转动曲线的各类星系“暗物质”和“修改的动力学”理论,众说纷纭,有几十个理论来解释宣称自我成功,但这些理论彼此不等价,这其实说明我们对该实验观察现象的本质还一无所知,这个领域因此还需要进一步发展,有待其中之一家理论最后胜出。而电–弱–强相互作用的大统一理论方案几乎就是唯一的,即最小群是SU(5)或SO(10)理论(SU(5)群是SO(10)群的子群)。我们很难想象大统一规范理论不是这样的理论。要是理论候选者不是这样的,这反而更是一个谜了。但引力还没有与电–弱–强相互作用统一在一起,为此目的,做法之一是要把卡鲁扎–克莱因原先的引力场–电磁场(阿贝尔规范场)统一方案推广到引力场–非阿贝尔规范场的统一,要从高维广义相对论中推导出描述电–弱–强相互作用的非阿贝尔规范场论,从而四力一统。这也正是属于当年爱因斯坦等人“统一场论”的梦想。

在非阿贝尔卡鲁扎–克莱因理论 [59] [60] [61] 中,普通Yang-Mills规范场衍生于高维引力场,Yang-Mills规范场强来自于Levi-Civita联络(之一部分),Yang-Mills规范势来自高维度规(表示高维内空间指标),Yang-Mills规范场的拉格朗日作用量密度(即规范场强平方项)来自于引力场的曲率标量。所以,这里看上去两者地位很不对等:如果按照“度规–联络–曲率”脉络顺序来看,规范势地位低于引力场一个级别,所以引力场与规范场表现很不同,至少它们两者的方程(爱因斯坦广义相对论方程与Yang-Mills规范场方程)结构很不相同。两个理论都有自己的规范势(联络)、场强(曲率),但是每个级秩并不对等。非阿贝尔卡鲁扎–克莱因理论中的规范势来自引力场的度规,规范场强来自引力场的Levi-Civita联络,规范场的曲率平方作用量密度来自引力场的曲率标量(爱因斯坦–希尔伯特作用量密度)。这些现象令人不够满意,至少在美感上令人不适,尽管非阿贝尔卡鲁扎–克莱因理论确实可以将非阿贝尔规范场从高维引力场中衍生出来,将规范场与引力场统一了起来 [59] [60] [61]。

不过这种方法也有一个缺点,那就是卡鲁扎–克莱因理论中的“宇宙学常数项”可能会破坏Maxwell-Weyl-Yang-Mills规范对称性。我们知道,Maxwell-Weyl-Yang-Mills规范对称性禁止规范粒子携带静质量。在非阿贝尔卡鲁扎–克莱因理论中,Maxwell-Weyl-Yang-Mills规范势来自于高维度规 (下标取普通时空指标0、1到3;下标取高维内空间指标)。度规虽然是局域时空平移规范对称性下的动力学变量(规范势),按说它不应该直接出现在广义相对论引力场方程之内(但实际有宇宙学常数项),但是微秒的是,度规还有另一重功能,它起着时空指标上升、下降的作用,这使得它要出现在时空体积元之中,如,它关于度规的变分非零。正是因为如此,才在关于度规的变分运算中,爱因斯坦方程出现了“宇宙常数”项。这一宇宙常数项在形式上使得引力子带上了静止质量项。由于高维引力波化身为低维的Yang-Mills规范场,那么这就使得非阿贝尔卡鲁扎–克莱因理论要求Yang-Mills规范场也要携带静止质量项,这就破坏规范对称性。下面具体讨论这个问题:

已知携带质量的光子场方程(Proca方程)为(为光子静质量)。在弯曲时空中,电磁场张量为,于是Proca方程的显式为

爱因斯坦引力场方程是,其中Ricci曲率张量的显式为(注:这里的符号体系与前面爱因斯坦–嘉当理论、卡鲁扎–克莱因理论符号体系略有不同,与前述理论比,整体差了一个负号)与 Levi-Civita联络在无挠

时的显式为。可以证明,对于引力波而言,内的第一项为零,即由于且引力波为零迹张量,故而(为引力波小振幅,为平直度规张量),而内第二项为二阶小量,根本可以不计,于是内的第一项为零。我们对内的剩余三项进行适当调整且使用无挠对称条件,Ricci曲率张量的显式就变为。自由真空内的爱因斯坦引力场方程(暂时不考虑宇宙常数项)为,即,它与弯曲时空内的麦克斯韦电磁场方程的显式在数学结构上非常相似(它们在宏观结构上完全一致)。因此引力波与电磁波一样,在巨大质量天体旁边有相同的“星光偏折”、“雷达回波延迟”效应。正是因为这个原因,在双中子星合并事件中产生的引力波和由合并导致的伽马射线爆发产生的电磁波经过1.3亿光年的星际旅行后仍旧可以同时到达地球 [62] [63] [64]。

下面我们考虑宇宙常数项。爱因斯坦方程为(暂时先忽略物质的能量–动量张量),经过指标缩并后变为(为时空维数),即。代它入爱因斯坦方程,我们得到。在时空维数时,引力场方程为,此即。为了方便,将它简写为:,其中Levi-Civita联络为,于是我们得到简化的引力场方程。对于引力波(横波)而言,此式还可以进一步简化为。此为四维时空内的情形。在维时空内,引力场方程。将它简写为:。将Levi-Civita联络代入进去,我们得到简化的引力场方程。对于引力波(横波)而言,此式还可以进一步简化为。由此我们可以解读出引力子质量平方为(自然单位制)。

现在我们考虑最简单的卡鲁扎–克莱因理论,它将引力场与电磁场统一了起来。设第五维指标为且度规分量不随着第五维而变化,即(卡鲁扎的柱坐标条件)。那么在设时,前述引力场方程化为,或者它可以写为。此方程与的结构是一模一样的(只要假设高维度规分量正比于四维电磁势,也即认为高维度规分量就是四维电磁势),那么由此就可以从卡鲁扎–克莱因理论(也即五维广义相对论)中推导出麦克斯韦方程。在卡鲁扎–克莱因理论中,电磁场是高维引力场在低维时空(普通四维时空)中的反映,电磁场在本质上是高维引力场,从而卡鲁扎–克莱因理论将电磁场和引力场统一在一起。于是我们就解读出光子质量平方为(自然单位制)。由此可见,在卡鲁扎–克莱因理论中,电磁波和引力波携带相同的静质量。在最简单的五维卡鲁扎–克莱因理论中,时空维数,于是电磁波和引力波静质量平方为。值得注意的是,质量平方为负数,也即它们的静止质量为纯虚数,粒子具有快子(tachyon)特点。根据宇宙常数值,可以算出这样的质量Kg数量级,需要在宇宙学尺度(百亿光年)上才可以体现出其效应。

宇宙常数尽管很小,但是在规范场论理论意义上不可小觑。度规或者标架场是局域时空平移规范对称性的规范势,但它在引力场中并非独立作为仿射联络(只有在退化为平直时空内时,它近似承担了仿射联络的角色)。这可从下面的推理中很容易看出:我们来讨论一个标量场的简单的梯度,它没有联络(它是一个普通导数)。引入标架场,那么可以拆分为,于是化为。令,于是,其中为时空平移算符(平移规范群的生成元),为局域时空平移规范对称性的规范势(联络)。这种写法虽然具有规范场论协变导数特点,但是它其实是近似写法。在广义坐标变换对称理论中,标量场的导数的精确形式其实是,而非。总之,虽然引力理论具有局域时空平移规范对称性,但是在场论中它不需要专门使用这样的“协变导数”形式。因此,在携带有宇宙常数项的引力场方程中,尽管引力子携带了质量项,但是它却不违反局域时空平移规范对称性。但对于卡鲁扎–克莱因理论中所呈现的电磁场而言,这样的结果就不容乐观了,因为它天生从母胎(高维引力场)中携带了自身的质量项,这就违反了Weyl的U(1)规范对称性。因此,除非放弃Weyl规范对称性,否则很难理解为什么优雅的Weyl规范对称性(它也是伴随量子力学而产生的)在卡鲁扎–克莱因理论中要被“平庸化”且被“作践”。让Maxwell-Weyl-Yang-Mills规范场从卡鲁扎–克莱因理论中呈现出来,且亦并没有将这种规范对称性与引力场的局域时空平移规范对称性统一在一起,这也意味着放弃了将这种Maxwell-Weyl-Yang-Mills规范对称性当作是一个基本的物理原理,付出的代价巨大。因此,卡鲁扎–克莱因理论及其非阿贝尔版本(将Yang-Mills规范场论与引力场论统一在一起)可能不是统一场论的合乎自然的路子。

17. 对引力场和规范场静止质量项的讨论

我们知道,超导体具有抗磁性,也即Meissner效应,外磁场无法穿透入超导体,这是因为电磁场在超导体内携带了有效质量,导致磁场一旦进入超导体表面就指数衰减。这是一种由 “感应(诱导)流”(induced current)引起的效应,由于材料零电阻,电流密度由磁矢量势感应而来,成正比,从而麦克斯韦方程右边的源项变为了光子质量项。在引力理论中,也存在类似效应,不过引力子携带虚数质量,从而发生的是反Meissner效应。

在物质附近,爱因斯坦引力场方程是。对于引力波(横波)而言,,Levi-Civita联络为,于是爱因斯坦引力场方程化为。在物质静态分布条件下,如果我们考虑为纯空间指标的情形,源项的空间分量为零,那么上述方程化为(为纯空间指标),其中(密度)。于是引力波(或引力子)具有虚数质量项。

下面我们考虑引力场内的反Meissner效应。物质粒子的运动方程为,取其中的有贡献的分量,方程为(为纯空间指标),其中(含普通引力项,也即gravitoelectric force项)和(含引力Lorentz磁力项,也即gravitomagnetic force项)。我们只考虑普通引力项,则,其退化为,其中。在此方程中,除了得到牛顿引力理论中的普通项外,还可以得到项。我们暂时不考虑普通项,只研究(为纯空间指标),由此可以得到(这建立了在引力场作用下,粒子所感应出来的速度与引力磁矢势之间的关系),这就是被感应出来的诱导流(induced current)效应。

对于引力波而言,内的第一项为零。但是对于其它引力场而言,这一项也需要考虑进去。于是引力场方程为。右边的源项为。代入,得到右边的源项为

我们再来考虑物质粒子的速度第零分量的演化:。其可以退化为(近似为1),即,于是得到(其中);或者也可以这样求解:,得到,那么。当时,。于是引力源项为。最终引力源项化为

从以上结果可以看出,物质在引力场作用下,会感应出速度,导致源项在引力场方程中变为了引力场的质量项,且静质量还是虚数,使得引力子具有快子(tachyon)性质。在宇宙早期,物质稠密,引力场的虚数质量的绝对值也大,因此这可能有助于让相距较远的物质之间建立因果联系。

我们来看引力场和规范场静止质量项在近年来的观察研究状况。在2017年8月17日,美国–欧洲引力波天文台合作组和美国宇航局伽玛射线爆发监测系统(即费米伽玛射线太空望远镜)探测到在1.3亿光年外的双中子星合并事 [62] [63] [64]。此爆发事件所产生的引力波(GW170817)和伽玛射线爆(GRB170817A)双信使同时到达地球(引力波比电磁波稍早到,两者仅仅相差1.7秒) [62] [63]。根据爱因斯坦–德布罗意关系,我们可以计算出,频率相同的物质波在通过相同长度的距离后,携带静止质量的波比零质量的波滞后时间才到达终点(如果,那么携带静止质量的波会提前到达终点)。延迟时间的计算方法涉及如下公式:。正的宇宙学常数项会使得引力波,从而使得引力波早到(当然,这非常微弱)。设电磁波静止质量严格为零(由规范对称性保证),将1.7秒代入,对于若干赫兹频率的引力波而言,我们可以计算出的数量级为千克。不过,由正宇宙常数产生的引力波静止质量的数量级仅仅为千克。这也说明,那引力波–电磁波双信使事件中的1.7秒到达时间差不可能来自正宇宙学常数产生的引力波静止质量项。1.7秒到达时间差极有可能是双中子星合并时确实是让引力波提前1.7秒被发射所致,毕竟引力是长程力,而电磁力是短程力,电磁波(伽马射线爆发)需要等双中子星完全合并才发射,而引力波在双中子星还处在螺旋环绕状态时(将靠近但还未完全靠近之前)已经可以被发射。我们可以来半定性估算这个问题:设彼此螺旋式环绕靠近的双中子星的有效(折合)质量为,双中子星相距,那么它们彼此之间的环绕速度近似为,彼此靠近的速度也是这个数量级,于是两颗中子星从相距、经螺旋式环绕和靠近、再到复合所需要的时间为。由此可以得到。由于此引力波信号(GW170817)由两个质量处于0.86倍太阳质量与2.26倍太阳质量之间的中子星合并而产生 [62] [63] [64],因此我们取双中子星系统的有效(折合)质量约为千克,于是得到结果:双中子星刚开始发射引力波时相距米。这一尺度也相当于所辐射的引力波波长数量级(如频率为10 Hz)。这也说明,即使相距米,两颗彼此螺旋式环绕靠近的中子星系统已经可以看作是一个引力波“四极振子”发射天线(双中子星螺旋式环绕周期与同数量级,也与引力波周期同数量级)。因此,两颗中子星在相距米时可能已经开始发射引力波脉冲,还需要再费1.7秒才正式合并为一体,才发生伽马射线爆发,最终经过1.3亿光年宇观距离旅程,可能正是这个原因导致伽马射线到达地球比引力波晚了1.7秒。

此外,另一种可能性也要考虑,即是否可能因为伽马射线光子在星际等离子体中携带了有效静止质量从而导致它延迟1.7秒到达地球?该静止质量平方为,其中分别是星际等离子体中电子数密度和电子质量。根据文献 [63],双中子星合并的产物伽马射线爆光子能量为75~2000 keV能量范围。我们以1000 keV为分析对象,它的频率为 g 2 A x k j A x j i = β i 2 ( z ) δ k i β i ( z ) ,假设1.7秒延迟纯由伽马射线光子携带了有效静止质量所致,那么根据延迟公式,我们可以计算出伽马射线光子在它到达地球的旅程中,有效静止质量千克。再根据上面的由等离子体所产生的光子有效静质量公式,我们可以计算出为了产生这样大的有效静止质量(千克),星际等离子体密度应为。这一数据太大(已经达到地球上稀薄气体浓度),星系内的平均等离子体密度只有数值量级,至于星系际平均等离子体密度那就更小。由此也说明,双中子星合并事件中的1.7秒延迟不可能是因为伽马射线光子在星际等离子体中携带了有效静止质量所致。但这一平凡的计算也促使我们考虑另一个机制:伽马射线光子在双中子星合并时的慢光效应。我们知道,普通中子星半径在10 km到20 km之间,质量大约为1.5到2.3倍太阳质量,其内平均粒子数密度为量级(折合为中子数密度)。中子星内部存在多种带电强子(如介子和重子)。伽马光子在中子星内部的等离子体频率平方为,其中为带电强子的数密度、为带电强

子的平均质量。如果带电强子的数密度为中子星物质密度(折算为中子数密度)的千分之一,即量级,而带电强子典型质量为1000 MeV,那么中子星内的等离子体频率就与双中子星合并时所发射的伽马光子频率同数量级,满足,此时伽马光子的群速度很小,例如可以为。双中子星合并后的体系半径为量级。伽马光子波长十分小,如果它是在双中子星合并体系中心产生,那么它还需要穿透合并体系才能辐射出来。伽马光子从产生到穿过双中子星合并体系半径,需要1.7秒也可以理解(即光速在双中子星合并体系内因为超高密度等离子体的存在而冷冻,下降了几个数量级),导致它出射后到达地球比引力波滞后了1.7秒。

与电磁波在等离子体内携带有效质量机制(感应极化)类似,引力波也会携带这样的有效静止质量,只要把内的分别用代替,得到,其中为质子质量。但是这一数值非常小,从而不产生实际可测效应。

除了光子在离子气体内携带有效质量导致慢速外,光子因离子散射导致自己随机行走(扩散)或布朗运动也会引发光子阻尼效应,这在质量/半径比值比较大的星体内尤为明显。设光子与带电粒子的散射截面为,带电粒子数密度是,光子的平均速度是,光子驰豫时间为(两次散射相隔时间),那么对于光子,就有关系。我们考虑一个简化的模型,设一个光子从星体中心透射出来之前,其被离子随机散射次,总位移为,其平方等于星体半径的平方,即。由于所有交叉项(数值随机)彼此抵消,之和为零,那么我们就有。于是光子从星体内透射出来到达星体表面需要花费时间。使用,我们得到所费时间,其中为星体质量,为离子质量(可以取核子质量,这样为核子个数,它也近似等于电子个数数量级)。对于太阳,质量约为kg,半径约为m,太阳中心所产生的光子与离子的散射贡献主要来自于光子–电子汤姆逊(弹性)散射(光子–电子汤姆逊散射截面为),那么光子需要费s (三千年量级)才能从太阳中心到达太阳表面。当然这个数据有所偏大,因为太阳表面光子能量为eV量级,可以发生经典汤姆逊弹性散射,但是太阳内部光子能量可以为X到伽马光子频段,光子–电子主要发生康普顿散射,其散射横截面会比汤姆逊散射截面略小。所以,总的说来,可以为千年量级。另一供对照的例子是,大家知道,来自距离地球16万光年的超新星爆发(SN1987A,1987年2月23日来自南半球大麦哲伦云)的光子到达地球的时间比中微子晚了三小时()。我们来分析这一由前人测到的数据。设超新星爆发所抛射的物质扩散速度为,在时间之内,半径扩散到大小。超新星爆发所产生的光子要透过这一半径区域(同时受到离子的随机散射)所费时间为。设被抛射的物质质量为,代抛射半径入扩散时间,我们得到关系。再将(约为万秒)代入,我们得到约为kg (为太阳质量的万分之一量级)。这是超新星爆发在万秒内所抛射的物质质量。那么对于双中子星合并事件而言,如果伽马射线暴产生于合并体中心,它需要先穿透半径约为20 km量级的中子星合并体,由于光子被随机散射,那么光子延缓的时间无疑巨大。所以,地球上首先所接收到的伽马射线暴应当来自双中子星合并体表面(而非内部)。双中子星合并事件中的伽马射线暴之所以延缓1.7秒,原因可能在于双中子星合并时抛射了物质,伽马射线光子需要穿透这一被抛射的物质层(抛射半径为),受到其离子的随机散射和阻尼,导致其到达地球的时间延迟(但不可能大于1.7秒)。由此,我们估算得到,在1.7秒量级,双中子星合并体系抛射的质量至多约为kg (为太阳质量的分之一量级)。而三小时后,它所抛射的质量还可以再提升几个数量级,但远低于超新星爆发所抛射的质量(kg)。所以,同样是在三小时之内,恒星演化晚期的超新星爆发事件所抛射的质量比双中子星合并所抛射的质量要大几个数量级。

上面的具体讨论主要结论是:双中子星合并事件中伽马射线到达地球比引力波到达地球晚了1.7秒 [62] [63] [64],其主要原因可能有两个:i) 彼此螺旋式环绕靠近的双中子星系统在相距一万千米时已经可以看作是一个引力波“四极振子”发射天线,开始发射引力波脉冲,但还需要再过1.7秒才合并为一体,此时才发生伽马射线爆发;ii) 双中子星合并时抛射了高温等离子体,伽马射线光子在穿透这一被抛射的物质层时会受到其离子的随机散射和阻尼(扩散和布朗运动),比起引力波来,其滞后到达地球。

双中子星合并事件 [62] [63] [64] 同时检验了1.3亿光年宇观尺度上的爱因斯坦广义相对论和麦克斯韦电磁理论。它表明,两者的场的静质量为零。在卡鲁扎–克莱因理论方案中,电磁场和引力场同源,那么两者的静质量相同。但双中子星合并事件中,引力波频率和伽马射线频率相差20个数量级,根据延迟公式,它们到达地球的时间应该很不同。但是只要小于千克,双中子星合并事件还不足于排除卡鲁扎–克莱因方案。这个结果(需要小于千克)比目前地球实验检测光子静止质量上限提升了几个数量级(当然,这一判据的有效性需要首先承认卡鲁扎–克莱因方案是正确的才能得到保证)。卡鲁扎–克莱因方案伸缩子(dilaton)标量场与引力波和电磁波的耦合不同,因此双中子星合并双信使事件亦有利于检验、比较它们的耦合系数,从而约束有关参数。

18. 讨论与结论

本文专题涉及“标架场、自旋联络、旋量与挠率”。此四概念之间有依存关系:旋量场的协变导数含有自旋仿射联络(洛仑兹联络),自旋联络需要使用标架场来表达,旋量场也是挠率之源(根据爱因斯坦–嘉当理论),或者旋量场是局域洛仑兹转动规范对称性引力源之一(根据引力规范理论)。本文的主题是把非阿贝尔规范场论改造为复流形微分几何形式;又由于高维引力规范理论的内空间正是一个具有相同的非阿贝尔群规范对称性的复流形,所以这意味着高维引力规范理论可以把引力场和规范场统一起来。

本文用二态量子体系引入旋量。旋量是二态体系哈密顿量的本征态。对于哈密顿量显含时间的二态体系,需要用Lewis-Riesenfeld不变量来代替哈密顿量来刻画该体系,旋量是该不变量算符的本征态。由该旋量可以组建一个幺正变换将非对角化的哈密顿量和对角化的哈密顿量联系起来,因此具有(规范)标架场的意义,从而定义二态体系非阿贝尔规范群空间中的弯曲和平直度规,然后可以构造二态体系规范群空间的自旋联络,曲率和挠率也可以进一步计算。由于哈密顿量本身也可以看作是一种联络,以及含时哈密顿量体系本身也产生“几何相”联络,因此有关标架场、度规、曲率和扭率或挠率,也均可以讨论。有关理论方法在本文前半部分已经阐述。本文方法尽管属于规范理论、引力场论和微分几何,但在量子力学、量子光学及电磁理论中亦可应用,本文前半部分讨论了不少例子。

正如自旋仿射联络可以用广义相对论引力理论中的普通标架场构造一样,对非阿贝尔规范势我们也可以定义其规范标架场,并用于表示前者,如此可以证明,上述么正变换正是规范标架场。借助此标架场,我们可以定义Yang-Mills规范群空间的平直与弯曲度规,计算研究该Yang-Mills规范群空间中的复Levi-Civita联络以及存在的扭率和挠率。以上方法属于引力规范理论方案。作为本专题应用的例子,本文还讨论和评述了三个引力理论:引力–规范统一理论 [50] [51] [52]、爱因斯坦–嘉当引力理论 [11] [12] [13] 和非阿贝尔卡鲁扎–克莱因理论 [59] [60] [61]。其中由本作者提出的引力规范理论 [50] [51] [52] 可以解释巨大的量子真空能为何无引力贡献这一谜,且能将爱因斯坦广义相对论引力理论和Yang-Mills非阿贝尔规范场理论统一起来,高维曲率和自旋流密度分别是Yang-Mills规范场张量和非阿贝尔荷流密度 [10] ;爱因斯坦–嘉当引力理论 [11] [12] [13] 能自然解释挠率为什么为零,但是其不符合Maxwell-Weyl-Yang-Mills规范理论路线;卡鲁扎–克莱因理论的优点是可以统一引力理论和规范理论 [59] [60] [61],缺点是其允许规范粒子带上质量。

本文内的方法以及微分几何概念“标架场、自旋联络、旋量与挠率”有远比本文所叙例子更广的适用性。为了介绍这种适用性,本文从二态非厄米体系出发来演绎、论证和评述,其结论具有较普遍的意义。可以说,凡是线性微分方程组,无论其是齐次的还是非齐次的,均可以定义其若干维数学空间内的“旋量”、标架场、联络、曲率和挠率,维数由其独立方程个数决定;即使对于单一的微分方程,只要含有两个或两个以上自变量(如二维和三维空间中的电磁学和声学Helmholtz方程)且我们无法对其用分离变量法来求解,那么该体系必然会出现等效的规范势,其复流形由其内可以直接求解的算符本征基矢量所张成,而等效的规范势(联络)也可以用标架场表示出来,从而度规、曲率和扭率或挠率均可以定义和计算。

参考文献

[1] 沈建其. 量子演化系统微分几何概念札记(I): 几何相联络、规范势、度规与曲率张量[J]. 现代物理, 2019, 9(6): 289-323.
[2] Kleinert, H. (2008) Multivalued Fields: In Condensaed Matter, Electromagnetism, and Gravitation. World Scientific Publishing Co. Pte. Ltd., Singapore.
https://doi.org/10.1142/6742
[3] Bender, C.M. and Boettcher, S. (1998) Real Spectra in Non-Hermitian Hamiltonians Having PT Symmetry. Physical Review Letters, 80, 5243-5246.
https://doi.org/10.1103/PhysRevLett.80.5243
[4] Bender, C.M., Brody, D.C. and Jones, H.F. (2002) Complex Extension of Quantum Mechanics. Physical Review Letters, 89, Article ID: 270401.
https://doi.org/10.1103/PhysRevLett.89.270401
[5] Rüter, C.E., Makris, K.G., EI-Ganainy, R., Christodoulides, D.N., Segev, M. and Kip, D. (2010) Observation of Parity-Time Symmetry in Optics. Nature Physics, 6, 192-195.
https://doi.org/10.1038/nphys1515
[6] Feng, L., Xu, Y.-L., Fegadolli, W.S., Lu, M.-H., Oliveira, J.E.B., Almeida, V.R., Chen, Y.-F. and Scherer, A. (2013) Experimental Demonstration of a Unidirectional Reflectionless Parity-Time Metamaterial at Optical Frequencies. Nature Materials, 12, 108-113.
https://doi.org/10.1038/nmat3495
[7] 张智明. 量子光学[M]. 北京: 科学出版社, 2015: 第2章.
[8] Li, C.Z., Chen, P.X., Liang, L.M. and Dai, H.Y. (2011) Quantum Computer Researches (I): Principles and Physical Realizations. Science Press of China, Beijing, Chap. 7.
[9] 吴重庆. 光波导理论[M]. 第2版. 北京: 清华大学出版社, 2005: 第8章.
[10] Shen, J.Q. (2016) Gravitational Gauge Theory as a Route to Gravity-Gauge Unification. In: Bailey, L., Ed., Gauge Theories and Differential Geometry, Nova Science Publishers, Inc., New York, Chap. 3, 97-178.
[11] Cartan, É. (1923) Sur Les Variétés à Connexion Affine et la Théorie de la Relativité Généralisée. Part I. Annales Ecole Normale, 40, 325-412.
https://doi.org/10.24033/asens.751
[12] Hammond, R.T. (2002) Torsion Gravity. Reports on Progress in Physics, 65, 599-649.
https://doi.org/10.1088/0034-4885/65/5/201
[13] Hehl, F.W., von der Heyde, P., Kerlick, G.D. and Nester, J.M. (1976) General Relativity with Spin and Torsion: Foundations and Prospects. Review of Modern Physics, 48, 393-416.
https://doi.org/10.1103/RevModPhys.48.393
[14] Shen, J.Q. (2014) Strong and Weak Confinement of Pari-ty-Time-Symmetric Acoustic Surface Wave. Europhysics Letters, 105, Article ID: 17006.
https://doi.org/10.1209/0295-5075/105/17006
[15] Shen, J.Q. (2016) Canonical Acoustics and Its Application to Surface Acoustic Wave on Acoustic Metamaterials. Journal of Physical Society of Japan, 85, Article ID: 084401.
https://doi.org/10.7566/JPSJ.85.084401
[16] 曹庄琪. 导波光学[M]. 北京: 科学出版社, 2007: 第9章.
[17] Maier, S.A. (2007) Plasmonics: Fundamentals and Applications. Springer Science + Business Media LLC, New York.
https://doi.org/10.1007/0-387-37825-1
[18] Shen, J.Q. (2012-2013) Surface Plasma Waves (Surface Plasmon Polaritons). “Electromagnetic Wave Theory” Course Classroom Lecture. Zhejiang University, Hangzhou.
[19] 许肖梅. 声学基础[M]. 北京: 科学出版社, 2003: 第3章.
[20] 马大猷. 现代声学理论基础[M]. 北京: 科学出版社, 2004: 第1-2章.
[21] Yablonovitch, E. (1987) Inhibited Spontaneous Emission in Solid State Physic and Electronics. Physical Review Letters, 58, 2059-2062.
https://doi.org/10.1103/PhysRevLett.58.2059
[22] John, S. (1987) Strong Localization of Photons in Certain Disordered Dielectric Superlattices. Physical Review Letters, 58, 2486-2489.
https://doi.org/10.1103/PhysRevLett.58.2486
[23] Joannopoulos, J.D., Johnson, S.G., Winn, J.N. and Meade, R.D. (2008) Photonic Crystals: Molding the Flow of Light. 2nd Edition, Princeton University Press, Oxford.
[24] Sakoda, K. (2005) Optical Properties of Photonic Crystals. 2nd Edition, Springer-Verlag, Berlin.
https://doi.org/10.1007/b138376
[25] Yeh, P. (2005) Optical Waves in Layered Media. John Wiley & Sons, Inc., Hoboken, Chapts. 4-6, 83-143.
[26] Zhang, H., Huang, R., Zhang, S.-D., Li, Y., Qiu, C.-W., Nori, F. and Jing, H. (2020) Breaking Anti-PT Symmetry by Spinning a Resonator. Nano Letters, 20, 7594-7599.
https://doi.org/10.1021/acs.nanolett.0c03119
[27] Peng, P., Cao, W., Shen, C., Qu, W., Wen, J., Jiang, L. and Xiao, Y. (2016) Anti-Parity-Time Symmetry with Flying Atoms. Nature Physics, 12, 1139-1145.
https://doi.org/10.1038/nphys3842
[28] 凌瑞良, 冯金福. 熵、量子与介观量子现象[M]. 北京: 科学出版社, 2008: 第6章.
[29] Gao, X.-C., Xu, J.-B. and Qian, T.-Z. (1991) Formally Exact Solution and Geometric Phase for the Spin-J System. Physics Letters A, 152, 449-452.
https://doi.org/10.1016/0375-9601(91)90552-J
[30] Datta, N., Ghosh, G. and Engineer, M.H. (1989) Exact Integrability of the Two-Level System: Berry’s Phase and Nonadiabatic Corrections. Physical Review A, 40, 526-529.
https://doi.org/10.1103/PhysRevA.40.526
[31] Shen, J.-Q., Zhu, H.-Y. and Chen, P. (2003) Exact Solutions and Geometric Phase Factor of Time-Dependent Three-Generator Quantum Systems. The European Physical Journal D, 23, 305-313.
https://doi.org/10.1140/epjd/e2003-00043-7
[32] Lewis Jr., H.R. and Riesenfeld, W.B. (1969) An Exact Quantum Theory of the Time-Dependent Harmonic Oscillator and of a Charged Particle in a Time-Dependent Electromagnetic Field. Journal of Mathematical Physics (New York), 10, 1458-1473.
https://doi.org/10.1063/1.1664991
[33] Gao, X.-C., Xu, J.-B. and Qian, T.-Z. (1992) Invariants and Geometric Phase for Systems with Non-Hermitian Time-Dependent Hamiltonians. Physical Review A, 46, 3626-3630.
https://doi.org/10.1103/PhysRevA.46.3626
[34] Gao, X.C., Xu, J.B. and Qian, T.Z. (1991) Geometric Phase and the Generalized Invariant Formulation. Physical Review A, 44, 7016-7021.
https://doi.org/10.1103/PhysRevA.44.7016
[35] Ilinski, K. (2001) Physics of Finance: Gauge Modeling in Non-Equilibrium Pricing. John Wiley & Sons Ltd., West Sussex, Chap. 7.
[36] 卡里尔•伊林斯基. 金融物理学: 非均衡定价中的测量(规范)建模[M]. 殷建峰, 李彦, 译. 北京: 机械工业出版社, 2003: 第七章.
[37] Josephson, B.D. (1962) Possible New Effects in Superconductive Tunneling. Physics Letters, 1, 251-253.
https://doi.org/10.1016/0031-9163(62)91369-0
[38] Josephson, B.D. (1964) Coupled Superconductors. Review of Modern Physics, 36, 216-220.
https://doi.org/10.1103/RevModPhys.36.216
[39] 张裕恒. 超导物理[M]. 第三版. 合肥: 中国科学技术大学出版社, 2009: 第14章.
[40] 李华钟. 简单物理系统的整体性: 贝里相位及其他[M]. 上海: 上海科学技术出版社, 1998: 第12章.
[41] Li, H.-Z. (1987) Induced Gauge Fields in a Nongauged Quantum System. Physical Review Letters, 58, 539-542.
https://doi.org/10.1103/PhysRevLett.58.539
[42] Mead, C.A. and Truhlar, D.G. (1979) On the Determination of Born-Oppenheimer Nuclear Motion Wave Functions Including Complications Due to Conical Intersections and Identical Nuclei. The Journal of Chemical Physics, 70, 2284-2296.
https://doi.org/10.1063/1.437734
[43] Shen, J.Q. and Chong, S.Y. (2020) Supersymmetric Gauge Potentials in Multiphoton Transition of Atoms and Squeezed-Vacuum-State Driven Supersymmetric “Isospin” Evolution. The European Physical Journal D, 74, Article No. 56.
https://doi.org/10.1140/epjd/e2020-100429-1
[44] 吴鸿庆, 任侠. 结构有限元分析[M]. 北京: 中国铁道出版社, 2000.
[45] 朱伯芳. 有限单元法原理与应用[M]. 第四版. 北京: 中国水利水电出版社, 2018.
[46] 刘川. 格点量子色动力学导论[M]. 北京: 北京大学出版社, 2017.
[47] Shen, J.Q. (2016) Quantized Weak Neutral Charge in Electroweak Interaction and a Possible GUT Group for Fundamental Force Unification. International Review of Physics, 10, 1-9.
[48] Shen, J.Q. (2009) Gravitational Gauge Theory Developed Based on the Stephenson-Kilmister-Yang Equation. International Journal of Theoretical Physics, 48, 1566-1582.
https://doi.org/10.1007/s10773-009-9929-9
[49] Ilinski, K. (2001) Physics of Finance: Gauge Modelling in Non-Equilibrium Pricing. John Wiley & Sons, Ltd., London, Chaps. 3-6.
[50] Shen, J.Q. (2009) A Gravitational Con-stant and a Cosmological Constant in a Spin-Connection Gravitational Gauge Field Theory. Journal of Physics A: Ma-thematical & Theoretical, 42, Article ID: 155401.
https://doi.org/10.1088/1751-8113/42/15/155401
[51] Shen, J.Q. (2016) A Gravitational Gauge Field Theory Based on Stephenson-Kilmister-Yang Gravitation with Scalar and Spinor Fields as Gravitating Matter Sources. General Relativity and Gravity, 48, Article No. 62.
https://doi.org/10.1007/s10714-016-2042-5
[52] Shen, J.Q. (2013) The Low-Energy Yang-Mills Gravitational Gauge Theory and Its Application to Astrophysics and Cosmology. In: Tao, Z. and Meng, N., Eds., New Developments in Low-Energy Physics Research, Nova Science Publishers, Inc., New York, Chapter 2, 13-126.
[53] Kim, H.D. and Raby, S. (2003) Unification in 5D SO (10). Journal of High Energy Physics, 1, 56.
https://doi.org/10.1088/1126-6708/2003/01/056
[54] Georgi, H. and Glashow, S.L. (1974) Unity of All Elementary Particle Forces. Physical Review Letters, 32, 438-441.
https://doi.org/10.1103/PhysRevLett.32.438
[55] 戴元本. 相互作用的规范理论[M]. 第2版. 北京: 科学出版社, 2005: 第11章.
[56] Klein, O. (1926) Quantentheorie und fünfdimensionale Relativitätstheorie. Zeitschrift für Physik A, 37, 895-906.
https://doi.org/10.1007/BF01397481
[57] Overduin, J.M. and Wesson, P.S. (1997) Kaluza-Klein Gravity. Physics Reports, 283, 303-378.
https://doi.org/10.1016/S0370-1573(96)00046-4
[58] Weinberg, S. (1967) A Model of Leptons. Physical Review Letters, 19, 1264-1266.
https://doi.org/10.1103/PhysRevLett.19.1264
[59] Kuyrukcu, H. (2014) The Non-Abelian Weyl-Yang-Kaluza-Klein Gravity Model. General Relativity and Gravitation, 46, Article No. 1751.
https://doi.org/10.1007/s10714-014-1751-x
[60] Cianfrani, F., Marrocco, A. and Montani, G. (2005) Gauge Theories as a Geometrical Issue of a Kaluza-Klein Framework. International Journal of Modern Physics D: Gravitation, Astrophysics & Cosmology, 14, 1195-1231.
https://doi.org/10.1142/S0218271805006900
[61] Barbosa, A.L., Guillen, L.C.T. and Pereira, J.G. (2002) Tele-parallel Equivalent of Non-Abelian Kaluza-Klein Theory. Physical Review D, 66, Article ID: 064028.
https://doi.org/10.1103/PhysRevD.66.064028
[62] LIGO Scientific Collaboration and Virgo Collaboration, et al. (2017) Multi-Messenger Observations of a Binary Neutron Star Merger. The Astrophysical Journal Letters, 848, L12.
[63] LIGO Scientific Collaboration and Virgo Collaboration, et al. (2017) Gravitational Waves and Gamma-Rays from a Binary Neutron Star Merger: GW170817 and GRB 170817A. The Astrophysical Journal Letters, 848, L13.
[64] LIGO Scientific Collaboration and Virgo Collaboration, et al. (2017) A Gravitational-Wave Standard Siren Measurement of the Hubble Constant. Nature, 551, 85-88.
https://doi.org/10.1038/nature24471.