三阶可对角化系数矩阵下Yang-Baxter矩阵方程组的解
On the Solutions to the Third-Order Yang-Baxter Matrix Equations with Diagonalizable Coefficient Matrices
DOI: 10.12677/aam.2026.154133, PDF, HTML, XML,    科研立项经费支持
作者: 李傲楠*:赣南师范大学数学与计算机科学学院,江西 赣州;易胜辉:于都县罗江中心小学,江西 赣州
关键词: Yang-Baxter矩阵方程Gröbner基Jordan标准型Yang-Baxter Matrix Equations Gröbner Basis Jordan Canonical Form
摘要: 本文给出了Yang-Baxter矩阵方程组在系数矩阵为三阶可对角化的情况下的解。通过对系数矩阵进行相似变换为Jordan标准型,再从解的结构出发分类讨论,使用Gröbner基技术来给出这个方程组的对应解。
Abstract: This paper investigates the solutions to the third-order Yang-Baxter matrix equations under the condition that the coefficient matrices are diagonalizable. By applying similarity transformations to reduce the coefficient matrices to their Jordan canonical forms, the structure of the solutions is analyzed through case classifications. The corresponding solutions are explicitly derived using Gröbner basis techniques.
文章引用:李傲楠, 易胜辉. 三阶可对角化系数矩阵下Yang-Baxter矩阵方程组的解[J]. 应用数学进展, 2026, 15(4): 35-41. https://doi.org/10.12677/aam.2026.154133

1. 引言

本文研究Yang-Baxter矩阵方程组

{ AXA=XBX, XAX=BXB (1)

的解,其中 A B 为3阶实可对角化系数矩阵。Yang-Baxter矩阵方程 AXA=XAX 因其与数学物理中Yang-Baxter方程在形式上相似而得名。Yang-Baxter方程由Yang [1]和Baxter [2]在统计力学中提出,用于描述一维量子多体系统中的散射行为,是现代数学和理论物理中一个基础而深刻的函数方程。虽然其形式简洁,却像一条隐秘的脉络,贯穿于完全可积系统、统计力学、量子群、扭结理论[3]乃至量子计算等多个重要领域。而Yang-Baxter矩阵方程是一个具有丰富代数结构和数值挑战性的非线性矩阵方程,其研究不仅深化了对矩阵函数与广义逆的理解,也推动了高效数值算法的发展。在纯粹数学与计算数学中占有重要地位,尤其在幂零阵[4] [5]、秩2矩阵[6]等特殊矩阵类[7]上的解的结构分析以及对角元的元素分析[8]等方面取得了系统而完整的成果。

文献[9]主要研究Yang-Baxter矩阵方程组(1),它打破经典Yang-Baxter方程 AXA=XBX 的对称性,从而摆脱“ X=A ”这一平凡解的困扰,并探索当两个系数矩阵 A B 不同时更丰富的数学结构。首先,作者建立了该方程组与一个“块状”经典Yang-Baxter方程之间的深刻联系,从而能够利用已知的结论。其次,他们从谱理论、交换性等角度系统地分析了解的代数性质,给出了可逆解、奇异解存在的必要条件,并特别研究了一类重要的“交织解”(即满足 AX=XB BX=XA 的解)。第三,文章运用Brouwer不动点定理等拓扑工具,探讨了在系数矩阵满足特定条件时,双随机解的存在性问题。第四,文章完整刻画了一类非常重要的特殊情况:当 A B 是幂等正交补矩阵时,方程组的所有解的结构,并给出了明确的分块形式。最后,作为具体实现的典范,作者利用计算交换代数中的Gröbner基技术,完全分类并显式地给出了当 A B 为2阶矩阵时(包括可对角化与不可对角化情形),方程组的所有可能解。本文在[8]的基础上给出了三阶Yang-Baxter矩阵方程组在系数矩阵可对角化的情况下的解以扩充Yang-Baxter矩阵方程组解的探索。

2. 三阶系数矩阵可对角化的解

为得到主要结论,给出如下引理。

引理1 [9] 矩阵 X 是方程组(1)的解当且仅当 X ^ =[ 0 X X 0 ] 是方程

X ^ A ^ X ^ = A ^ X ^ A ^ (2)

的解,其中 A ^ =[ 0 A B 0 ]

引理2 [9] (正则解的必要条件)设 A B 为非奇异矩阵。则

(a) 方程组(1)存在非奇异解,仅当 det( A 3 )=det( B 3 ) 。特别地,若 A B 的特征值均为实数,则(1)存在非奇异解的必要条件是 det( A )=det( B )

(b) 若方程组(1)确实存在一个非奇异解 X ,则 X 2 必定与 BA 相似。

接下来讨论当 A B 为若尔当标准型形式的 3×3 矩阵时,方程组(1)的解,由引理1可知,求方程组(1)的解等价于求方程(2)的解。

定理1 A,B 是三阶可对角化矩阵,满足 AB=BA ,则存在可逆矩阵 P 使得 P 1 AP=C=[ α 1 0 0 0 α 2 0 0 0 α 3 ] P 1 BP=D=[ β 1 0 0 0 β 2 0 0 0 β 3 ] X=[ x 11 x 12 x 13 x 21 x 22 x 23 x 31 x 32 x 33 ]

则方程组(1)的解具有如下结构。

(a) 对角解:若 x ij =0,ij ,则对每个 i=1,2,3 ,有 { x ii 2 α i = β i 2 x ii x ii 2 β i = α i 2 x ii ,特别的,当 α i = β i 时, x ii = 0 x ii = β i

(b) 分块对角解:若 X=diag( X 1 , x 33 ) ,其中 X 1 2×2 矩阵,则原方程组可分解为关于 X 1 的二阶Yang-Baxter矩阵方程组和关于 x 33 的标量方程。

(c) 一般解:当 X 可逆时,存在可逆矩阵 Q 使得解具有特定形式。当 X 秩为1时,方程组(1)的解为 X=u v T ,且 v T Au0 v T Bu0 ,此时 u A B 的共同特征向量, v A T B T 的共同特征向量,且特征值满足 λδ=γ( v T u ),λ( v T u )=γθ

证明:(a) 对角解

X=[ x 11 0 0 0 x 22 0 0 0 x 33 ] ,方程组(1)化为 { x ii 2 α i = β i 2 x ii , x ii 2 β i = α i 2 x ii ,  ( i=1,2,3 )

由上可知,若 α i = β i ,则 x ii =  0或 x ii = β i

(b) 分块对角解

X= [ X 1 0 0 x 33 ] ,其中 X 1 =[ x 11 x 12 x 21 x 22 ] ,则方程组(1)可以分解为低维子系统,降为二阶矩阵的运算,这样就转化为了[8]中的二阶的情况,从而可得到对应解。

(c) 一般解

一般情况需解18个多项式方程,通过计算Gröbner基,可得以下形式的解:

det( X )0 时,即考虑方程组的一般型非奇异解,此时方程组的解满足 X 2 =U( AB ) U 1 ,其中 U 表示某一可逆矩阵, AB=[ α 1 β 1 0 0 0 α 2 β 2 0 0 0 α 3 β 3 ] ,其显示解可表示为 X=U( AB ) U 1

det( X )=0 时,即考虑方程组的一般型奇异解,可通过解的秩来分类讨论。

r( X )=1 ,设 X=u v T ,其中 u,v R 3 ,则 det( X )=0 ,代入方程得

{ Au v T A=u v T Bu v T , u v T Au v T =Bu v T B,

其等价于

{ ( Au )( v T A )=( v T Bu )u v T , ( v T Au )u v T =( Bu )( v T B ),

v T Au0 v T Bu0 ,则需

Bu v T Au = u v T B Au v T Bu = u v T A

可知 u A B 的共同特征向量, v A T B T 的共同特征向量。

Au=λu,Bu=γu, A T v=δv, B T v=θv ,将此式代入原方程组可得

λδ=γ( v T u ),λ( v T u )=γθ .

选择满足上述条件的 u,v 即可得到秩1解。

定理1中我们假定了系数矩阵 A B 满足交换条件 AB=BA 。这一假设使得 A B 可以同时对角化(因二者均为可对角化矩阵),从而将原方程组简化为关于对角元的标量方程或低维分块问题,极大地降低了求解难度。在此简化框架下,我们得以系统分类并显式给出对角解、分块对角解及部分一般解的结构。

然而,当 ABBA 时,问题将变得极为复杂。此时 A B 无法通过同一相似变换同时对角化,即使二者各自可对角化,它们相对于同一基的矩阵表示也不再是对角形式。这意味着方程组(1)将化为关于未知矩阵 X 的更为复杂的多项式方程组,其代数结构高度依赖于 A B 的非交换性。

因此,本文仅处理交换情形,旨在为后续研究提供基础。对于非交换情形下三阶可对角化系数矩阵的Yang-Baxter方程组,仍有待深入探索,例如可尝试利用广义特征向量、若尔当标准型或数值方法进行研究。

对于秩2解,由于其计算非常复杂,我们给出秩2解存在的必要条件:

定理2 秩2解存在的必要条件是 r( A )+r( B )2 r( A )=r( B )=2 ,并且当 r( A )=r( B )=2 时, A B 的核空间满足 Ker( A )=Ker( B )

证明:假设 X 是方程组(1)的秩2解。由于 A B 可对角化且 AB=BA ,存在一个可逆矩阵 P R 3×3 ,使得

P 1 XP=Y=[ X 1 0 0 0 ] ,

其中 X 1 R 2×2 是可逆矩阵。

P 1 AP=C=[ C 11 C 12 C 21 C 22 ] P 1 BP=D=[ D 11 D 12 D 21 D 22 ]

其中 C 11 , D 11 R 2×2 C 12 , D 12 R 2×1 C 21 , D 21 R 1×2 C 22 , D 22 R 1×1

则方程组(1)等价于

{ YCY=DYD, YDY=CYC,

且满足 r( C )=r( A )r( D )=r( B ),Ker( C )= P 1 Ker( A )Ker( D )= P 1 Ker( B )

展开矩阵 YCY

YCY=[ X 1 0 0 0 ][ C 11 C 12 C 21 C 22 ][ X 1 0 0 0 ]=[ X 1 C 11 X 1 0 0 0 ].

展开矩阵 DYD

DYD=[ D 11 D 12 D 21 D 22 ][ X 1 0 0 0 ][ D 11 D 12 D 21 D 22 ]=[ D 11 X 1 D 11 D 11 X 1 D 12 D 21 X 1 D 11 D 22 X 1 D 12 ].

由矩阵相等的充要条件,对应分块元素相等可知:

D 11 X 1 D 12 =0, D 21 X 1 D 11 =0, D 22 X 1 D 12 =0 .

X 1 可逆, D 11 X 1 列满秩,故 D 11 X 1 D 12 =0 蕴含 D 12 =0 ;同理 X 1 D 11 行满秩,故 D 21 X 1 D 11 =0 蕴含 D 21 =0 。因此 D 简化为分块对角矩阵:

D=[ D 11 0 0 D 22 ].

展开矩阵 YDY

YDY=[ X 1 0 0 0 ][ D 11 D 12 D 21 D 22 ][ X 1 0 0 0 ]=[ X 1 D 11 X 1 0 0 0 ].

展开矩阵 CYC

CYC=[ C 11 C 12 C 21 C 22 ][ X 1 0 0 0 ][ C 11 C 12 C 21 C 22 ]=[ C 11 X 1 C 11 C 11 X 1 C 12 C 21 X 1 C 11 C 22 X 1 C 12 ].

同理,由矩阵相等得:

C 11 X 1 C 12 =0, C 21 X 1 C 11 =0, C 22 X 1 C 12 =0 .

X 1 可逆,故 D 12 =0 D 21 =0 。因此 C 简化为分块对角矩阵:

C=[ C 11 0 0 C 22 ].

由上可知分块矩阵的秩满足 r( C )=r( C 11 )+r( C 22 ) r( D )=r( D 11 )+r( D 22 ) ,结合 r( C )=r( A ),r( D )=r( B ) ,分如下两种情况讨论:

(1):若 r( A )+r( B )2 ,此时 r( C )+r( D )2 。由于 C 11 , D 11 是2 × 2矩阵,其秩的非负整数组合必然满足分块对角结构的相容性,方程组的约束自然成立,在这种情况下,存在秩2解是可能的。

(2):若 r( A )=r( B )=2 ,此时 r( C )=r( D )=2 。对于3阶分块对角矩阵 C=[ C 11 0 0 C 22 ] ,秩为2的充要条件是对角块秩之和为2。因 C 11 是2阶矩阵, C 22 是常数,故可能为 r( C 11 )=2 r( C 22 )=0 r( C 11 )=1 r( C 22 )=1

r( C 11 )=2 r( C 22 )=0 时:

C=[ C 11 0 0 0 ],Ker( C )={ [ 0 0 t ]| tR }.

r( C 11 )=1 r( C 22 )=1 时:

C 11 是2阶秩1矩阵(存在非零列向量 P 、行向量 q T 使得 C 11 =p q T ),且 C 22 0 (1阶非零矩阵,即常数非零),故 C=[ p q T 0 0 c ]

由上知 Ker( C )={ [ x 1 0 ]| q T x 1 =0, x 1 R 2 }

同理,对 D=[ D 11 0 0 D 22 ] ,因 D 11 是2阶矩阵, D 22 是常数,故可能为 r( D 11 )=2 D 22 =0 r( D 11 )=1 r( D 22 )=1

r( D 11 )=2 r( D 22 )=0 时:

D=[ D 11 0 0 0 ],Ker( D )={ [ 0 0 t ]| tR }.

r( D 11 )=1 r( D 22 )=1 时:

D 11 是2阶秩1矩阵(存在非零列向量 l 、行向量 s T 使得 D 11 =l s T ),且 D 22 0 (1阶非零矩阵,即常数非零),故 D=[ l s T 0 0 d ]

由上知 Ker( C )={ [ y 1 0 ]| s T y 1 =0, y 1 R 2 }

Ker( C )=Ker( D ) ,由 Ker( C )= P 1 Ker( A )Ker( D )= P 1 Ker( B ) 可得 Ker( A )=Ker( B )

综上,秩2解存在的必要条件为 r( A )+r( B )2 r( A )=r( B )=2 Ker( A )=Ker( B )

3. 数值例子

3.1 考虑矩阵 A=[ 1 0 0 0 1 0 0 0 2 ] B=[ 1 0 0 0 2 0 0 0 2 ] ,显然 A B 本身就是对角矩阵,因此存在可逆矩阵 P=I (单位矩阵)使得 P 1 AP=A P 1 BP=B 。它们的特征值分别为: α 1 =1 α 2 =1 α 3 =2 β 1 =1 β 2 =2 β 3 =2

由定理1,可设对角形式的解为 X=diag{ x 11 , x 22 , x 33 } 。对于每个 i x ii 必须满足方程组:

{ x ii 2 α i = β i 2 x ii , x ii 2 β i = α i 2 x ii ,

逐项求解可得四个对角解: X 1 =diag{ 0,0,0 } X 2 =diag{ 1,0,0 } X 3 =diag{ 0,0,2 } X 4 =diag{ 1,0,2 }

该数值算例验证了定理1中关于对角解的结论。通过选取简单的对角矩阵 A B ,我们系统地求出了所有可能的对角解,求得的所有解满足原Yang-Baxter矩阵方程组。此算例为理论结果提供了具体的数值支持。

4. 总结和展望

本文给出了三阶Yang-Baxter矩阵方程组在系数矩阵可对角化的情况下的解,通过对系数矩阵进行相似变换为Jordan标准型,通过对解的结构分析给出了对角解,分块对角解的结构,对于一般解,我们给出了其显示解以及秩1,秩2解存在的条件。但本文并未进一步讨论系数矩阵不可对角化下解的存在情况,我们也希望在接下来的工作中进一步研究解的存在条件以及求解高阶Yang-Baxter矩阵方程组。

基金项目

赣南师范大学研究生创新基金项目(YCXJ24-A11)。

NOTES

*通讯作者。

参考文献

[1] Yang, C.N. (1967) Some Exact Results for the Many-Body Problem in One Dimension with Repulsive Delta-Function Interaction. Physical Review Letters, 19, 1312-1315. [Google Scholar] [CrossRef
[2] Baxter, R.J. (1972) Partition Function of the Eight-Vertex Lattice Model. Annals of Physics, 70, 193-228. [Google Scholar] [CrossRef
[3] Yang, C. and Ge, M. (1989) Braid Group, Knot Theory, and Statistical Mechanics. World Scientific.
[4] Zhou, D. and Ding, J. (2017) Solving the Yang-Baxter-Like Matrix Equation for Nilpotent Matrices of Index Three. International Journal of Computer Mathematics, 95, 303-315. [Google Scholar] [CrossRef
[5] Dong, Q., Ding, J. and Huang, Q. (2018) Commuting Solutions of a Quadratic Matrix Equation for Nilpotent Matrices. Algebra Colloquium, 25, 31-44. [Google Scholar] [CrossRef
[6] Yin, H., Wang, X., Tang, X. and Chen, L. (2018) On the Commuting Solutions to the Yang-Baxter-Like Matrix Equation for Identity Matrix Minus Special Rank-Two Matrices. Filomat, 32, 4591-4609. [Google Scholar] [CrossRef
[7] Nichita, F. (2012) Introduction to the Yang-Baxter Equation with Open Problems. Axioms, 1, 33-37. [Google Scholar] [CrossRef
[8] Jedlicka, P. and Pilitowska, A. (2025) Diagonals of Solutions of the Yang-Baxter Equation. Forum Mathematicum, 38, 321-338. [Google Scholar] [CrossRef
[9] Askar, A., Mukherjee, H. and Djordjevic, B. (2024) Solutions to a System of Yang-Baxter Matrix Equations. Filomat, 38, 10169-10192. [Google Scholar] [CrossRef