基于随机算法求解张量特征值

doi:10.12677/aam.2025.149399

期刊菜单

基于随机算法求解张量特征值
The Random Algorithm for Solving Eigenvalue of Tensors

DOI: 10.12677/aam.2025.149399, PDF, HTML, XML,
作者: 罗雨婷：广东工业大学数学与统计学院，广东广州
关键词: 随机算法；张量；H特征值；Random Algorithm； Tensor； H-Eigenvalue

摘要: 本文围绕张量H特征值问题展开研究。文中聚焦H特征对，将张量H特征值问题转化为非线性方程组问题，并利用三种Kaczmarz算法变体(NK、NRK、NURK)进行求解，这些算法的核心差异在于迭代过程中投影行的选择策略。为验证算法有效性，通过算例进行数值实验，结果显示三种算法均能有效求解张量最大H特征值，整体验证了算法对于求解张量特征值的可行性。

Abstract: This paper focuses on the H-eigenvalue problem of tensors. In this paper, the H-eigenvalue problem of tensors is transformed into a system of nonlinear equations by focusing on the H-eigenpair, and three nonlinear Kaczmarz algorithm variants (NK, NRK, NURK) are used to solve it. The core difference between these algorithms lies in the selection strategy of projection rows during the iteration process. To verify the effectiveness of the algorithms, numerical experiments are carried out with examples. The results show that all three algorithms can effectively solve the maximum H-eigenvalue of tensors, which generally verifies the feasibility of the proposed algorithms.

文章引用：罗雨婷. 基于随机算法求解张量特征值[J]. 应用数学进展, 2025, 14(9): 60-64. https://doi.org/10.12677/aam.2025.149399

1. 引言

张量作为刻画多维数组与多维向量运算的基础数学工具，其特征值理论是张量分析的核心研究内容之一。张量特征值是通过特定运算规则从张量中求解得到的一类数值，其本质反映了张量在相应方向上所呈现的伸缩特性。在2005年之前，张量特征值领域的研究进展相对滞缓，尚未形成系统的理论框架。直至2005年，香港理工大学祁力群教授[1]与芝加哥大学林力行教授[2]分别独立完成了张量特征值及特征向量的严格定义，这一突破性成果为该领域的发展奠定了重要基础，不仅推动了张量特征值理论本身的快速完善，更促使其在超图谱理论[3] [4]、量子纠缠[5]、医疗影像等[6] [7]诸多跨学科领域获得了广泛应用，成为连接理论研究与实际问题的关键桥梁。

张量特征值问题是计算数学和张量分析领域的核心问题之一，在数据科学、信号处理、量子物理等领域有重要应用。由于其NP-hard的性质，开发高效且稳健的数值算法具有重要的理论和实践价值。本文将一个经典的迭代方法(Kaczmarz算法)应用于此问题，为该领域提供了一个新的求解思路。

对于 $m$ 阶 $n$ 维实张量 $A$ ，其元素用 $a_{i_{1}} {_{i_{2} \dots}}_{i_{m}}$ 表示， $n$ 维实向量 $x$ 以及整数 $0 \leq r \leq m - 1$ ， $A$ 与 $x$ 的 $(m - r)$ 次积是一个 $r$ 阶 $n$ 维张量，记为 $A x^{m - r}$ ，其定义如下：

${(A x^{m - r})}_{i_{1} \dots i_{r}} = \sum_{i_{r + 1}, \dots, i_{m} = 1}^{n} a_{i_{1} \dots i_{m}} x_{i_{r + 1}} \dots x_{i_{m}}, 1 \leq i_{1}, \dots, i_{r} \leq n$ (1)

特别地， $A x^{m - 1}$ 是一个 $n$ 维向量，其分量为：

${(A x^{m - 1})}_{i} = \sum_{i_{2}, \dots, i_{m} = 1}^{n} a_{i i_{2} \dots i_{m}} x_{i_{2}} \dots x_{i_{m}}, 1 \leq i \leq n$ (2)

而 $A x^{m - 2}$ 是一个 $n \times n$ 的矩阵，其元素为：

${(A x^{m - 2})}_{i j} = \sum_{i_{3}, \dots, i_{m} = 1}^{n} a_{i j i_{3} \dots i_{m}} x_{i_{3}} \dots x_{i_{m}}, 1 \leq i, j \leq n$ (3)

当 $A$ 为半对称张量时，则 $A x^{m - 1}$ 的梯度可以表示为：

$\nabla_{x} (A x^{m - 1}) = (m - 1) A x^{m - 2}$ (4)

在本文我们考虑的是H特征对。

若复数 $λ \in ℂ$ 与非零向量 $x \in ℂ^{n}$ 满足下述齐次多项式方程组

${(A x^{m - 1})}_{i} = λ x_{i}^{m - 1}, \forall i = 1, \dots, n$ (5)

则称 $λ$ 为 $A$ 的H特征值，则称该解向量 $x$ 为 $A$ 对应于特征值 $λ$ 的特征向量。如果 $(x, λ)$ 都是实的，则称为 $A$ 的H特征对。此外，若记 $x^{[m - 1]} = (x_{1}^{m - 1}, \dots, x_{n}^{m - 1}) \in ℂ^{n}$ ，则(5)可简化表示为

$A x^{m - 1} = λ x^{[m - 1]}$ (6)

2. 基于Kaczmarz算法求解张量H特征值问题

自Qi [1]与Lim 开创性地提出高阶张量特征值及特征向量的定义以来，非负不可约张量的最大特征值问题便迅速成为学术界的研究热点。Lim 与Chang等[8]学者通过严格定义不可约张量，成功将经典的Perron-Frobenius定理推广至非负不可约张量的最大H特征值研究领域，为该方向的理论发展奠定了重要基础。Ng等人[9]则创新性地设计了求解非负不可约张量最大H特征值的NQZ方法，为数值计算提供了有效工具。

在此基础上，Ni与Qi [10]敏锐地揭示了张量特征值问题与齐次多项式映射之间的对应关系——每个张量特征值问题均可等价转化为一个齐次多项式映射问题，这一突破性发现首次建立了张量特征值问题与非线性方程组之间的桥梁。基于此，他们将牛顿法巧妙应用于非负齐次多项式映射的最大H特征值求解，并严格证明了该方法具有二阶收敛性，为高效求解此类问题提供了理论保障与算法支撑。

在本文中将张量H特征值问题转化为非线性方程组问题，并利用随机Kaczmarz方法进行求解，数值结果表明算法可行。将(6)转化为非线性方程组

$F (x) = A x^{m - 1} - λ x^{[m - 1]}$ (7)

函数 $F (x)$ 对 $x$ 是连续可微的。

若 $A$ 是半对称张量，则 $F (x)$ 的雅可比矩阵为

$F^{'} (x) = (m - 1) A x^{m - 2} - λ (m - 1) D$ (8)

其中 $D = d i a g (x^{[m - 2]})$ 。

对(7)采用非线性Kaczmarz算法进行求解。

经典Kaczmarz算法遵循矩阵行序逐次迭代，在方程组满足相容性条件时展现出优良的收敛性能。基于此，本文采用三种非线性Kaczmarz算法变体进行求解，其核心差异在于迭代过程中投影行的选择策略：

1. 非线性Kaczmarz算法(NK)：以方程组自身的行顺序依次确定投影行的选择；

2. 非线性随机Kaczmarz算法(NRK)：以和残差分量绝对值的平方呈正相关的概率确定投影行的选择；

3. 非线性均匀随机Kaczmarz算法(NURK)：以均匀分布概率随机确定投影行的选择。

为了将Kaczmarz算法应用到张量特征值问题上，本文对其进行一定的修改和调整。首先在每次迭代中，通过Kaczmarz方法更新特征向量，并根据当前特征向量更新特征值。

具体算法步骤如下：

1. 根据不同策略选择投影行 $i$

1) 策略1：按照顺序依次选择

$i = k (\mod m) + 1$

2) 策略2：按照和残差分量绝对值的平方呈正相关的概率选择

$i = \frac{F_{i} (x)}{{‖ F (x) ‖}^{2}}$

3) 策略3：按照均匀分布概率选择

$i = u n i d r n d (n, 1, 1)$

2. 计算该方程的梯度：

$g_{i} = \nabla F_{i} (x_{k})$

3. 按照公式更新特征向量：

$x_{k + 1} = x_{k} + \frac{r_{i}}{{‖ g_{i} ‖}^{2}} g_{i}$

4. 利用特征向量计算特征值的上下界，取上下界的平均值作为新的特征值 $λ_{k + 1}$ 。

3. 数值实验

在本节中，我们将通过数值算例来验证算法1在求解张量最大H特征值时的有效性。针对所有测试问题，利用MATLAB内置的rand函数生成初始向量 $x_{0}$ 。迭代停止条件设定为：当第 $k$ 次迭代的残差误差满足 $R e s \leq 10^{- 10}$ 时，终止迭代过程；若未满足该条件，但迭代次数已达到200次，也会停止迭代，并将此情形判定为未能成功求解该问题。

为评估算法的性能表现，对于每个测试问题，我们在100个不同的初始点上对所有方法进行了测试。测试所采用的评估指标包括平均迭代次数(记为“IT”)，平均迭代误差(记为“Res”)，以秒为单位的平均计算时间(记为“CPU”)以及出现最大H特征值的次数与实验总次数的比值(记为“Occur”)。

为对比NURK、NRK、NK 三种算法的性能，表1，表2，表3依次给出了各算法在三个不同张量上的数值计算结果。

算例1：张量 $A$ 是一个4阶2维的不可约非负对称张量，其元素为：

$\begin{array}{l} a_{1111} = a_{2222} = \frac{4}{\sqrt{3}}, a_{1112} = a_{1121} = a_{1211} = a_{2111} = 1, \\ a_{1222} = a_{2122} = a_{2212} = a_{2221} = 1 \end{array}$

其余元素 $a_{i_{1} i_{2} i_{3} i_{4}}$ 均为0。

Table 1. Numerical results of Example 1

表1. 算例1数值结果

Method	IT	Res	CPU	Occur	λ
NURK	6.86	4.56E−12	0.0043	93.00%	6.3094
NRK	6.11	6.28E−12	0.0044	92.00%	6.3094
NK	6.79	7.89E−12	0.0048	96.00%	6.3094

算例2：张量 $A$ 是一个4阶2维的不可约非负对称张量，其元素为：

$a_{1112} = 30, a_{1212} = 1, a_{1222} = 1, a_{2111} = 6, a_{2112} = 13, a_{2122} = 37,$

其余元素 $a_{i_{1} i_{2} i_{3} i_{4}}$ 均为0。

Table 2. Numerical results of Example 2

表2. 算例2数值结果

Method	IT	Res	CPU	Occur	λ
NURK	14.14	4.11E−11	0.0085	91.00%	41.0049
NRK	13.10	3.72E−11	0.0090	86.00%	41.0049
NK	14.13	4.34E−11	0.0090	92.00%	41.0049

算例3：张量 $A$ 是一个4阶2维张量，其元素为：

$a_{1111} = 1, a_{1122} = a_{1221} = a_{1212} = a_{2121} = a_{2211} = a_{2112} = \frac{1}{3}, a_{2222} = 1$

其余元素 $a_{i_{1} i_{2} i_{3} i_{4}}$ 均为0。

Table 3. Numerical results of Example 3

表3. 算例3数值结果

Method	IT	Res	CPU	Occur	λ
NURK	6.70	8.33E−12	0.0042	100%	2
NRK	5.98	6.31E−12	0.0042	100%	2
NK	6.60	6.10E−12	0.0047	100%	2

4. 总结

数值实验结果表明，三种算法都能够求解出张量最大H特征值，展现出各自的优势。其中，NURK算法在平均迭代时间(CPU)方面较为突出；NRK算法在平均迭代次数(IT)方面表现较为突出，能够相对高效地收敛到结果；NK算法在最大H特征值出现的占比(Ocurr)上具备一定优势，反映出其在特定场景下对目标特征值的捕捉能力。这不仅验证了所提算法在求解张量H特征值问题上的可行性，也为该领域的数值计算方法提供了新的思路和参考。

然而，本研究亦存在一定局限性。例如，实验主要围绕4阶2维张量展开，对于更高阶数、更大维度的张量，算法的性能及适用性有待进一步验证。同时，在算法效率提升方面仍有优化空间，例如如何进一步降低计算复杂度，提升算法在大规模张量计算中的效率。

参考文献

[1]	Qi, L. (2005) Eigenvalues of a Real Supersymmetric Tensor. Journal of Symbolic Computation, 40, 1302-1324. [Google Scholar] [CrossRef]
[2]	Lim, L.-H. (2005) Singular Values and Eigenvalues of Tensors: A Variational Approach. IEEE International Workshop on Computational Advances in Multi-Sensor Adaptive Processing, 1, 129-132.
[3]	Hu, S. and Qi, L. (2012) Algebraic Connectivity of an Even Uniform Hypergraph. Journal of Combinatorial Optimization, 24, 564-579. [Google Scholar] [CrossRef]
[4]	Hu, S., Qi, L. and Shao, J. (2013) Cored Hypergraphs, Power Hypergraphs and Their Laplacian H-Eigenvalues. Linear Algebra and Its Applications, 439, 2980-2998. [Google Scholar] [CrossRef]
[5]	匡继昌. 常用不等式[M]. 济南: 山东科学技术出版社, 2004.
[6]	Chen, Y., Dai, Y., Han, D. and Sun, W. (2013) Positive Semidefinite Generalized Diffusion Tensor Imaging via Quadratic Semidefinite Programming. SIAM Journal on Imaging Sciences, 6, 1531-1552. [Google Scholar] [CrossRef]
[7]	Hu, S., Huang, Z., Ni, H. and Qi, L. (2012) Positive Definiteness of Diffusion Kurtosis Imaging. Inverse Problems & Imaging, 6, 57-75. [Google Scholar] [CrossRef]
[8]	Chang, K.C., Pearson, K. and Zhang, T. (2009) On Eigenvalue Problems of Real Symmetric Tensors. Journal of Mathematical Analysis and Applications, 350, 416-422. [Google Scholar] [CrossRef]
[9]	Ng, M., Qi, L. and Zhou, G. (2010) Finding the Largest Eigenvalue of a Nonnegative Tensor. SIAM Journal on Matrix Analysis and Applications, 31, 1090-1099. [Google Scholar] [CrossRef]
[10]	Ni, Q. and Qi, L. (2015) A Quadratically Convergent Algorithm for Finding the Largest Eigenvalue of a Nonnegative Homogeneous Polynomial Map. Journal of Global Optimization, 61, 627-641. [Google Scholar] [CrossRef]

为你推荐

友情链接