基于Anderson加速分裂迭代算法求解多重线性PageRank问题

doi:10.12677/pm.2025.151026

期刊菜单

基于Anderson加速分裂迭代算法求解多重线性PageRank问题
Solving Multilinear PageRank Problem Based on Anderson Accelerated Splitting Iteration Algorithm

DOI: 10.12677/pm.2025.151026, PDF, HTML, XML,
作者: 陆思雅：广东工业大学数学与统计学院，广东广州
关键词: 多重线性PageRank问题；张量分裂；Anderson加速；Multilinear PageRank Problem； Tensor Splitting； Anderson Acceleration

摘要: 本文针对多重线性PageRank问题，结合松弛技术，提出了一般形式的张量分裂迭代算法，并给出了相应的收敛性分析。进一步，结合Anderson加速技术，提出了新的张量分裂算法。

Abstract: In this paper, combining relaxation techniques, a general form of tensor splitting iterative algorithm is proposed for the multilinear PageRank problem, and the corresponding convergence analysis is given. Furthermore, a new tensor splitting algorithm is proposed by incorporating Anderson acceleration techniques.

文章引用：陆思雅. 基于Anderson加速分裂迭代算法求解多重线性PageRank问题[J]. 理论数学, 2025, 15(1): 229-236. https://doi.org/10.12677/pm.2025.151026

1. 引言

Google首次提出PageRank模型来决定一个代表网页的有向图的重要节点，即网页排序问题[1]。给定一个有向图的随机行走，修正后的PageRank模型建立一个存在唯一稳定分布的新的马尔科夫链。尽管Google为网络图描述了PageRank，但相同的方法已部署在许多应用程序中[2]-[5]。由于PageRank模型的广泛成功，再根据如今实际应用中高维数据的需要，Gleich等[6]提出了高阶PageRank问题，它是一阶问题的推广。但是，同时他们也发现了高阶PageRank的存储障碍[6]，之后，他们根据Li和Ng [7]提出的秩1对称近似估计，希望利用这种估计的存储量小的优势，进一步提出多重线性PageRank模型。

令 $ℝ$ 为实数域， $ℝ^{n}$ 、 $ℝ^{k \times n}$ 、 $ℝ^{[m, n]}$ 分别为 $n$ 维向量、 $k \times n$ 维矩阵、 $m$ 阶 $n$ 维张量。称向量 $s = (s_{i}) \in ℝ^{n}$ 为随机向量，即对于所有 $i \in n$ ，有 $s_{i} \geq 0$ 并且 $\sum_{i = 1}^{n} s_{i} = 1$ ，其中 $n = {1, \dots, n}$ 。是一个 $m$ 阶 $n$ 维张量，具体为：

$p_{i_{1} i_{2} \dots i_{m}} \geq 0, \sum_{i_{1} = 1}^{n} p_{i_{1} i_{2} \dots i_{m}} = 1, \forall i_{2} \dots i_{m} \in n .$

Gleich等[6]基于秩-1近似估计技术[7]提出多重线性PageRank问题：

, (1.1)

并且

其中， $α \in (0, 1)$ 、 $v \in ℝ^{n}$ 是随机向量， $x \in ℝ^{n}$ 为特求的PageRank向量。

近年来，多重线性PageRank问题引起了研究人员的极大关注。许多用于求解方程(1.1)的理论分析[8]-[11]和相关算法[12]-[17]。在现有的研究中，多重线性PageRank问题的算法大致为基于梯度的相关算法和不涉及梯度计算的算法。对于基于梯度的相关算法，在[6]中开发了一种Newton方法。Meini等[12]和Guo等[13]分别研究了Perron-Newton法和多步牛顿法。对于非梯度法，在[6]中给出定点法、移位定点法、内–外方法和反幂方法。众所周知，梯度计算的难度可能导致高计算成本，而非梯度算法在处理非对称张量模型时，在计算效率方面具有天然的优势。分裂算法是张量计算中的一种经典非梯度算法。Li等[14]和Liu等[18]研究了用于求解张量方程的张量分裂算法。

分裂算法在张量计算中有着重要应用，并且分裂算法属于非梯度算法，Anderson加速技术[17]也是一种通用且有用的技术，用于加速矩阵情况下不动点问题的迭代非常成功，本文将探索分裂迭代的Anderson加速，用于求解基于(1.1)的多重线性PageRank问题。

本文的主要贡献如下：1) 我们提出求解多重线性PageRank问题的分裂方法的一般形式，并对所提出的方法进行了收敛分析；2) 我们提出了Anderson加速张量分裂迭代方法来解决多重线性PageRank问题。

2. 预备知识

首先介绍我们文中用到的符号和基本知识。令 $S_{1} = {x \in ℝ^{n} : x \geq 0, {‖ x ‖}_{1} = 1}$ 。 $A$ 是一个 $m$ 阶 $n$ 维张量， $A = (a_{i_{1} i_{2} \dots i_{m}}), a_{i_{1} i_{2} \dots i_{m}} \in ℝ, i_{1}, i_{2}, \dots, i_{m} \in n$ 。

一个 $n$ 维张量 $A = (a_{i j k}) \in ℝ^{[3, n]}$ 的模-1展开如下：

$A_{(1)} = [\begin{matrix} a_{111} & \dots & a_{1 n 1} & a_{112} & \dots & a_{1 n 2} & \dots & a_{11 n} & \dots & a_{1 n n} \\ a_{211} & \dots & a_{2 n 1} & a_{212} & \dots & a_{2 n 2} & \dots & a_{21 n} & \dots & a_{2 n n} \\ ⋮ & ⋱ & ⋮ & ⋮ & ⋱ & ⋮ & \dots & ⋮ & ⋱ & ⋮ \\ a_{n 11} & \dots & a_{n n 1} & a_{n 12} & \dots & a_{n n 2} & \dots & a_{n 1 n} & \dots & a_{n n n} \end{matrix}] .$

在本文中，我们对张量切片作为分裂对象，对每片切片采用同一种分裂方式。接下来，我们分别介绍对角面张量、下三角张量、严格下三角张量、上三角张量和严格上三角张量的定义，这将在下文中使用。

定义1：[14]令张量 $D \in ℝ^{[m, n]}$ ， $m \geq 3$ 为一个对角面张量，其中

$a_{i j i_{3} i_{4} \dots i_{m}} = 0, i \neq j$ .

张量 $L (L^{'}) \in ℝ^{[m, n]}$ 为(严格)下三角张量，其中

$a_{i_{1} i_{2} \dots i_{m}} = 0, i_{1} \leq i_{2} (i_{1} < i_{2}) .$

张量 $U (U^{'}) \in ℝ^{[m, n]}$ 为(严格)上三角张量，其中

$a_{i_{1} i_{2} \dots i_{m}} = 0, i_{1} \geq i_{2} (i_{1} > i_{2}) .$

注1：令 $D$ 、 $ℒ$ 、 $ℒ^{'}$ 、 $U$ 和 $U^{'}$ 为张量 $A$ 的对角面部分、下三角部分、严格下三角部分、上三角部分、严格上三角部分。对任意 $x \in ℝ^{n}$ ，不难检验得出 $D x^{m - 2}$ 、 $ℒ x^{m - 2}$ 、 $ℒ^{'} x^{m - 2}$ 、 $U x^{m - 2}$ 和 $U^{'} x^{m - 2}$ 为 $A x^{m - 2}$ 的对角部分、下三角部分、严格下三角部分、上三角部分、严格上三角部分。

多重线性PageRank问题解的唯一性一直是许多学者关注的问题[6] [8]-[11]。本文将基于[11]中的唯一性条件给出收敛性分析。现引入高阶遍历性系数定义。

定义2：令高阶遍历系数的定义如下：

具体的计算公式为：

进一步，若为随机张量，容易得出，

对于随机张量，有，，和。

定义3：令，若是非奇异矩阵，我们称为矩阵的分裂，分裂形式具体为：1) 正则分裂，若；2) 弱正则分裂，若。

3. 提出的算法及收敛性分析

令含有正元素的向量。我们定义投影算子。结合松弛技术[15]，我们设计出张量分裂迭代算法如下：

算法1 张量分裂迭代

输入：给定随机向量，，最大迭代步数，停机误差，松弛因子，初始向量。令

输出：

1：当

2：，

，

3：若 $‖ x_{k} - x_{k - 1} ‖ < ς$ 则终止并且输出 $x_{k}$

4： $k \leftarrow k + 1$ ，返回步骤1

注2：若 $x_{k} \in S_{1}$ ，则是列随机矩阵，且 $0 < α < 1$ 时，是非奇异的M-矩阵。

我们对提出的算法1进行收敛性分析，本文基于Fasino等[11]给出的3阶多重线性PageRank问题解的唯一性条件。首先给出以下引理。

引理1：若，则多重线性PageRank问题(1.1)有唯一解。

引理2：令为随机张量。对于任意的 $x, y, z \in S_{1}$ ，以下不等式成立：

其中，。

引理3：令是(弱)正则分裂，则 ${‖ M_{x}^{- 1} ‖}_{1} \leq \frac{1}{1 - α}$ 。

证明：由，得，结合 $M_{x}^{- 1} \geq 0, M_{x}^{- 1} N_{x} \geq 0$ ，我们得

到，因此 ${‖ M_{x}^{- 1} ‖}_{1} \leq \frac{1}{1 - α}$ ，证毕。

定理1：令 $\tilde{ℳ}$ ，是随机张量，，且， $x$ 为(1.1)的解，则对于任意初始随机向量 $x_{1}$ ，由算法1生成的向量序列 ${x_{k}}$ 收敛，并且

${‖ x_{k + 1} - x ‖}_{1} \leq θ^{k} {‖ x_{0} - x ‖}_{1} .$

其中， $θ = (1 + α) ς,$ 并且。

证明：由算法1的迭代格式可知

得出

由，结合引理1我们得到

，故 $x$ 是式子的唯一解，得到

令 ${\hat{e}}_{k + 1} = {\hat{x}}_{k + 1} - x, e_{k + 1} = x_{k + 1} - x$ ，得

对 $ℳ$ 进行单位随机化，我们定义 ${\tilde{ℳ}}^{+} = f u l l (ℳ)$ ，函数 $f u l l ()$ 的功能为对自变量矩阵(张量)中为0的

元素进行随机赋值，赋值范围为 $(0, 1)$ 。令 ${\tilde{ℳ}}_{i j k} = \frac{{\tilde{ℳ}}_{i j k}^{+}}{\sum_{i = 1}^{n} {\tilde{ℳ}}_{i j k}^{+}}$ ，从而得到随机张量 $\tilde{ℳ}$ ，并且有 $ℳ \leq \tilde{ℳ}$ 。

从而得到

结合引理2，得

记。

即

因为为随机向量，结合得到

假设，当迭代次数达到时，有

由已知条件易证，故收敛与，证毕。

接下来，我们将使用Anderson加速技术来提高算法1的收敛性能。Anderson加速(AA) [19]最初由Anderson在1965年提出，AA是一种序列方法已被广泛用于提高固定点迭代的收敛速度。定义残差为，则求解不动点问题等价求解残差方程。AA方法的主要思想是通过前步迭代计算结果来表示最新的迭代结果，即这个组合向量系数通过极小化每一步相应的残差的组合得到。Anderson加速方法是针对不动点迭代进行加速的一类算法，我们考虑以下一般定点问题

并且，其中且。

根据参考文献[20]中的假设2.1，当满足

或，

其中，是的一个控制参数时，我们不必执行Anderson加速步骤。

我们新提出的张量分裂迭代算法的安德森加速度如下所示：

算法2 Anderson加速张量分裂迭代

输入：给定随机向量，，，常数，最大迭代步数，停机误差，松弛因子，初始向量。令

输出：

1：while do

2：

3：

4：

5：令，其中

6：计算，得

7：if or ，then

8：

9：else

10：

11：end if

12：

13：if then

14：则终止并且输出

15：end if

16：

17：end while

注3：如参考文献[20]所述，在实现Anderson加速时，算法参数的适当选择很重要。如果太小，则利用迭代步骤中的信息可能太有限，无法实现快速收敛。如果很大，则最小二乘问题可能是病态的。在大多数应用中，或是可行且有效的选择。同时，作为的控制参数，太小的很容易导致跳过Anderson加速步骤。因此，设置较大的是合适的。在数值测试中，我们取较为合适。

4. 结语

本文基于[15]提出的求解高阶马尔科夫链和多重线性PageRank问题的松弛算法基础上，结合张量分裂方法，提出求解多重线性PageRank的分裂算法，并进行相应的收敛性分析，进一步引入Anderson加速技术[17]，给出Anderson加速张量分裂迭代的算法流程并对使用的参数进行了一定的说明。

参考文献

[1]	Page, L. (1999) The Page Rank Citation Ranking: Bringing Order to the Web. Technical Report.
[2]	Freschi, V. (2007) Protein Function Prediction from Interaction Networks Using a Random Walk Ranking Algorithm. 2007 IEEE 7th International Symposium on BioInformatics and BioEngineering, Boston, 14-17 October 2007, 42-48. [Google Scholar] [CrossRef]
[3]	Gleich, D.F. (2015) Page-Rank beyond the Web. SIAM Review, 57, 321-363. [Google Scholar] [CrossRef]
[4]	Morrison, J.L., Breitling, R., Higham, D.J. and Gilbert, D.R. (2005) Gene-Rank: Using Search Engine Technology for the Analysis of Microarray Experiments. BMC Bioinformatics, 6, Article No. 233. [Google Scholar] [CrossRef] [PubMed]
[5]	Winter, C., Kristiansen, G., Kersting, S., Roy, J., Aust, D., Knösel, T., et al. (2012) Google Goes Cancer: Improving Outcome Prediction for Cancer Patients by Network-Based Ranking of Marker Genes. PLOS Computational Biology, 8, e1002511. [Google Scholar] [CrossRef] [PubMed]
[6]	Gleich, D.F., Lim, L. and Yu, Y. (2015) Multilinear Page-Rank. SIAM Journal on Matrix Analysis and Applications, 36, 1507-1541. [Google Scholar] [CrossRef]
[7]	Li, W. and Ng, M.K. (2013) On the Limiting Probability Distribution of a Transition Probability Tensor. Linear and Multilinear Algebra, 62, 362-385. [Google Scholar] [CrossRef]
[8]	Li, W., Liu, D., Vong, S. and Xiao, M. (2020) Multilinear Page-Rank: Uniqueness, Error Bound and Perturbation Analysis. Applied Numerical Mathematics, 156, 584-607. [Google Scholar] [CrossRef]
[9]	Li, W., Liu, D., Ng, M.K. and Vong, S. (2017) The Uniqueness of Multilinear Page-Rank Vectors. Numerical Linear Algebra with Applications, 24, e2107. [Google Scholar] [CrossRef]
[10]	Liu, D., Vong, S. and Shen, L. (2022) Improved Uniqueness Conditions of Solution for Multilinear Page-Rank and Its Application. Linear and Multilinear Algebra, 72, 203-233. [Google Scholar] [CrossRef]
[11]	Fasino, D. and Tudisco, F. (2020) Ergodicity Coefficients for Higher-Order Stochastic Processes. SIAM Journal on Mathematics of Data Science, 2, 740-769. [Google Scholar] [CrossRef]
[12]	Meini, B. and Poloni, F. (2018) Perron-Based Algorithms for the Multilinear Page-Rank. Numerical Linear Algebra with Applications, 25, e2177. [Google Scholar] [CrossRef]
[13]	Guo, P., Gao, S. and Guo, X. (2018) A Modified Newton Method for Multilinear Page-Rank, 22, 1161-1171. [Google Scholar] [CrossRef]
[14]	Li, D., Xie, S. and Xu, H. (2017) Splitting Methods for Tensor Equations. Numerical Linear Algebra with Applications, 24, e2102. [Google Scholar] [CrossRef]
[15]	Liu, D., Li, W. and Vong, S. (2019) Relaxation Methods for Solving the Tensor Equation Arising from the Higher-Order Markov Chains. Numerical Linear Algebra with Applications, 26, e2260. [Google Scholar] [CrossRef]
[16]	Bentbib, A.H., Boubekraoui, M. and Jbilou, K. (2024) Extrapolation Methods for Multilinear Page-Rank. Numerical Algorithms, 98, 1013-1043.
[17]	Walker, H.F. and Ni, P. (2011) Anderson Acceleration for Fixed-Point Iterations. SIAM Journal on Numerical Analysis, 49, 1715-1735. [Google Scholar] [CrossRef]
[18]	Liu, D., Li, W. and Vong, S. (2018) The Tensor Splitting with Application to Solve Multi-Linear Systems. Journal of Computational and Applied Mathematics, 330, 75-94. [Google Scholar] [CrossRef]
[19]	Anderson, D.G. (1965) Iterative Procedures for Nonlinear Integral Equations. Journal of the ACM, 12, 547-560. [Google Scholar] [CrossRef]
[20]	Toth, A. and Kelley, C.T. (2015) Convergence Analysis for Anderson Acceleration. SIAM Journal on Numerical Analysis, 53, 805-819. [Google Scholar] [CrossRef]

为你推荐

友情链接