求解大规模线性问题的张量GMRES算法

doi:10.12677/aam.2025.144223

期刊菜单

求解大规模线性问题的张量GMRES算法
Tensor GMRES Algorithm for Solving Large-Scale Linear Problems

DOI: 10.12677/aam.2025.144223, PDF, HTML, XML, 科研立项经费支持
作者: 王仕伟^*, 杨志, 冷震北：重庆对外经贸学院数学与计算机学院，重庆
关键词: 大规模线性问题；Krylov子空间方法；t-积；GMRES；Large-Scale Linear Problems； Krylov Subspace Methods； t-Product； GMRES

摘要: 彩色图像和视频通常可以被描述为高阶张量。本文基于三阶张量t-积，讨论了Krylov子空间方法用以解决图像恢复中的大规模线性问题。本文通过张量GMRES算法构建Krylov子空间，将大规模线性问题转换为小规模问题，且构建的子空间始终保持张量的空间结构。数值例子和彩色图像修复的应用说明了算法的有效性。

Abstract: Color images and video sequences can typically be characterized as higher-order tensors. This paper investigates Krylov subspace methods based on the third-order tensor t-product for solving large-scale linear systems arising in image restoration. This paper employs the tensor GMRES algorithm to construct the Krylov subspace, effectively reducing large-scale linear problems to manageable small-scale formulations, while consistently preserving the spatial architecture of tensors within the constructed subspace. Numerical experiments and applications in color image inpainting demonstrate the efficacy of the proposed methodology.

文章引用：王仕伟, 杨志, 冷震北. 求解大规模线性问题的张量GMRES算法[J]. 应用数学进展, 2025, 14(4): 1007-1018. https://doi.org/10.12677/aam.2025.144223

1. 引言

随着人工智能和大数据技术的飞速发展，数据规模和复杂性呈指数级增长，传统的向量和矩阵形式的数据表示已无法有效捕获高维数据的内在结构。在此背景下，张量作为高维数据的自然表达形式，广泛应用于推荐系统、图像处理、自然语言处理、生物信息学等领域。然而，大规模张量数据的处理和分析面临计算复杂性高、存储成本昂贵等挑战，这对高效算法的设计提出了更高要求。

在高阶张量分析的研究中，张量积是构建代数运算和分解模型的核心工具。传统的张量积形式包括模积(tensor mode product) [1]-[3]、哈达玛积(Hadamard product) [4] [5]和爱因斯坦积(Einstein product) [6] [7]等。虽然这些张量积在特定场景中具有一定优势，但在处理多维数据的代数一致性和计算效率方面存在局限性。2011年，Kilmer等人[8]首次提出基于三阶张量间的t-积(t-product)，作为一种基于离散傅里叶变换(DFT)的创新张量积定义，近年来引起了广泛关注。t-积在多维数据处理和张量代数中具有独特优势[9]。首先，t-积能够利用离散傅里叶变换将卷积操作简化为逐元素乘法，大幅降低计算复杂度，同时保留张量的多维结构。张量t-积的突出优势之一在于它支持一系列线性代数操作，例如t-SVD、t-张量逆等，为张量分解和低秩逼近提供了强有力的工具。张量在不同应用广泛的领域，特别是彩色图像、视频恢复或压缩[1] [2] [5] [6] [10]-[17]。张量在现代科学中的其他应用，如信号处理[7] [18]，数据挖掘[8]，张量互补问题，计算机视觉，更多细节见[9]。最近的张量方法被用于数值求解[19]中的偏微分方程。

在图像处理中，随着图像数据维度的增加，尤其是在处理彩色图像、视频以及其他多维数据时，传统的线性模型往往难以准确捕捉复杂的图像结构。当图像数据不完整、受损或被噪声污染时，求解过程可能无法获得稳定和精确的结果，这时张量求解的离散化过程便可能面临不适定问题。本文主要研究彩色图像与视频恢复等图像处理中的大规模线性离散问题[1] [10] [11] [20]-[22]，可将其表述为

$A *_{L} \vec{X} = \vec{ℬ}, A = {[a]}_{i, j, k = 1}^{n_{1} \times n_{2} \times n_{3}} \in ℝ^{n_{1} \times n_{2} \times n_{3}}, \vec{ℬ} \in ℝ^{n_{2} \times 1 \times n_{3}} .$ (1.1)

或张量最小二乘问题

$\min_{\vec{X} \in ℝ^{n_{1} \times n_{4} \times n_{3}}} {‖ A *_{L} X - ℬ ‖}_{F}^{2},$ (1.2)

其中 $A = {[a]}_{i, j, k = 1}^{n_{1}, n_{2}, n_{3}} \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 和 $ℬ \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ 为已知三阶张量， $*_{L}$ 为张量间可逆线性变换L的乘积[23]， ${‖ \cdot ‖}_{F}$ 表示张量的Frobenius范数。若L为快速傅里叶变换(FFT)时， $*_{L}$ 为t-积。

2. 预备知识

对于三阶张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，可以通过不同的分割方式得到其各类切片，本文使用 $A_{(:, :, k)}$ 或 $A_{k}$ 表示张量 $A$ 的第k个正面切片， $A_{(:, j, :)}$ 或 ${\vec{A}}_{j}$ 表示张量 $A$ 的第j个侧面切片， $A_{(i, j, :)}$ 表示为张量管，这几种张量结构如图1所示：

(a) (b) (c)

Figure 1. (a) frontal slices $A_{(:, :, k)}$ , (b) lateral slices $A_{(:, j, :)}$ , (c) tube fibers $A_{(i, j, :)}$

图1. (a) 正面切片 $A_{(:, :, k)}$ ，(b) 横向切片 $A_{(:, j, :)}$ ，(c) 管 $A_{(i, j, :)}$

在本节预备一些t-积的定义和性质，是基于离散傅里叶变换(DFT)所定义的，给定向量 $v \in ℂ^{n}$ ，假设 $F_{n}$ 是 $n \times n$ DFT矩阵，那么

$\bar{v} = F_{n} v \in ℂ^{n}$

其中 $F_{n}$ 的元素是复数形式，其分量被定义为

${(F_{n})}_{i j} = ω^{(i - 1) (j - 1)}, i, j = 1, \dots, n .$

这里 $ω = e^{- 2 π i / n}, i^{2} = - 1$ 。

给定 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 是一个三阶张量，使用三个算子bcirc、unfold和fold，即

$bcirc (A) = [\begin{matrix} A_{1} & A_{n_{3}} & A_{n_{3} - 1} & \dots & A_{2} \\ A_{2} & A_{1} & A_{n_{3}} & \dots & A_{3} \\ ⋮ & ⋮ & ⋱ & ⋱ & ⋮ \\ A_{n_{3}} & A_{n_{3} - 1} & \dots & A_{2} & A_{1} \end{matrix}] \in ℝ^{n_{1} n_{3} \times n_{2} n_{3}},$

$unfold (A) = [\begin{matrix} A_{1} \\ A_{2} \\ ⋮ \\ A_{n_{3}} \end{matrix}] \in ℝ^{n_{1} n_{3} \times n_{2}}, fold (unfold (A)) = A .$

定义2-1 张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 和 $ℬ \in ℝ^{n_{2} \times n_{4} \times n_{3}}$ 之间的t-积被定义为

$C = A * ℬ = fold (bcirc (A) unfold (ℬ)) \in ℝ^{n_{1} \times n_{4} \times n_{3}} .$

对于三阶张量 $ℬ \in ℝ^{n_{2} \times n_{4} \times n_{3}}$ ，其第j个张量侧面切片为 ${\vec{ℬ}}_{j} \in ℝ^{n_{2} \times 1 \times n_{3}}$ ，也称侧面切片为张量列，则有

$ℬ = [{\vec{ℬ}}_{1}, {\vec{ℬ}}_{2}, \dots, {\vec{ℬ}}_{n_{4}}] .$

定义2-2 由三阶张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 和张量列 $\vec{ℬ} \in ℝ^{n_{2} \times 1 \times n_{3}}$ 生成的k维tKrylov张量，定义如下

$K_{k} (A, \vec{ℬ}) = [\vec{ℬ}, A \vec{ℬ}, A^{2} \vec{ℬ}, \dots, A^{k - 1} \vec{ℬ}] .$

设 $\hat{A}$ 是在张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 的所有3-模管上应用DFT得到的张量。用Matlab命令fft得到 $\hat{A} = fft (A, [], 3)$ ，并运用快速傅里叶反变换ifft得到 $A = ifft (\hat{A}, [], 3)$ 。得益于张量t-积的特殊循环结构，可将两个张量的t-积投影到傅里叶变换域中展开计算，即对于两个尺寸合适的张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 和 $ℬ \in ℝ^{n_{2} \times n_{4} \times n_{3}}$ 可在MATLAB中快速计算，如算法2-1所示。

算法2-1. 基于fft的t-积

输入： $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 和 $ℬ \in ℝ^{n_{2} \times n_{4} \times n_{3}}$

输出： $C = A * ℬ \in ℝ^{n_{1} \times n_{4} \times n_{3}}$

$\hat{A} = fft (A, [], 3)$ ; $\hat{ℬ} = fft (ℬ, [], 3)$

For $k = 1, 2, \dots, n_{3}$

$A_{k} = \hat{A} (:, :, k); B_{k} = \hat{ℬ} (:, :, k)$

$\hat{C} (:, :, k) = A_{k} B_{k}$

End

$C = ifft (\hat{C}, [], 3)$

定义2-3 若尺寸为 $n_{1} \times n_{1} \times n_{3}$ 的张量 $ℐ$ 的第1个正面切片是一个单位矩阵，其他索引位置元素都为零，则称张量 $ℐ$ 为t-积下的单位张量。

特别注意，管标量 ${\vec{e}}_{1}$ 表示 $1 \times 1 \times n_{3}$ 的单位张量，其形式为一个管状向量，除索引(1, 1, 1)的元素为1外，其他位置都为0。

定义2-4 若 $Q \in ℝ^{m \times m \times n}$ 为正交张量，则满足 $Q^{T} Q = Q Q^{T} = ℐ$ 。

若 $Q$ 是一个正交张量，则对任意满足尺寸的张量 $A$ 都有 ${‖ Q * A ‖}_{F} = {‖ A ‖}_{F}$ 或 ${‖ A * Q ‖}_{F} = {‖ A ‖}_{F}$ 。

定义2-5 若张量 $A \in ℝ^{n_{1} \times n_{1} \times n_{3}}$ 可逆，则张量 $A$ 的逆记作 $A^{- 1}$ ，满足

对于非零张量 $\vec{X} \in ℝ^{n_{1} \times 1 \times n_{3}}$ ，可以将其分解为一个归一化张量 $\vec{D} \in ℝ^{n_{1} \times 1 \times n_{3}}$ 与管标量 $d \in ℝ^{1 \times 1 \times n_{3}}$ 的t-积，如下

$\vec{X} = \vec{D} * d,$

算法2-2为张量列的归一化分解过程。

算法2-2. 归一化(Normalization)

输入：非零张量 $\vec{X} \in ℝ^{m \times 1 \times n}$ , tol

输出： $\vec{D}$ , $d$ ( $\vec{X} = \vec{D} * d$ ), 且 ${‖ \vec{D} ‖}_{F} = 1$ .

1. 计算 $\vec{D} = fft (\vec{X}, [], 3)$

2. 对于 $j = 1, 2, \dots, n$

3. 计算 $d_{j} \leftarrow {‖ D_{j} ‖}_{2}$

4. 如果 $d_{j} > tol$ 则

计算 ${\vec{D}}_{j} \leftarrow \frac{1}{d_{j}} {\vec{D}}_{j}$

5. 否则

计算 ${\vec{D}}_{j} \leftarrow r a n d n (m, 1), d_{j} \leftarrow {‖ D_{j} ‖}_{2}$

6. 计算 $\vec{D} = fft (\vec{X}, [], 3)$

张量QR (tQR)的分解由Kilmer等人[9]描述。 $A \in ℝ^{l \times m \times n}$ 的QR分解表示为

$A = Q * ℛ,$

其中张量 $Q \in ℝ^{l \times m \times n}$ 是部分正交的， $ℛ \in ℝ^{m \times m \times n}$ 的每个正面切片是一个上三角形。算法2-3的tQR分解是在傅里叶域实现tQR分解。

算法2-3. tQR分解[1]

输入： $A \in ℝ^{l \times m \times n}$

输出： $Q \in ℝ^{l \times m \times n}, ℛ \in ℝ^{m \times m \times n}, A = Q * ℛ$

$\hat{A} = fft (A, [], 3)$

For $j = 1, 2, \dots, n$

$\hat{A} (:, :, k) = Q R$

$\hat{Q} (:, :, k) = Q, \hat{ℛ} (:, :, k) = R$

End

$Q = ifft (\hat{Q}, [], 3)$ , $ℛ = ifft (\hat{ℛ}, [], 3)$ .

3. 张量全局-GMRES算法

首先介绍了El Guide等人[20]使用的其他定义，设三阶张量 $ℬ \in ℝ^{n_{2} \times n_{4} \times n_{3}}$ 与向量 $y = {[y_{1}, y_{2}, \dots, y_{k}]}^{T} \in ℝ^{k}$ ，El Guide等人将定义了一个积 $⊛$ 为

$ℬ ⊛ y = \sum_{j = 1}^{k} y_{j} {\vec{ℬ}}_{j}$

另外，若使三阶张量 $B_{k}$ 表示为

$B_{k} = [ℬ_{1}, ℬ_{2}, \dots, ℬ_{k}] \in ℝ^{n_{2} \times n_{4} k \times n_{3}}, ℬ_{j} \in ℝ^{n 2 \times n_{4} \times n_{3}}, j = 1, \dots, k .$

则

$B_{k} ⊛ y = \sum_{j = 1}^{k} y_{j} ℬ_{j} .$

定义3-1 设 $z \in ℝ^{1 \times 1 \times n_{3}}$ ，那么 $z$ 的管秩是其非零傅里叶系数的个数。如果 $z$ 的秩等于 $n_{3}$ ，它是可逆的，用 $z^{- 1}$ 表示 $z$ 的逆： $z * z^{- 1} = z^{- 1} * z = e$ ，其中 $e$ 是单位张量管。

考虑张量线性方程组

$A * X = ℬ$ (3.1)

这里 $A \in ℝ^{n_{1} \times n_{1} \times n_{3}}, X \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ 和 $ℬ \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ 。由张量 $A$ 和 $V \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ 生成的k维Krylov子空间表示为

$K_{k} (A, V) = [V, A * V, A^{2} * V, \dots, A^{k - 1} * V] .$

可得到出张量全局-Arnoldi算法，如算法3-1所示。

算法3-1. 张量全局-Arnoldi算法

输入： $A \in ℝ^{n_{1} \times n_{1} \times n_{3}}, V \in ℝ^{n_{1} \times n_{4} \times n_{3}}$

输出：k维Krylov子空间 $K_{k} (A, V)$

$a = {‖ V ‖}_{F}$ ； $V_{1} = \frac{V}{a}$

For $j = 1, 2, \dots, k$

$J = A * V_{j}$

For $i = 1, 2, \dots, j$

$R_{i, j} = 〈 V_{i}, J 〉; J = J - R_{i, j} * V_{i}$

End

$R_{j + 1, j} = {‖ J ‖}_{F}$

If $R_{j + 1, j} = 0$

Break

EndIf

$V_{j + 1} = J / R_{j + 1, j}$ .

End

由算法3-1得到的张量 $V_{k}$ 是 $n_{1} \times n_{4} k \times n_{3}$ 张量，且

$V_{k} = [V_{1}, V_{2}, \dots, V_{k}],$

${\bar{R}}_{k}$ 是 $R$ 的元素所组成的 $(k + 1) \times k$ 的上海森伯格矩阵(Hesenberg)， $R_{k}$ 是由 ${\bar{R}}_{k}$ 删去最后一行所得到的矩阵。将 $R_{:, j}$ 表示矩阵 $R_{k}$ 的第j列，则

$V_{k} ⊛ R_{k} = [V_{k} ⊛ R_{:, 1}, V_{k} ⊛ R_{:, 2}, \dots, V_{k} ⊛ R_{:, k}] .$

命题3-1 设 $V_{k}$ 是由 $[V_{1}, V_{2}, \dots, V_{k}]$ 定义的张量，其中 $V \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ 由张量全局-Arnoldi算法定义，那么对任一 $y = {[y_{1}, y_{2}, \dots, y_{k}]}^{T} \in ℝ^{k}$ 都有

${‖ B_{k} ⊛ y ‖}_{F} = {‖ y ‖}_{F} .$

设 $X_{0} \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ 是一个任意的初始猜测，则相应的剩余残差张量 $ℛ_{0} = ℬ - A * X_{0}$ 。若经过m次迭代后得到的近似解 $X_{m}$ ，则相应地将问题(3.1)转换为寻找最小化问题的最优解：

${‖ ℛ_{m} ‖}_{F} = \min_{X \in X_{0} + K_{m} (A, ℛ_{0})} {{‖ ℬ - A * X ‖}_{F}} .$

设 $X_{m} = X_{0} + V_{m} ⊛ y, y \in ℝ^{m}$ ，然后

$ℛ_{m} = ℬ - A * X_{m} = ℬ - A * (X_{0} + V_{m} ⊛ y) = ℛ_{0} - (A * V_{m}) ⊛ y .$

则得到问题

${‖ ℛ_{m} ‖}_{F} = \min_{y \in ℝ^{m}} {{‖ ℛ_{0} - (A * V_{m}) ⊛ y ‖}_{F}} .$ (3.2)

事实上，由于 $ℛ_{0} = {‖ ℛ_{0} ‖}_{F} V_{1}$ 和 $V_{1} = V_{m + 1} ⊛ e_{1}$ ， $e_{1}$ 是 $ℝ^{m + 1}$ 中的第一个标准基向量，利用命题3-1，得到

$\begin{array}{l} {‖ ℛ_{0} - (A V_{m}) ⊛ y ‖}_{F} \\ = {‖ ℛ_{0} - (V_{m + 1} ⊛ {\bar{R}}_{m}) ⊛ y ‖}_{F} \\ = {‖ {‖ ℛ_{0} ‖}_{F} (V_{m + 1} ⊛ e_{1}) - (V_{m + 1} ⊛ {\bar{R}}_{m}) ⊛ y ‖}_{F} \\ = {‖ V_{m + 1} ⊛ ({‖ ℛ_{0} ‖}_{F} e_{1} - {\bar{R}}_{m} y) ‖}_{F} \\ = {‖ {‖ ℛ_{0} ‖}_{F} e_{1} - {\bar{R}}_{m} y ‖}_{2} . \end{array}$

最后

$X_{m} = X_{0} + V_{m} ⊛ y$

其中

$y = \underset{y \in ℝ^{m}}{arg \min} {‖ {‖ ℛ_{0} ‖}_{F} e_{1} - {\bar{R}}_{m} y ‖}_{2} .$

综上得到了将大规模问题(3.1)转换为小规模问题张量全局-GMRES算法(算法3-2)。

算法3-2. 张量全局-GMRES算法(G-GMRES)

输入： $A \in ℝ^{n_{1} \times n_{1} \times n_{3}}, X_{0}, ℬ \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ , itermax, tol, 子空间维数m.

输出：问题(3.1)近似解 $X_{m}$ .

For $k = 1, 2, \dots$ until itermax

计算 $ℛ_{0} = ℬ - A * X_{0}$

使用张量全局-Arnoldi算法用计算 $V_{k}$ 和 ${\bar{R}}_{k}$ .

计算 $y = \underset{y \in ℝ^{m}}{arg \min} {‖ {‖ ℛ_{0} ‖}_{F} e_{1} - {\bar{R}}_{m} y ‖}_{2}$ .

$X_{m} = X_{0} + V_{m} ⊛ y$

$ℛ_{m} = ℬ - A * X_{m}$

If ${‖ ℛ_{0} ‖}_{F} \leq tol$

Break

End If

$X_{0} = X_{m}$

End

4. 张量Krylov子空间算法

对问题(1.1)的直接求解所花费的代价会随着系统的维度增加而呈现几何倍的增长，可能会导致程序崩溃，因此将问题(1.1)转换为小规模问题是可能是一种有效的方式。本文发展了形式问题(1.1)的最小二乘问题的t-积Arnoldi (t-Arnoldi)和t-积GMRES方法。该方法将用于说明相对于矢量化或矩阵化张量方程的一般情况下，张量化的潜在优势。

对于问题(3.1)中 $ℬ \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ ，可视为 $n_{4}$ 个独立的子问题，即

${\vec{X}}_{j} = \underset{\vec{X} \in ℝ^{n_{1} \times n_{4} \times n_{3}}}{arg \min} {‖ A * \vec{X} - {\vec{ℬ}}_{j} ‖}_{F}^{2}, j = 1, 2, \dots, n_{4} .$

令 $\vec{X} = V_{k} * \vec{Y} (k ≪ n)$ ，则有

$\underset{\vec{Y} \in ℝ^{k \times 1 \times n}}{arg \min} {‖ A * V_{k} * \vec{Y} - \vec{ℬ} ‖}_{F}^{2} .$ (4.1)

其中 $V_{k}$ 中的张量列两两相互正交，且 $V_{k}^{T} * V_{k} = ℐ$ 。问题(4.1)的正规方程为

$V_{k}^{T} * (A^{T} * A) * V_{k} * {\vec{Y}}_{μ} = V_{k}^{T} * A^{T} * \vec{ℬ} .$ (4.2)

则可以得到问题(4.1)的解为

${\vec{Y}}_{μ} = {(V_{k}^{T} * (A^{T} * A) * V_{k})}^{- 1} * V_{k}^{T} * A^{T} * \vec{ℬ} .$ (4.3)

4.1. 张量Arnoldi算法

首先介绍一个带t-Arnoldi过程的算法。将大规模问题(3.1)简化为小规模问题。算法4-1所描述的t-Arnoldi过程将张量 $A \in ℝ^{n_{1} \times n_{1} \times n_{3}}$ 简化为一个上海森伯格张量(tHessenberg)，其每个正面切片都是一个上海森伯格矩阵。

算法4-1. t-Arnoldi分解算法

输入： $A \in ℝ^{n_{1} \times n_{1} \times n_{3}}, \vec{ℬ} \in ℝ^{n_{1} \times 1 \times n_{3}}$

输出：k维Krylov子空间 $K_{k} (A, V)$

$[{\vec{Q}}_{1}, z_{1}] = Normalization (\vec{ℬ})$

For $j = 1, 2, \dots, k$

$\vec{W} = A * {\vec{Q}}_{j}$

For $i = 1, 2, \dots, j$

$h_{i, j} = Q_{j}^{T} * \vec{W}; \vec{W} = \vec{W} - Q_{j}^{T} * \vec{W}$

End

$[{\vec{Q}}_{j + 1}, h_{j + 1, j}] = Normalization (\vec{W})$

End

假设t-Arnoldi过程的步数小以避免分解，当k选择足够小以使得对任何次对角管标量 $h_{j + 1, j}$ 都不可逆，则称算法4-1为t-Arnoldi分解算法。

$A * Q_{k} = Q_{k + 1} * {\bar{ℋ}}_{k}$

其中

${\bar{ℋ}}_{k} = [\begin{matrix} h_{11} & h_{1, k} \\ h_{21} & h_{22} \\ h_{32} & h_{33} \\ ⋱ & ⋱ \\ h_{k, k - 1} & h_{k, k} \\ h_{k + 1, k} \end{matrix}] \in ℝ^{(k + 1) \times k \times n_{3}} .$

而 $Q_{k} \in ℝ^{n_{1} \times k \times n_{3}}$ 形成t-Krylov子空间的标准正交张量基。

4.2. 张量GMRES算法

在t-Arnoldi分解算法中，生成了张量列正交的张量 $Q_{k}$ ，若将 $Q_{k}$ 的列作为子空间的基，则有

$\vec{Y} = \underset{\vec{Y} \in ℝ^{k \times 1 \times n}}{arg \min} {‖ A * Q_{k} * \vec{Y} - \vec{ℬ} ‖}_{F}^{2}$

且 $A * Q_{k} = Q_{k + 1} * {\bar{ℋ}}_{k}$ ，则

$\vec{Y} = \underset{\vec{Y} \in ℝ^{k \times 1 \times n}}{arg \min} {‖ Q_{k + 1} {\bar{ℋ}}_{k} * \vec{Y} - \vec{ℬ} ‖}_{F}^{2} .$

由于 $\vec{ℬ} = {\vec{Q}}_{1} * z_{1}$ ，可以得到

$Q_{k + 1}^{T} * \vec{ℬ} = {\vec{e}}_{1} * z_{1} \in ℝ^{(k + 1) \times 1 \times n_{3}} .$

其中 ${\vec{e}}_{1}$ 是一个管标量，除其索引位置(1, 1, 1)元素为1外的其他位置元素都为0。又因为 $Q_{k}$ 张量列正交，那么可以将求解问题(4.1)转化为求解

$\vec{Y} = \underset{\vec{Y} \in ℝ^{k \times 1 \times n}}{arg \min} {‖ {\bar{ℋ}}_{k} * \vec{Y} - {\vec{e}}_{1} * z_{1} ‖}_{F}^{2} .$

将张量GMRES算法的过程在算法4-2中进行描述。

算法4-2. 张量GMRES算法

输入： $A \in ℝ^{n_{1} \times n_{1} \times n_{3}}, ℬ \in ℝ^{n_{1} \times n_{4} \times n_{3}}$ , itermax, tol

输出：问题(3.1)近似解.

${‖ ℛ_{0} ‖}_{F} \leq tol$

For $j = 1, \dots, n_{4}$

计算 $[{\vec{Q}}_{1}, z_{1}] = Normalization ({\vec{ℬ}}_{j})$

${‖ ℛ_{0} ‖}_{F} \leq {‖ z_{1} ‖}_{F}$

For $k = 1, 2, \dots$ until 收敛

使用张量Arnoldi算法用计算 $Q_{k}, Q_{k + 1}$ 和 ${\bar{ℋ}}_{k}$ .

计算 $\vec{Y} = \underset{\vec{Y} \in ℝ^{k \times 1 \times n}}{arg \min} {‖ {\bar{ℋ}}_{k} * \vec{Y} - {\vec{e}}_{1} z_{1} ‖}_{F}^{2}$ .

${\vec{X}}_{j} = Q * \vec{Y} (k ≪ n)$

$ℛ_{k} = {\vec{ℬ}}_{j} - A * {\vec{X}}_{j}$

End For

$X_{(:, j, :)} = {\vec{X}}_{j}$

End For

5. 数值实例

本节的数值实例的实验部分的环境配置均如表1所述。

Table 1. System configuration specifications

表1. 环境配置

环境	配置
CPU	Inter(R) Core(H) i7-11800H @2.30GHz
GPU	NVIDIA GeForce RTX 3060
操作系统	WINDOWS10
内存	16 GB
MATLAB	2018a

例子5.1. 数值恢复

本例比较张量全局-GMRES算法和张量GMRES算法两种算法在对称正定张量系统中的计算性能，在MATLAB中Hansen [24]的正则化工具中的函数baart生成矩阵

$A_{1} = baart (400), A_{2} = gallery (prolate^{'}, 400, α) .$

设 $α = 0.45$ ，张量 $A$ 满足

$A_{(:, :, i)} = A_{1} (i, 1) A_{2}, i = 1, 2, \dots, 400.$

$A$ 的正面切片的条件数都大于10¹⁵。因此张量 $A$ 是高度离散化的，令真实数据 ${\vec{X}}_{t r u e} \in ℝ^{400 \times 1 \times 400}$ 的元素全为1，并通过 $A * {\vec{X}}_{t r u e} = \vec{ℬ}$ 生成数据张量。

经典的最小二乘问题为

${\vec{x}}^{*} : = \underset{\vec{x} \in ℝ^{m n \times 1}}{arg \min} {‖ (A \otimes A) \vec{x} - \vec{b} ‖}_{F}^{2},$ (5.1)

这里的 $A$ 是模糊矩阵，而 $\vec{b}$ 是 $\vec{ℬ}$ 向量化后的结果，问题(5.1)是问题(1.2)矩阵化后的结果。

表2给出了GMRES、G-GMRES和tGMRES算法在数字恢复实验中得到的解的相对误差，所需的迭代次数(子空间维数k)，以及计算时间。表中的数据显示的是GMRES算法求解经典最小化问题(5.1)，以及G-GMRES和tGMRES算法求解t-积结构的问题(1.2)的数据恢复情况。在数字恢复实验中，令收敛的条件是相邻两次迭代解的相对误差小于1e−06，则GMRES算法得到解与真解的相对误差要高于G-GMRES和tGMRES算法，这是因为G-GMRES和tGMRES算法的t-积结构保持了数据的空间结构性，而G-GMRES算法使用的时间多于tGMRES算法，且tGMRES在构建子空间时，构建的子空间维数更小，得到稳定解时的迭代解的相对误差更小。

Table 2. Performance comparison of G-GMRES and tGMRES algorithms in digital restoration experiment

表2. G-GMRES和tGMRES算法在数字恢复实验中的性能比较

算法	迭代数	相对误差	CPU时间(s)
GMRES	213	8.71e−06	103.23
G-GMRES	65	2.03e−06	346.45
tGMRES	44	8.25e−07	236.32

例子5.2. 彩色图像恢复

此例显示了模糊彩色图像辣椒在G-GMRES和tGMRES算法下的恢复情况。原始图像数据在MATLAB中存储为张量 $X_{o r} \in ℝ^{256 \times 256 \times 3}$ ，将其转换为张量列的形式存储，即 $X_{t r u e} \in ℝ^{256 \times 3 \times 256}$ ，其中 $X_{t r u e}$ 的第j个张量列的数据由 $X_{o r}$ 中的第j个正面切片的数据构成。对于模糊张量 $A \in ℝ^{256 \times 256 \times 256}$ ，定义为

$\begin{array}{l} z = [e x p (- ({[0 : b a n d - 1]}^{2}) / (2 σ^{2})), z e r o s (1, N - b a n d)], \\ A = t o e p l i t z (z), A_{(:, :, i)} = \frac{1}{2 π σ} A (i, 1) A, i = 1, \dots, 256. \end{array}$

令 $N = 256, σ = 2.5, band = 12$ ，其中张量 $A$ 的前12个正面切片的条件数大于10⁷，其余切片的条件数皆为无限。

表3显示了在例子5.2的彩色图像恢复实验中，G-GMRES和tGMRES算法的性能比较，包括相对误差和计算时间。在彩色图像恢复实验中，可以得到和例子5.1类似的结果，而G-GMRES算法涉及到扁平化，tGMRES算法相较于G-GMRES算法始终保持t-积结构，保持了彩色图片三通道间的可能存在的空间结构性，这使其得到解时的迭代解的相对误差更小。

Table 3. Performance comparison of G-GMRES and tGMRES algorithms in color image restoration experiment

表3. G-GMRES和tGMRES算法在彩色图像恢复实验中的性能比较

算法	相对误差	CPU时间(s)
G-GMRES	6.32e−06	862.56
tGMRES	5.11e−07	635.24

原图模糊图 G-GMRES恢复图 tGMRES恢复图

Figure 2. The restoration effect of color images

图2. 彩色图像的恢复效果图

图2给出了彩色图像辣椒和被模糊的图像，以及使用G-GMRES和tGMRES算法得到的恢复图像。

6. 结论

传统的图像恢复方法通常需要将模糊图像进行矩阵化或者向量化，这可能破坏了图像各个通道间可能存在的空间结构性，从而导致恢复质量不佳，而全局构建子空间的方法会占用更多的存储空间，在计算时会将误差扩大，使得解的质量下降。张量t-积结构会避免图像进行矩阵化或者向量化，且张量切片形式构建的子空间，占用的空间更少，计算时间更短。

基金项目

资助项目1：KYZK2024010：图像处理中的张量离散不适定问题及其高性能迭代算法研究。

资助项目2：KYZK2024027：变分不等式与不动点问题非单调步长的惯性投影算法。

资助项目3：KYZK2024003：变分不等式与不动点问题在NASH群体博弈的应用研究。

NOTES

^*通讯作者。

参考文献

[1]	Kolda, T.G. and Bader, B.W. (2009) Tensor Decompositions and Applications. SIAM Review, 51, 455-500. [Google Scholar] [CrossRef]
[2]	Tucker, L.R. (1966) Some Mathematical Notes on Three-Mode Factor Analysis. Psychometrika, 31, 279-311. [Google Scholar] [CrossRef] [PubMed]
[3]	De Lathauwer, L., De Moor, B. and Vandewalle, J. (2000) A Multilinear Singular Value Decomposition. SIAM Journal on Matrix Analysis and Applications, 21, 1253-1278. [Google Scholar] [CrossRef]
[4]	Goodfellow, I., Bengio, Y. and Courville, A. (2016) Deep Learning. MIT Press.
[5]	He, K., Zhang, X., Ren, S. and Sun, J. (2015) Delving Deep into Rectifiers: Surpassing Human-Level Performance on Imagenet Classification. 2015 IEEE International Conference on Computer Vision (ICCV), Santiago, 7-13 December 2015, 1026-1034. [Google Scholar] [CrossRef]
[6]	Rasmussen, C.E. and Williams, C.K.I. (2005) Gaussian Processes for Machine Learning. The MIT Press. [Google Scholar] [CrossRef]
[7]	Paszke, A., Gross, S., Massa, F., et al. (2019) PyTorch: An Imperative Style, High-Performance Deep Learning Library. Advances in Neural Information Processing Systems (NeurIPS), Vancouver, 8-14 December 2019.
[8]	Kilmer, M.E. and Martin, C.D. (2011) Factorization Strategies for Third-Order Tensors. Linear Algebra and Its Applications, 435, 641-658. [Google Scholar] [CrossRef]
[9]	Braman, K. (2010) Third-Order Tensors as Linear Operators on a Space of Matrices. Linear Algebra and Its Applications, 433, 1241-1253. [Google Scholar] [CrossRef]
[10]	Cichocki, A. and Amari, S.I. (2010) Tensor Decompositions for Signal Processing Applications: From Two-Way to Multi-Way Component Analysis. IEEE Transactions on Signal Processing, 58, 1226-1241.
[11]	Vasilenko, D. and Savich, A. (2016) Multidimensional Signal Processing Using Tensor Decomposition: A Survey. IEEE Transactions on Signal Processing, 64, 1263-1275.
[12]	Reichel, L. and Ugwu, U.O. (2021) The Tensor Golub-Kahan-Tikhonov Method Applied to the Solution of Ill‐Posed Problems with a T‐Product Structure. Numerical Linear Algebra with Applications, 29, e2412. [Google Scholar] [CrossRef]
[13]	Ugwu, U.O. and Reichel, L. (2021) Tensor Regularization by Truncated Iteration: A Comparison of Some Solution Methods for Large-Scale Linear Discrete Ill-Posed Problems with a T-Product. arXiv preprint arXiv:2110.02485
[14]	Zheng, M. and Ni, G. (2023) Approximation Strategy Based on the T-Product for Third-Order Quaternion Tensors with Application to Color Video Compression. Applied Mathematics Letters, 140, Article 108587. [Google Scholar] [CrossRef]
[15]	Khaleel, H.S., Mohd Sagheer, S.V., Baburaj, M. and George, S.N. (2018) Denoising of Rician Corrupted 3D Magnetic Resonance Images Using Tensor-SVD. Biomedical Signal Processing and Control, 44, 82-95. [Google Scholar] [CrossRef]
[16]	Cichocki, A., Mandic, D., De Lathauwer, L., Zhou, G., Zhao, Q., Caiafa, C., et al. (2015) Tensor Decompositions for Signal Processing Applications: From Two-Way to Multiway Component Analysis. IEEE Signal Processing Magazine, 32, 145-163. [Google Scholar] [CrossRef]
[17]	Zhang, J., Saibaba, A.K., Kilmer, M.E. and Aeron, S. (2018) A Randomized Tensor Singular Value Decomposition Based on the T-Product. Numerical Linear Algebra with Applications, 25, e2179. [Google Scholar] [CrossRef]
[18]	Hao, N., Kilmer, M.E., Braman, K. and Hoover, R.C. (2013) Facial Recognition Using Tensor-Tensor Decompositions. SIAM Journal on Imaging Sciences, 6, 437-463. [Google Scholar] [CrossRef]
[19]	Kilmer, M.E., Braman, K., Hao, N. and Hoover, R.C. (2013) Third-Order Tensors as Operators on Matrices: A Theoretical and Computational Framework with Applications in Imaging. SIAM Journal on Matrix Analysis and Applications, 34, 148-172. [Google Scholar] [CrossRef]
[20]	El Guide, M., El Ichi, A., Jbilou, K. and Sadaka, R. (2021) On Tensor GMRES and Golub-Kahan Methods via the T-Product for Color Image Processing. The Electronic Journal of Linear Algebra, 37, 524-543. [Google Scholar] [CrossRef]
[21]	Song, H., Wang, S. and Huang, G. (2023) Tensor Conjugate-Gradient Methods for Tensor Linear Discrete Ill-Posed Problems. AIMS Mathematics, 8, 26782-26800. [Google Scholar] [CrossRef]
[22]	Wang, S., Huang, G. and Yin, F. (2024) Tensor Conjugate Gradient Methods with Automatically Determination of Regularization Parameters for Ill-Posed Problems with T-Product. Mathematics, 12, Article 159. [Google Scholar] [CrossRef]
[23]	Kernfeld, E., Kilmer, M. and Aeron, S. (2015) Tensor-Tensor Products with Invertible Linear Transforms. Linear Algebra and Its Applications, 485, 545-570. [Google Scholar] [CrossRef]
[24]	Hansen, P.C. (1998) Rank-Deficient and Discrete Ill-Posed Problems. Society for Industrial and Applied Mathematics. [Google Scholar] [CrossRef]

为你推荐

友情链接