1. 引言
具有张量形式的线性离散不适定问题是彩色图像复原、视频去模糊、目标识别、层析成像图像重建等领域的共性问题,是数值代数的一个重要研究内容之一。许多图像恢复方法通过叠加表示图像的矩阵元素来对每个图像进行向量化。矩阵条目表示编码灰度值的像素值。每一帧表示一个图像,因此,一个视频可以被表示为一个长向量,每个条目表示某一帧中的一个像素值。然而,这种表示破坏了原始视频帧可能拥有的空间相关性和结构复杂性。具有t-积结构的三阶张量系统由Kilmer等人 [1] 提出,该系统避免了矩阵化和向量化,保留了多维结构。t-乘积已被证明有用的应用领域包括面部识别 [2] 、层析图像重建 [3] 、视频补全 [4] 和图像分类 [5] 。用t-积求解大规模离散线性不适定问题的方法有很多。Kilmer等人 [2] 提出了一种张量共轭梯度(t-CG)方法以求解张量线性系统
的最小二乘问题。Zhang等人 [6] 提出了计算超大数据集的随机张量奇异值分解(rtSVD)方法,在图像数据压缩和分析方面具有应用前景。Ugwu和Reichel [7] 提出了一种新的随机张量奇异值分解(R-tSVD),该方法改进了 [1] 中的截断张量奇异值分解(T-tSVD)。Guide等人 [8] 开发了张量T-全局GMRES算法和张量T-全局Golub-Kahan算法,并使用季洪诺夫正则化技术获得了有效的正则化解。最近,Reichel等人引入了张量Golub-Kahan双对角化方法 [9] 、张量Arnoldi-Tikhonov和张量GMRES-type [10] ,通过将大尺度问题简化为小尺度问题来解决大规模线性不适定问题。Lampe等人 [11] 开发了广义Krylov子空间(GKS)方法来求解大规模Tikhonov正则化问题。
2. 预备知识
对于三阶张量
,图1显示了正面切片
、横向切片
和管
。为了简化,我们缩写为
。在t-积的定义中广泛地使用循环矩阵
,
则
是一个循环矩阵。循环矩阵可以用归一化离散傅里叶变换(DFT)矩阵,它是酉矩阵。特别地,如果v是
,
是
DFT矩阵,
是它的共轭转置,则
是对角的。从一个张量的切片中创建一个块循环矩阵。假设块循环是由张量正面切片创建的,我们利用上面的例子得到块–循环矩阵
.
一个
矩阵由
得到,而算子fold将这个矩阵折叠回张量
,即,
定义 给定两个张量
和
,它们之间的t-积
被定义为
这里
。
(a) (b) (c)
Figure 1. (a) Frontal slices
; (b) Lateral slices
; (c) Tube fibers
图1. (a) 正面切片
;(b) 横向切片
;(c) 管
张量QR(tQR)的分解由Kilmer等人 [12] 描述。
的QR分解表示为
其中张量
是部分正交的,
的每个正面切片是一个上三角形。算法1的tQR分解是在傅里叶域实现tQR分解。
算法1. tQR分解 [1]
表1是本文所使用的符号的说明,
3. 张量Tikhonov正则化方法
本文旨在求解张量t-积结构的线性系统
(3.1)
和最小二乘问题
(3.2)
张量
的管秩的确定不明,即很难有意义地定义
的管秩。具体地说,
的奇异管的Frobenius范数随指数数的增加而迅速衰减为零。特别地,它的许多奇异管以不同数量级的微小Frobenius范数的形式存在,使得最小化变得离散不适定,此时称问题(3.1)为张量离散线性不适定问题。它们产生于彩色图像和视频的恢复,如 [1] [9] [10] 。
一般情况下,不适定问题(3.1)的右端张量列
是观察得到的数据,假设
是一个未知的、不可用的张量列,则真实解对应的线性方程为
,在问题(3.1)中,
被噪声
污染,即,
由于
的某些正面切片的条件数很大以及
中噪声
的影响,它的直接解是没有意义的。正则化通常是用来减少(3.1)的病态性的影响。我们考虑Tikhonov正则化,并替换问题(3.1)为张量惩罚最小二乘问题
(3.3)
这里的
为正则化参数。最小化问题(3.3)的正规方程为
(3.4)
4. 张量广义Krylov子空间方法
本文将矩阵形式的广义Krylov子空间(GKS)方法推广到具有t-积结构的三阶张量系统中,得到了张量广义Krylov子空间投影方法(tGKS)。考虑了tGKS方法来构造(3.4)的子空间。我们在解空间中构造了一组基
,用张量列
表示为
定理 假设在t-积结构中,
表示张量
的零空间,当问题(3.3)满足
且
,最小化问题(3.3)有一个唯一的解
定理证明详见文献 [9] 。使
,则可获得(3.3)的变体
. (4.1)
是张量列正交的,且满足
,正规方程(3.4)到子空间
中的投影可以表示为
(4.2)
将
设置为一个可用的正则化参数,可以得到
(4.3)
直接计算(4.3)的代价是昂贵的,由于张量
的数据量过大,整体计算
的t-积的逆会占据过多内存,一种合理的考虑是将
进行分解,可使用张量QR(tQR)分解。即使得
则可得到
(4.4)
对于(4.4)的解并结合
,获得(3.4)的残差
(4.5)
在更新搜索空间
过程中,不可避免地会出现一个舍入错误。为了增强正交性,将
重新正交化用于更新
。因此
(4.6)
方程(3.1)为标准形式,
的张量列构成k维张量Krylov子空间的标准正交基
综合(3.1)~(4.6),得到了算法2的张量广义Krylov子空间-Tikhonov方法(tGKS-T)。
算法2. tGKS-T
5. 数值列子
本节说明了当应用于解决线性离散不适定问题时所描述的方法的性能。本节所有的计算都是在intel core i7和16GB ram的电脑上使用MATLAB 2018进行的。
设
方法是用所选方法对最小化问题(3.1)的计算解。为了比较计算解的质量,我们评估了相对误差
以及信噪比
对于由三阶张量
给出的数据的问题的相对误差被类似地确定。
在数值实验中,我们同样考虑作为彩色图像和视频恢复的实验,将三通道的彩色图像通过squeeze和twist算子 [2] 进行与侧向切片的转换,可将三通道彩色图像的恢复问题分解为p个问题(3.1),我们将三通道彩色图像和视频恢复问题描述为
其中生成一个“噪声”张量
,通过确定横向切片
,模拟数据张量
的误差。它们的项以零均值正态分布,并被缩放以对应一个特定的噪声水平
。因此
其中,
的条目按N(0, 1)分布。
例子5.1 数值恢复
取矩阵
由Hansen的正则化工具 [13] 中的函数baart生成,并在MATLAB中定义
。我们取α = 0.50。那么
是一个对称的正定病态的Toeplitz矩阵。在此,可以定义
为
确切的数据张量
由
得到,而精确数据
的所有元素均为1。生成了受噪声污染的数据张量由
产生,而张量
的每个正面切片
的条件数都满足
。本文设定的噪音水平在实际计算中设为不可知,正则化参数通过多次实验得到一个合理值,有关正则化参数可以通过L-曲线,差异原理等方式确定,而正则化参数的合理设定以及求解已远远超出本文范围,本文不再讨论。
表2给出了在不同噪声水平下由tGKS方法和一般矩阵系统的广义Krylov子空间方法(GKS)计算出的信噪比和相对误差,所需的迭代次数(子空间维数k),以及计算时间。表中的数据显示tGKS方法的恢复效果优于GKS。tGKS方法使用了比GKS更多的时间,但tGKS只需要构造少数的子空间,且得到的解的相对误差
与SNR都优于GKS,这是由于tGKS的张量t-积结构可以整体考虑数据。
例子5.2 彩色图像恢复
此示例显示了模糊彩色图像Lena在tGKS方法下的恢复情况。在MATLAB中原始图像数据存储为张量
,并将这个张量转换为张量
,设置
和band = 12,定义
,其中
,
,即,
表3显示了例子5.2的在不同噪音水平下的结果,在噪音水平较小时,所需要的迭代时间更多,这是由于在更小的噪音水平的系统中进行迭代时,要达到设置的收敛条件需要更多次迭代,可以得到更精确的迭代解,因此当满足设置的算法停止标准时,更小的噪音水平的系统的迭代时间虽然更长,但得到的解更精确。
矩阵系统的GKS方法在MATLAB上进行彩色图像的恢复实验中,通常是将彩色图像三通道进行矩阵平展开后进行矢量化,这样的方式意味着要建立更多的子空间。
而tGKS方法的张量t-积考虑了彩色图像三通道之间可能存在的空间结构性,从整体上对模糊和加噪的彩色图像进行恢复,建立了比GKS方法少的子空间,恢复效果也优于GKS方法。
图2给出了彩色图像Lena和被模糊加了噪音的图像,以及tGKS方法和GKS方法下的恢复图像。
Figure 2. The restoration effect of color images in Table 3 with
图2. 表3中
时,彩色图像的恢复效果图
6. 结论
相对于传统方法,即将模糊图像进行矩阵化或者向量化,张量t-积结构考虑了各个通道间的空间结构性。本文介绍的含t-积结构的张量广义Krylov子空间方法在求解离散不适定问题时,建立的Krylov子空间维数较少,通过说明例证明了所提出的方法在数值计算和图像恢复应用中的有效性。值得注意的是,tGKS方法通过相对误差和信噪比值评估,提供了图像恢复算法性能的综合评估,在图像恢复和视频恢复上显示出显著的潜力。
基金项目
四川省中央引导地方科技发展专项项目(2022ZYD0008)。