1. 引言
近年来,随着现代网络技术的急速发展,计算机视觉、图像处理以及推荐系统等领域得到了前所未有的关注与高度,与此同时获取大量的高维数据也逐渐变得简单起来。但是获取高维数据过程中难免会有部分数据丢失的情况出现。虽然矩阵填充也可恢复出丢失的元素,但是当待恢复的高维数据具有相对复杂的结构时,利用矩阵填充可能会造成维度灾难、过拟合以至于最终破坏数据结构。因此作为矩阵填充的推广,根据数据的低秩性来恢复出所有丢失的元素来更好地描述高维数据结构的低秩张量填充,逐渐得到各领域学者的重视。
通过将彩色图像或者视频看做三维张量,先前的学者们已经提出了张量核范数的几种定义。但是这些定义可能无法正确地近似于张量真正的秩而且在优化中没有明确地使用低秩性质,这就造成了局限性。最近提出的截断核范数(TNN)被证明可以代替传统的核范数来更好的近似秩。基于此, [1] 提出了张量截断核范数(T-TNN)将截断核范数从矩阵情形推广到张量情形。但是这种方法需要多次迭代才能收敛。本文在熟悉截断核范数和张量相关知识的基础上,认真分析国内外学者在张量填充领域的研究现状,提出了双加权截断核范数张量填充(DW-T-TNN)方法,将不同的权重分别分配给张量每个前片的行和列,以加快收敛速度并获得可接受的性能。同时提出了一种简单的梯度下降方法,代替了T-TNN中第二步的迭代更新方法。在真实数据上进行的有效实验证明,DW-T-TNN具有良好的性能,在完成的速度和视觉效果上都具有优势。
2. 预备知识
定义1 [2] 张量核范数:张量
的核范数记为
,表示
所有正面切片核范数的平均值,即:
定义2 [2] 张量
范数:张量
,
表示张量进行傅里叶变换之后的块循环矩阵,张量
范数即:
定义3 [1] 张量截断核范数:
张量
的截断核范数为
,被定义为
其中
,
是由TSVD生成的,
定义4 [3] 张量奇异值分解:
设
的TSVD是
,其中
是正交的,
是f-对角张量。
定义5 [2]
,
,则有
。
3. 双加权截断核范数张量填充
3.1. 模型的建立
由 [1] 易证明,张量截断核范数等价于
(1)
其中
,
,
,
显而易见,直接求解上式并不容易,所以我们把这个优化分为两步进行,指定
作为初始化.在第k次迭代中,第一步我们固定
来更新
、
、
和
。
(2)
(3)
(4)
(5)
接下来在第二步中,我们通过保持其他变量不变,通过下列算式更新优化
。
(6)
然后引入辅助变量,在这里我们采用交替乘子法进行求解,
(7)
随后转化成为一个无约束的增广拉格朗日函数进行求解,
(8)
为了更准确,有更高优先级的进行填充,我们选择在这里加入权重
(9)
其中
,
是权重对角张量。
3.2. 模型的优化
假设
,
表示第二步中第K次迭代的结果,我们通过保持其他变量不变,来更新
如下
(10)
由约束条件可知,观测元素的值保持不变,在此获得
(11)
的更新如下
(12)
的更新如下
(13)
其中
是单调递增序列。
这三项更新步骤在实际应用中需要大量的迭代才能收敛,计算代价很大。在此我们根据其中的内在关联,推出一种简洁的梯度下降方式,即在不需要大量迭代步骤的情况下,就可以有效地更新
,如下定理1所示。
定理1 [4]:如果
,
,
,由(10)~(13),
的更新可以由下的面一步迭代更新完成
(14)
(15)
其中
代表补步长,证明在此处不详述。
此外,为了简便表示,下面我们定义两个两个对角张量
,
,
的每一个前片
(16)
的每一个前片
(17)
,
分别根据每行和每列中观察到的元素的数量精确确定,如下
(18)
其中
和
是缩放权重,这意味着具有更多的观察元素的行(列)具有更小的权重值,并且
意味着此时没有元素丢失。
基于上述,我们引入梯度下降法。
首先我们介绍一个引理 [5]:假设对于任意两个张量
,
,令
,则有下面性质成立
1)
。
2)
和
相互相等。
(19)
(20)
由引理1,
,容易证得
(21)
因此,通过定理1,(16)~(18),和(21),
可以不用大量迭代,即通过一个简单的梯度下降方法就可以有效地计算,即:
(22)
(23)
在上面两个式子的基础上,我们发现它们等价于函数
的梯度下降法搜索的解。
由于上述一步梯度下降法的优点,代替了在第二步中迭代计算
,因此,我们可以将(1)转换为以下公式:
(24)
注意到当
意味着
,
这就意味着梯度消失,所以在此我们选择
这样就会避免这种情况的发生,这也符合视觉数据(例如真实图像)普遍具有低阶结构的事实。换句话说,实际的秩r要比图像的尺寸小得多。
初始值
,(24)的优化是通过一个梯度下降法解决如下
(25)
其中
是递减的步长,满足
(26)
其中
是一个常数。
4. 实验部分
实验部分将本文模型(DW-T-TNN)与TNN (截断核范数)、T-TNN (张量截断核范数)、DW-TNN (加权截断核范数)这3个模型来作比较,在此选取图片大小为300 × 300 × 3,椒盐噪声为50%的彩色图片。我们通过对比彩色图片的恢复情况的视觉效果,展示本文模型的恢复效果。下面列出在单张彩色图片上这四种模型恢复上的视觉效果,如图1所示。并且对比了四种模型恢复图片所用的时间,如表1所示。

Table 1. Comparison of denoising time of four different algorithms
表1. 四种不同算法去噪时间对比
5. 结论
在本文中,我们提出了双加权截断核范数张量填充模型,以及一种简洁的梯度下降方法。实验表明在相同噪声情况下,视觉效果和时间都优于其他算法,所以该方法对图像恢复是有优化效果的。
参考文献