基于秩的逼近的张量鲁棒主成分分析

doi:10.12677/AAM.2020.910210

期刊菜单

基于秩的逼近的张量鲁棒主成分分析
Tensor Robust Principal Component Analysis via Non-Convex Rank Approximation

DOI: 10.12677/AAM.2020.910210, PDF, HTML, XML,
作者: 费靖斯, 杨天旭：辽宁师范大学数学学院，辽宁大连
关键词: 张量秩的非凸近似；非凸的张量鲁棒主成分分析；张量奇异值分解；图片去噪；Non-Convex Approximation of Tensor； Rank Non-Convex Tensor Robust Principal Component Analysis； Tensor Singular Value Decomposition； Image Denoising

摘要: 本文提出来一种新的张量秩近似并建立一种非凸TRPCA模型，使用一种有效的增广拉格朗日乘子优化算法对这个非凸最小化问题进行求解。实验结果表明，相对于基于核范数的张量鲁棒主成分分析算法，该算法得到的估计张量的偏差更小，在精度和效率上是有效的。

Abstract: In this paper, a new tensor rank approximation is proposed and a non-convex TRPCA model is established. An effective augmented Lagrangian multiplier optimization algorithm is used to solve this non-convex minimization problem. The experimental results show that compared with the tensor robust principal component analysis algorithm based on kernel norm, the estimated tensor obtained by this algorithm has smaller deviation and is effective in terms of accuracy and efficiency.

文章引用：费靖斯, 杨天旭. 基于秩的逼近的张量鲁棒主成分分析[J]. 应用数学进展, 2020, 9(10): 1815-1820. https://doi.org/10.12677/AAM.2020.910210

1. 引言

张量鲁棒主成分分析(TRPCA：Tensor Robust Principal Component Analysis)在处理真实世界中图像数据如RGB图像，视频、高光谱图像，和磁共振图像是很有效的。张量的核范数，作为张量秩函数的凸近似，在TRPCA中得到了广泛的研究。但是，应用张量的核范数得到的近似误差不是可以忽略不计的，因此实验后得到的去噪效果不是很理想。为了解决上述核范数的局限性并寻求更近似的秩函数，我们提出了一种非凸秩近似。并用这个张量的非凸秩近似去替代张量核范数，从而提出一个非凸TRPCA算法。

2. 预备知识

本节介绍张量的一些符号及其基本定义，对于一个三阶张量A，用 $a_{i j k}$ 表示其 $(i, j, k)$ 个元素，用 $A (i, :, :)$ , $A (:, i, :)$ , $A (:, :, i)$ 来分别表示第i个水平，垂直，前后切片，其中前后切片通常被称作正面切片，在本文中，用 $A^{(i)}$ 来表示张量的第i个正面切片。

定义2.1 张量的 $l_{1}$ 范数： ${‖ A ‖}_{1} = \sum_{i j k} | a_{i j k} |$ 。

定义2.2 张量的Frobenius范数： ${‖ A ‖}_{F} = \sqrt{\sum_{i} \sum_{j} \sum_{k} a_{i j k}^{2}}$ 。

定义2.3张量的核范数张量A的核范数定义为： ${‖ A ‖}_{*} = \frac{1}{n_{3}} \sum_{i = 1} \sum_{j = 1} σ_{i} ({\bar{A}}^{(j)})$ 。

定义2.4块对角矩阵。

块对角矩阵 $b d i a g (\bar{A})$ 的定义如下，其中对角线上的每一个块是 $\bar{A}$ 的正面切片

$b d i a g (\bar{A}) = [\begin{matrix} {\bar{A}}^{(1)} \\ {\bar{A}}^{(2)} \\ ⋱ \\ {\bar{A}}^{(n_{3})} \end{matrix}] \in C^{n_{1} n_{3} \times n_{2} n_{3}}$

定义2.5块循环矩阵

$b c i r c (A) = [\begin{matrix} A^{(1)} & A^{(n_{3})} & \dots & A^{(2)} \\ A^{(2)} & A^{(1)} & \dots & A^{(3)} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ A^{(n_{3})} & A^{(n_{3} - 1)} & \dots & A^{(1)} \end{matrix}] \in C^{n_{1} n_{3} \times n_{2} n_{3}}$

其中 $\bar{A}$ 表示对三阶张量 $A \in R^{n_{1} \times n_{2} \times n_{3}}$ 使用命令fft，即将A沿第三维进行快速傅里叶变换得到的张量，即

$\bar{A} = f f t (A, [], 3)$ ，

同样， $\bar{A}$ 可以通过fft的逆变换反傅里叶变换ifft得到A，即 $A = i f f t (\bar{A}, [], 3)$ 。

定理2.1：张量的T-SVD分解：给定一个张量 $A \in R^{n_{1} \times n_{2} \times n_{3}}$ ，可以有如下分解

$A = U * S * V^{*}$

其中是 $U \in R^{n_{1} \times n_{1} \times n_{3}}$ ， $V \in R^{n_{2} \times n_{2} \times n_{3}}$ 是正交张量， $S \in R^{n_{1} \times n_{2} \times n_{3}}$ 是f-对角张量，其每一个正面切片都是对角矩阵。

3. 通过秩的非凸逼近的低秩张量RPCA算法

在这一部分中，我们提出了一种新的张量管秩逼近，并提出了一种非凸张量RPCA算法。

定义3.1张量的 $γ$ -范数 [1]。

假设张量 $L \in R^{n_{1} \times n_{2} \times n_{3}}$ ，不妨设 $n = \min (n_{1}, n_{2})$ 有T-SVD分解； $L = U * S * V^{*}$ ，张量L的 $γ$ -范数定义为：

${‖ L ‖}_{γ} = \frac{1}{n_{3}} \sum_{i} \sum_{j} \frac{(1 + γ) σ_{i} ({\bar{L}}^{(j)})}{γ + σ_{i} ({\bar{L}}^{(j)})}$ (3.1)

可以观察到 $\lim_{γ \to \infty} {‖ L ‖}_{γ} = {‖ L ‖}_{*}$ ，并且 ${‖ L ‖}_{γ}$ 是一个正交不变范数，即对于任意的正交张量 $U, V$ ，有 ${‖ L ‖}_{γ} = {‖ U L V ‖}_{γ}$ 成立。

3.2张量RPCA的非凸优化模型

由于新定义的张量的 $γ$ -范数 ${‖ L ‖}_{γ}$ 可以看作是张量的核范数的近似，不妨考虑RPCA的一般框架

$\min_{L, S} {‖ L ‖}_{γ} + {‖ S ‖}_{l_{1}} s .t . X = L + S$ (3.2)

对于问题(3.2)，通过引入拉格朗日乘子Y和二次惩罚项可以构造增广拉格朗日函数

$L (L, S, Y, μ) = {‖ L ‖}_{γ} + λ {‖ S ‖}_{l_{1}} + 〈 Y, L + S - X 〉 + \frac{μ}{2} {‖ L + S - X ‖}_{F}^{2}$ (3.3)

其中 $μ$ 是正参数，我们采用交替方向乘子方法(ADMM)对L,S,Y进行迭代更新 [2]，其中，在第 $k + 1$ 步迭代时，我们更新 $L_{k + 1}$ ：

$L_{k + 1} = \underset{L}{\arg \min} {‖ L ‖}_{γ} + \frac{μ^{k}}{2} {‖ L - (X - S_{k} - \frac{Y_{k}}{μ_{k}}) ‖}_{F}^{2}$ (3.4)

对于S, Y, $μ$ 的更新如下 [3]：

更新S

$S_{k + 1} = \underset{S}{\arg \min} λ {‖ S ‖}_{l_{1}} + \frac{μ_{k}}{2} {‖ S - (X - L_{k + 1} - \frac{Y_{k}}{μ_{k}}) ‖}_{F}^{2}$ (3.5)

更新Y

$Y_{k + 1} = Y_{k} + μ_{k} (L^{k + 1} - X + S^{k + 1})$ (3.6)

更新 $μ$

$μ_{k + 1} = ρ μ_{k}$ (3.7)

为了求解问题(3.4)，首先引入定理3.1。

定理3.1 假设矩阵 $A \in R^{n_{1} \times n_{2}}$ 有奇异值分解 $A = U Σ_{A} V^{T}$ ，其中 $Σ_{A} = d i a g (σ_{A})$ ，令 $F (X) = f \circ σ (X)$ ，则下述优化问题

$\min_{X} F (X) + \frac{μ}{2} {‖ X - A ‖}_{F}^{2}$

的最优解为 $X^{*} = U Σ_{X}^{*} V^{T}$ ，其中 $Σ_{X}^{*} = d i a g (σ^{*})$ ，而 $σ^{*} = p r o x_{f, μ} (σ_{A})$ ，这里 $p r o x_{f, μ} (σ_{A})$ 定义为

$p r o x_{f, μ} (σ_{A}) \underset{σ}{= \arg \min} f (σ) + \frac{μ}{2} {‖ σ - σ_{A} ‖}_{2}^{2}$

由于上述问题是凹凸函数的组合，这种内在结构促使我们使用DC算法(DCA: Difference of Convex Algorithm)，即将一个非凸函数分解为两个凸函数的差值，并在每次迭代时通过线性化凹项来迭代优化 [4]。在第k+1步内部迭代时，

$σ_{k + 1} = \arg \min 〈 w_{k}, σ 〉 + \frac{μ^{t}}{2} {‖ σ - σ_{A} ‖}_{2}^{2}$

其封闭解为 $σ_{k + 1} = {(σ_{A} - \frac{w_{k}}{μ^{t}})}_{+}$ , $w_{k} = \partial f (σ_{k})$ 是 $f (σ)$ 在 $σ_{k}$ 处的梯度。

设张量 $A, X$ 的块对角矩阵分别为 $\hat{A}, \hat{X}$ ，由块循环矩阵和块对角矩阵的关系，得到： ${‖ A ‖}_{F} = \frac{1}{\sqrt{n_{3}}} {‖ \hat{A} ‖}_{F}$ ， $〈 X, A 〉 = \frac{1}{n_{3}} 〈 \hat{X}, \hat{A} 〉$ 。不妨记张量L的块对角矩阵为 $\hat{L}$ ，则由矩阵的 $γ$ -范数的定义，有 ${‖ \hat{L} ‖}_{γ} = \sum_{i} \frac{(1 + γ) σ_{i} (\hat{L})}{γ + σ_{i} (\hat{L})}$ ，其中 $σ_{i} (\hat{L})$ 表示块对角矩阵 $\hat{L}$ 的 $n \cdot n_{3}$ 个奇异值，而由块对角矩阵的定义可以得到

${‖ \hat{L} ‖}_{γ} = \sum_{i} \frac{(1 + γ) σ_{i} (\hat{L})}{γ + σ_{i} (\hat{L})} = \sum_{j} \sum_{i} \frac{(1 + γ) σ_{i} ({\bar{L}}^{(j)})}{γ + σ_{i} ({\bar{L}}^{( j )})}$

其中 $i = 1, 2, \dots, n; j = 1, 2, \dots, n_{3}$ ，在这里 $n = \min (n_{1}, n_{2})$ ，为了后文说明方便，不妨记 $Q = X - S_{k} - \frac{Y_{k}}{μ_{k}}$ ，故可以将原始目标函数(3.4)转化为

$\min \frac{μ^{k}}{2} \cdot \frac{1}{n_{3}} {‖ \hat{L} - \hat{Q} ‖}_{F}^{2} + \frac{1}{n_{3}} \cdot {‖ \hat{L} ‖}_{γ}$ (3.8)

则有

$\begin{matrix} {(\hat{L})}^{k + 1} = \underset{\hat{L}}{\arg \min} \frac{μ^{k}}{2} \cdot \frac{1}{n_{3}} {‖ \hat{L} - \hat{Q} ‖}_{F}^{2} + \frac{1}{n_{3}} \cdot {‖ \hat{L} ‖}_{γ} \\ = \frac{1}{n_{3}} \underset{\hat{L}}{\arg \min} {\frac{μ_{k}}{2} {‖ \hat{L} - \hat{Q} ‖}_{F}^{2} + {‖ \hat{L} ‖}_{γ}} \end{matrix}$ (3.9)

由于 ${‖ \hat{L} ‖}_{γ} = f \circ σ (\hat{L})$ 是关于矩阵 $\hat{L}$ 的正交不变函数，根据定理3.1优化问题 $\min {\frac{μ_{k}}{2} {‖ \hat{L} - \hat{Q} ‖}_{F}^{2} + {‖ \hat{L} ‖}_{γ}}$ 的解为 ${(\hat{L})}^{*} = U Σ_{\hat{L}}^{*} V^{T}$ ，其中 $\hat{Q} = U Σ_{\hat{Q}} V^{T}$ 是矩阵 $\hat{Q}$ 的SVD分解。而 $Σ_{\hat{L}}^{*} = d i a g (σ^{*})$ ，其中 $σ^{*} = p r o x_{f, μ} (σ_{\hat{Q}})$ 。这里 $p r o x_{f, μ} (σ_{\hat{Q}})$ 定义为

$p r o x_{f, μ} (σ_{\hat{Q}}) \underset{σ}{= \arg \min} f (σ) + \frac{μ}{2} {‖ σ - σ_{\hat{Q}} ‖}_{2}^{2}$ (3.10)

对于(3.10)，我们采取凸差算法，凸差算法旨在每次迭代时通过线性化凹项进行优化。在第 $k + 1$ 步内部迭代时，有

$σ_{k + 1} = \arg \min 〈 w_{k}, σ 〉 + \frac{μ^{t}}{2} {‖ σ - σ_{\hat{Q}} ‖}_{2}^{2}$ (3.11)

其封闭解为

$σ_{k + 1} = {(σ_{\hat{Q}} - \frac{w_{k}}{μ^{t}})}_{+} = \max (σ_{\hat{Q}} - \frac{w_{k}}{μ^{t}}, 0)$ (3.12)

其中， $w_{k} = \partial f (σ_{k})$ 是 $f (σ)$ 在 $σ_{k}$ 处的梯度，经过一系列的迭代以后， $σ_{k + 1}$ 收敛到局部最优点 $σ^{*}$ 。故(3.8)的解为 ${(\hat{L})}^{k + 1} = \frac{1}{n_{3}} U \sum_{\hat{L}}^{*} V^{T}$ 。

4. 图像数据实验

在本文中，我们主要将所提出的新的非凸的低秩张量RPCA算法应用于图像去噪，并将其与传统的TRPCA [5] 与SNN算法 [6] 的去噪效果进行比较。具体来说，选取大小设置为 $321 \times 481 \times 3$ ，30%的像素被破坏一张彩色测试图像，通过对比彩色图片的恢复效果，来评价张量去噪模型的修复效果，实验结果如图1所示。

Figure 1. Image recovery comparison by using different methods (a) Original image (b) Noisy images. Recovered image by (c) TRPCA (d) SNN (e) NCTRPCA, respectively

图1. 用不同方法进行图像恢复的比较(a)原始图片(b)噪声图片(c) (d) (e)分别表示经过TRPCA，SNN，NCTRPCA三种模型后恢复的图片

其中NCTRPCA表示本文所提出的基于秩的非凸逼近的TRPCA算法，通过观察恢复后的图片，我们可以证明所提出的新算法在图像去噪上是有效的。

5. 结论

在本文中，我们提出了一个张量秩的非凸近似并建立了一个非凸张量鲁棒主成分分析模型，通过对图像去噪的实验证明，应用该非凸优化算法对于带有噪声的原始图片去噪是具有一定效果的。

参考文献

[1]	Kang, Z., Peng, C. and Cheng, Q. (2015) Robust PCA via Nonconvex Rank Approximation. 2015 IEEE International Conference on Data Mining, Atlantic City, 14-17 November 2015. https://doi.org/10.1109/ICDM.2015.15
[2]	Boyd, S., Parikh, N., Chu, E., Peleato, B. and Eckstein, J. (2011) Distributed Optimization and Statistical Learning via the Alternating Direction Method of Multipliers. Foundations and Trends® in Machine Learning, 3, 1-122. https://doi.org/10.1561/2200000016
[3]	Candès, E.J., Li, X., Ma, Y. and Wright, J. (2011) Robust Principal Component Analysis? Journal of the ACM (JACM), 58, Article No. 11. https://doi.org/10.1145/1970392.1970395
[4]	Tao, P.D. and An, L.T.H. (1997) Convex Analysis Approach to DC Programming: Theory Algorithms and Applications. Acta Mathematica Vietnamica, 22, 289-355.
[5]	Lu, C., Feng, J., Chen, Y., Liu, W., Lin, Z. and Yan, S. (2016) Tensor Robust Principal Component Analysis: Exact Recovery of Corrupted Low-Rank Tensors via Convex Optimization. 2016 Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, 27-30 June 2016, 5249-5257. https://doi.org/10.1109/CVPR.2016.567
[6]	Huang, B., Mu, C., Goldfarb, D. and Wright, J. (2014) Provable Low-Rank Tensor Recovery. Optimization-Online, 4252.

为你推荐

友情链接