基于MSSOR求解信号恢复问题的ADMM算法
ADMM Algorithm for Solving Signal Recovery Problem Based on MSSOR
摘要: 基于改进的对称逐次超松弛(MSSOR)方法,本文针对信号恢复问题提出了一种交替方向乘子(ADMM)法。该方法是一种内外部迭代相结合的方法,其中内部迭代为MSSOR方法,外部迭代为ADMM方法。在适当条件下,证明了所提算法的全局收敛性,数值结果表明,该方法既能在较短的时间内恢复信号,又能提高重构图像的质量。
Abstract: Based on the improved symmetric successive overrelaxation (MSSOR) method, an alternating direction multiplier (ADMM) method is proposed to solve the signal recovery problem. The method is a combination of internal and external iterations, in which the internal iteration is MSSOR method and the external iteration is ADMM method. Under appropriate conditions, the global convergence of the proposed algorithm is proved. Numerical results show that the proposed method can not only restore the signal in a short time, but also improve the quality of the reconstructed image.
文章引用:袁月, 宇振盛. 基于MSSOR求解信号恢复问题的ADMM算法[J]. 应用数学进展, 2021, 10(11): 3932-3941. https://doi.org/10.12677/AAM.2021.1011418

1. 引言

在信号处理过程中,信号恢复的两项关键技术是压缩感知(CS)和图像去模糊 [1] [2] [3]。具体来说,对于稀疏或可压缩信号,CS可以在不影响重构质量的情况下显著减少测量次数 [4] [5]。对于模糊图像,图像去模糊可以保证恢复真实图像 [6]。近年来,信号恢复已经成为医学、天文图像恢复、文件恢复和编码等应用领域的重要工具 [7] [8]。

设x是稀疏的或近似稀疏的原始信号, A R m × n ( m n ) 是一个线性算子,对于给定的观测值 b R m ,满足 b = A x ,我们需要通过求解线性方程组 A x = b 来重构原始信号x,由于 A R m × n ( m n ) 在这个线性系统中是欠定或者病态的,因此寻求此线性系统的解一般来说比较困难 [9]。根据压缩感知的基本理论,重构原始信号x需要求解如下的连续优化问题 [10] [11]:

min x { x 1 : A x = b } . (1)

考虑到实际中噪声的存在,(1)的约束可以放宽,重新表述为以下受惩罚的最小二乘问题:

min x { τ x 1 + 1 2 A x b 2 2 } , (2)

式中 τ 为平衡参数。

为了求解模型(2),学者们提出了多种迭代方法,其中迭代收缩阈值法(IST)和快速迭代收缩阈值法(FISTA) [12] [13] 因其简单高效而最受欢迎。另外,文献 [14] 提出了一种不动点连续搜索方法,并引入了一种基于Barzilai-Borwein步长的非单调线搜索加速技术 [15]。Figueiredo提出了梯度投影方法来解决稀疏重建问题 [16],Xiao等分别提出了求解问题(2)的共轭梯度投影法和谱梯度法 [17] [18]。由一个近似等价问题的驱动,文献 [19] 进一步将修正谱共轭梯度投影法推广到求解方程组。研究表明, [19] 中的算法在解决大规模非线性单调方程组中明显优于以上的算法。

本文将问题(2)转化为一个等价的凸二次规划问题,并给出一种改进的对称逐次超松弛(MSSOR)的交替方向乘子(ADMM)算法。数值实验表明,在处理信号恢复问题上,相较于类似的方法,本文的算法是更有效的。

2. 预备工作

对于任意向量 x R n ,令 x = u v u ( R n ) 0 v ( R n ) 0 [ x i ] + = max { 0 , x i } u i = ( x i ) + v i = ( x i ) + ,其中 i = 1 , 2 , , n ,考虑到,x的 l 1 -范数表示为 x 1 = e n T u + e n T v ,其中 e n 表示一个所有元素都为1的n维向量用,因此问题(2)等价于:

min u , v 1 2 A ( u v ) b 2 + τ e n T u + τ e n T v , s .t . u 0 , v 0 , u T v = 0. (3)

通过惩罚法,(3)式等价于:

min u , v 1 2 A ( u v ) b 2 + τ e n T u + τ e n T v , s .t . u 0 , v 0 , u T v = 0. (4)

其中 δ 是一个惩罚系数,我们将上式展开计算后,问题(4)可以等价表述为:

min z 0 1 2 z T ( H + D ) z + c T z . (5)

其中,

z = [ u v ] , y = A T b , c = τ e 2 n + [ y y ] , H = [ A T A A T A A T A A T A ] , D = [ 0 δ E n 0 0 ] .

根据 [18] 中的证明可知 H , D 皆为半正定的矩阵,因此(5)是一个凸二次规划问题。

下面我们考虑使用ADMM方法来求解问题(5),令 X Y Z 为三个有限维实欧氏空间,每个实欧氏空间都有内积 , 及其范数 ,令 f : Y ( , + ] , g : Z ( , + ] 是两个闭的凸函数,对于如下可分的凸优化问题 [20] [21]:

min y Y , z Z { f ( y ) + g ( z ) s .t . A * y + B * z = c } , (6)

其中 c X 是给定的数,线性映射 A * B * 为伴随算子,任意 ( x , y , z ) X × Y × Z ,令 σ > 0 是给定的罚参数,得到问题(6)的增广拉格朗日函数为 [22]:

L σ ( y , z ; x ) : = f ( y ) + g ( z ) + x , A * y + B * z c + σ 2 A * y + B * z c 2 , (7)

选取初始点 ( x 0 , y 0 , z 0 ) X × dom f × dom g , τ ( 0 , + ) ,Glowinski,Marrocol,Gabay和Mercier的经典交替方向乘子法相应的求解步骤 [23] 如下:

{ y k + 1 = arg min y L σ ( y , z k ; x k ) , z k + 1 = arg min z L σ ( y k + 1 , z ; x k ) , x k + 1 = x k + τ σ ( A * y k + 1 + B * z k + 1 c ) . (8)

交替方向乘子法(8)的收敛性分析由Gabay,Mercier,Glowinski和Fortin以及Glowinski [23] [24] 在不同的条件下给出。

本文将(5)置于ADMM的框架中,令 M = H + D ,则原模型等价于解下面的最小化问题:

{ min f ( z ) = 1 2 z T ( H + D ) z + c T z = 1 2 M z 2 + c T z , subjectto z 0. (9)

设非负正交 R + n 是具有非负分量的点的集合:

R + n = { x R n : x i 0 , i = 1 , 2 , , n } .

R + n 的指标函数为g:

g ( x ) = 0 ,当 x R + n 时;否则, g ( x ) = +

给定一个正对角矩阵 Λ ,最小化问题(9)可以等价地写成:

{ min f ( z ) + g ( w ) , subjectto Λ ( z w ) = 0 , w R + n . (10)

记(10)的拉格朗日函数为:

L ( z , w , λ ) = f ( z ) + g ( w ) + λ T Λ ( w z ) + ρ 2 Λ ( w z ) 2 .

其中 ρ > 0 是惩罚参数。给定 z ( 0 ) , λ ( 0 ) , w ( 0 ) R n ,ADMM的第k次迭代可通过如下步骤获得 [25]:

{ z ( k + 1 ) = arg min z R n L ( z , w ( k ) , λ ( k ) ) , ( 11.1 ) w ( k + 1 ) = arg min w R + n L ( z ( k + 1 ) , w , λ ( k ) ) , ( 11.2 ) λ ( k + 1 ) = λ ( k ) + ρ Λ ( w ( k + 1 ) z ( k + 1 ) ) . ( 11.3 )

问题(11.1)的求解公式如下:

z ( k + 1 ) = ( M + ρ Λ 2 ) 1 ( Λ λ ( k ) + ρ Λ 2 w ( k ) c ) . (12)

同样,问题(11.2)的求解公式如下:

w ( k + 1 ) = ( z ( k + 1 ) Λ 1 λ ( k ) ρ ) + . (13)

这里 ( ) + 表示集合 R + n 上的投影,基于(12)和(13)式,由此我们可以给出求解问题(5)的具体算法:

由于(10)是一个目标函数是严格凸的凸规划问题,因此它有唯一的最优解。

而问题(11)等价于求 ( z * , w * , λ * ) R n × R + n × R n

( M z * + c ) Λ λ * = 0 (14)

( w w * ) T Λ λ * 0 , w R + n (15)

z * w * = 0 (16)

对于满足条件(14) (15) (16)的某些 λ * { z * , w * , λ * } ,以上算法生成的序列 { z ( k ) , w ( k ) } 收敛于 { z * , w * } ,此定理的类似证明见文献 [26]。

在算法1中,每次迭代k时,我们能得到线性方程组的精确解:

( M + Λ 2 ) z ( k + 1 ) = Λ λ ( k ) + ρ Λ 2 w ( k ) c (17)

但当问题较大且稀疏时,不容易直接求解(18)。这一困难促使我们使用更有效的迭代方法,如经典SOR方法或共轭梯度法来求解系统(18),然而,对于实际问题,当使用迭代法时,很难控制内部迭代。我们使用一步MSSOR迭代来近似求解(18),使用一种基于MSSOR的ADMM方法。

M = D + L + U ,其中矩阵D,L和U分别为矩阵M的对角矩阵、严格下三角矩阵和严格上三角矩阵,具体形式为:

M = [ A A A A ] + [ 0 0 A A 0 ] + [ 0 δ E n A A 0 0 ] = Q + L + U

我们使用以下等式来求解等式(17),其中 α ( 0 , 2 ) 为松弛参数:

{ ( Q + α L + α ρ Λ 2 ) z ( k + 1 2 ) = ( ( 1 α ) Q + α U ) x k + α p k ; ( Q + α U + α ρ Λ 2 ) z k + 1 = ( ( 1 α ) Q + α L ) z k + 1 2 + α p k . (18)

在这里 p k = Λ λ ( k ) + ρ Λ 2 w ( k ) c ,根据以下算法进行求解:

其中算法2是一种基于改进的对称SOR迭代的内/外迭代方法,有关MSSOR方法的更多信息,请参见 [27] [28],内外迭代法是数值线性代数中的一种基本策略,同样的思想也用于不精确的厄米/斜厄米分裂迭代 [29]。

对于任意 α ( 0 , 2 ) ,算法2生成的序列 ( z ( k ) , w ( k ) ) 收敛到 ( z * , w * ) 满足某些 λ * { z * , w * , λ * } 的条件(15)、(16)和(17),此定理类似的详细证明见文献 [26]。

3. 实验结果

通过具体的数值实验,我们检验了所提出的算法(由Proposed表示)的有效性,其中恢复信号的质量是通过迭代步骤的数量(由Iter表示)、以秒为单位的消耗的中央处理器时间(由CPU表示)和原始信号的平均均方误差(MSE)来衡量。这里,MSE的定义为:

MSE = 1 n z ¯ z * 2

其中 z ¯ z * 的估计值,显然平均均方误差反映了模型的稳健性。本文实验过程中所使用到的算法如表1所示:

Table 1. Abbreviations of detection methods

表1. 检测方法的缩写

3.1. 稀疏信号恢复

本文的第一个实验是通过解决噪声测试问题来检测算法效率的。其中原始信号 z ¯ 的长度为2048,随机生成64个非零元素,即它的稀疏级别是64,测量的个数为m = 512,其中包含高斯噪声(正态分布为N(0m, σ2Im)的随机向量,0m为零向量,Im是大小为m的单位矩阵),我们的任务是从噪声测试中恢复z,其中图1中,原始稀疏信号为最上方的图、噪声测量是第二个图,不同算法的恢复信号如剩余图所示。图2中显示了三个算法的数值性能,其中包含Iter,CPU,MSE。与IPBDF,MSOR和ADMM算法的实验效果相比,本文提出的算法可以用更少的迭代次数和从原始信号中恢复出相同信号所需时间。从图可以看出,在大多数情况下,当算法恢复信号的质量相同时,本文所提出的方法在数值性能方面都优于IPBDF,MSOR和ADMM方法。

3.2. 模糊图像恢复

本文的第二个实验是通过恢复模糊图像来检测算法效率的,所有的测试问题都来自网站上的测试图像集合,分别由lake (P1)、columbia (P2)、bridge (P3)、crowd (P4)命名,其中columbia的尺寸为480 × 480,其他的尺寸为512 × 512。本文提出的算法在下图中由Proposed表示,在MSOR方法中,我们设 α = 1.2 Ω = θ D ,实际计算中所用的迭代参数 θ 是通过实验中的最小化相应的迭代步骤得到的,在ADMM中,假设 Λ = I ρ = 10 6 ,在我们提出的算法中,假设 Λ = D ρ = 10 3 。容易地看出,对于lake (P1)、columbia (P2)、bridge (P3)、crowd (P4)这四幅原始图像,本文提出的算法是重建图像质量较好的选择,实验结果见图3~6。

Figure 1. From top to bottom: IPBDF, MSOR and ADMM and the original signal, measured signal and recovered signal of the proposed algorithm

图1. 从上到下:IPBDF,MSOR和ADMM以及所提出算法的原始信号、测量信号和恢复信号

Figure 2. Comparison results of MSADM, ADMM, and IPBDF, the x-axis represents the number of iterations (top) and the CPU time in seconds (bottom), and the y-axis represents the MSE value

图2. MSADM、ADMM、IPBDF的比较结果,x轴表示迭代次数(上)以及以秒为单位的CPU时间(下),y轴表示MSE值

Figure 3. Original lake image, blurred image and IPBDF, MSOR (top), ADMM, Proposed (bottom) restored image

图3. Lake原图,模糊图像和IPBDF,MSOR (顶部),ADMM,Proposed (底部)恢复后的图像

Figure 4. Columbia original image, blurred image and IPBDF, MSOR (top), ADMM, Proposed (bottom) restored image

图4. Columbia原图,模糊图像和IPBDF,MSOR (顶部),ADMM,Proposed (底部)恢复后的图像

Figure 5. Bridge original image, blurred image and IPBDF, MSOR (top), ADMM, Proposed (bottom) restored image

图5. Bridge原图,模糊图像和IPBDF,MSOR (顶部),ADMM,Proposed (底部)恢复后的图像

Figure 6. Crowd original image, blurred image and IPBDF, MSOR (top), ADMM, Proposed (bottom) restored image

图6. Crowd原图,模糊图像和IPBDF,MSOR (顶部),ADMM,Proposed (底部)恢复后的图像

4. 总结

本文将信号恢复问题放入优化问题的框架中,提出了一种基于MSSOR求解信号恢复问题的ADMM方法,与已有的结果相比,我们的贡献总结如下:

1) 本文首先将信号恢复问题重新表述为一个非线性非光滑问题,而不是直接用优化模型来描述。

2) 本文所使用的MSADM算法具有较强的鲁棒性,具有接近较优的收敛速度,特别适合于求解自适应精细网格进行离散化、高度非均匀、具有粗糙解的困难问题。

3) 通过与现有算法的数值效率相比较,本文解决了以往文献中存在的许多测试精度问题。数值结果表明,MSADM算法是一种鲁棒的稀疏信号恢复算法或模糊图像恢复算法。它既可以在更少的时间内恢复信号,也提升了图像质量,但是有关信号恢复的问题还可以做进一步的研究。

NOTES

*第一作者。

#通讯作者。

参考文献

[1] Liu, H. and Peng, J. (2018) Sparse Signal Recovery via Alternating Projection Method. Signal Processing, 143, 161-170.
https://doi.org/10.1016/j.sigpro.2017.09.003
[2] Ambat, S.K. and Hari, K.V.S. (2015) An Iterative Framework for Sparse Signal Reconstruction Algorithms. Signal Processing, 108, 351-364.
https://doi.org/10.1016/j.sigpro.2014.09.023
[3] Zhang, H., Dong, Y. and Fan, Q. (2017) Wavelet Frame Based Poisson Noiseremoval and Image Deblurring. Signal Processing, 137, 363-372.
https://doi.org/10.1016/j.sigpro.2017.01.025
[4] Chen, C., Tramel, E.W. and Fowler, J.E. (2011) Compressed-Sensing Recovery of Images and Video Using Multihypothesis Predictions. Proceedings of the 45th Asilomar Conference on Signals, Systems, and Computers, Pacific Grove, 6-9 November 2011, 1193-1198.
https://doi.org/10.1109/ACSSC.2011.6190204
[5] Zhang, J., Xiang, Q., Yin, Y., et al. (2017) Adaptive Compressed Sensing for Wireless Image Sensor Networks. Multimedia Tools and Applications, 76, 4227-4242.
https://doi.org/10.1007/s11042-016-3496-x
[6] Kumar, A. (2017) Deblurring of Motion Blurred Images Using Histogram of Oriented Gradients and Geometric Moments. Signal Processing: Image Communication, 55, 55-65.
https://doi.org/10.1016/j.image.2017.03.016
[7] D’Acunto, M., Benassi, A., Moroni, D., et al. (2016) 3D Image Reconstruction Using Radon Transform. SIViP, 10, 1-8.
https://doi.org/10.1007/s11760-014-0693-9
[8] Zhang, X.M. and Han, Q.L. (2013) Network-Based H∞ Filtering Using a Logic Jumping-Like Trigger. Automatica, 49, 1428-1435.
https://doi.org/10.1016/j.automatica.2013.01.060
[9] Bruckstein, A.M., Donoho, D.L. and Elad, M. (2009) From Sparse Solutions of Systems of Equations to Sparse Modeling of Signals and Images. SIAM Review, 51, 34-81.
https://doi.org/10.1137/060657704
[10] Donoho, D.L. (2006) Compressed Sensing. IEEE Transactions on Information Theory, 52, 1289-1306.
https://doi.org/10.1109/TIT.2006.871582
[11] Donoho, D.L. (2006) For Most Large Underdetermined Systems of Linear Equations Theminimal l1 Norm Solution Is Also the Sparsest Solution. Communications on Pure and Applied Mathematics, 59, 797-829.
https://doi.org/10.1002/cpa.20132
[12] Daubechies, I., Defrise, M. and De Mol, C. (2004) An Iterative Thresholding Algorithm for Linear Inverse Problems with a Sparsity Constraint. Communications on Pure and Applied Mathematics, 57, 1413-1457.
https://doi.org/10.1002/cpa.20042
[13] Beck, A. and Teboulle, M. (2009) A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems. SIAM Journal on Imaging Sciences, 2, 183-202.
https://doi.org/10.1137/080716542
[14] Hale, E.T., Yin, W. and Zhang, Y. (2007) A Fixed-Point Continuation Method for 1 Regularized Minimization with Applications to Compressed Sensing. CAAM TR07-07, Vol. 43, Rice University, Houston, 44.
[15] Huang, S. and Wan, Z. (2017) A New Nonmonotone Spectral Residual Method for Nonsmooth Nonlinear Equations. Journal of Computational and Applied Mathematics, 313, 82-101.
https://doi.org/10.1016/j.cam.2016.09.014
[16] Figueiredo, M.A.T., Nowak, R.D. and Wright, S.J. (2007) Gradient Projection for Sparse Reconstruction: Application to Compressed Sensing and Other Inverse Problems. IEEE Journal of Selected Topics in Signal Processing, 1, 586-597.
https://doi.org/10.1109/JSTSP.2007.910281
[17] Xiao, Y. and Zhu, H. (2013) A Conjugate Gradient Method to Solve Convex Constrained Monotone Equations with Applications in Compressive Sensing. Journal of Mathematical Analysis and Applications, 405, 310-319.
https://doi.org/10.1016/j.jmaa.2013.04.017
[18] Xiao, Y., Wang, Q. and Hu, Q. (2011) Nonsmooth Equations Based Method for l1 Norm Problems with Applications to Compressed Sensing. Nonlinear Analysis, Theory, Methods and Applications, 74, 3570-3577.
https://doi.org/10.1016/j.na.2011.02.040
[19] Wan, Z., Liu, W.Y. and Wang, C. (2016) An Improved Projection Based Derivative-Free Algorithm for Solving Nonlinear Monotone Symmetric Equations. Pacific Journal of Optimization, 12, 603-622.
[20] Ouaddah, A. and Boughaci, D. (2016) Harmony Search Algorithm for Image Reconstruction from Projections. Applied Soft Computing, 46, 924-935.
https://doi.org/10.1016/j.asoc.2016.02.031
[21] Bahaoui, Z., El Fadili, H., Zenkouar, K., et al. (2017) Exact Zernike and Pseudo-Zernike Moments Image Reconstruction Based on Circular Overlapping Blocks and Chamfer Distance. SIViP, 11, 1-8.
https://doi.org/10.1007/s11760-017-1088-5
[22] Hestenes, M.R. (1969) Multiplier and Gradient Methods. Journal of Optimization Theory and Application, 4, 303-320.
https://doi.org/10.1007/BF00927673
[23] Glowinski, R. (1984) Numerical Methods for Nonlinear Variational Problems. Springer-Verlag, New York.
https://doi.org/10.1007/978-3-662-12613-4
[24] Gabay, D. and Mercier, B. (1976) A Dual Algorithm for the Solution of Nonlinear Variational Problems via Finite Element Approximations. Computers & Mathematics with Applications, 2, 17-40.
https://doi.org/10.1016/0898-1221(76)90003-1
[25] Hestenes, M.R. (1969) Multiplier and Gradient Methods. Journal of Optimization Theory and Applications, 4, 303-320.
https://doi.org/10.1007/BF00927673
[26] Zhang, J.-J. (2015) MSSOR-Based Alternating Direction Method for Symmetric Positive-Definite Linear Complementarity Problems. Numerical Algorithms, 68, 631-644.
https://doi.org/10.1007/s11075-014-9864-6
[27] Bai, Z.-Z. (1999) A Class of Modified Block SSOR Preconditioners for Symmetric Positive Definite Systems of Linear Equations. Advances in Computational Mathematics, 10, 169-186.
[28] Bai, Z.-Z. (2001) Modified Block SSOR Preconditioners for Symmetric Positive Definite Linear Systems. Annals of Operations Research, 103, 263-282.
[29] Murty, K.G. (1997) Linear Complementarity, Linear and Nonlinear Programming.
[30] Wan, Z., Guo, J., Liu, J., et al. (2018) A Modified Spectral Conjugate Gradient Projection Method for Signal Recovery. SIViP, 12, 1455-1462.
https://doi.org/10.1007/s11760-018-1300-2
[31] Bai, Z.-Z. (2010) Modulus-Based Matrix Splitting Iteration Methods for Linear Complementarity Problems. Numerical Linear Algebra with Applications, 6, 917-933.
https://doi.org/10.1002/nla.680