1. 引言
稀疏优化作为一类重要的优化问题,通过约束或惩罚非零元素数量,在保留关键信息的同时,降低模型复杂度,其核心在于构建并求解稀疏性为导向的数学模型。凭借在处理高维数据和大规模问题中的独特优势,稀疏优化近年来在信号处理、机器学习和计算机视觉等领域受到广泛关注,具有广阔的应用前景。本研究聚焦脉冲图像去噪这一典型应用场景,提出相应的稀疏模型,通过挖掘脉冲噪声的稀疏分布特征,复原受污染图像的视觉信息与结构特征,其性能直接决定了医学影像重建、卫星遥感解析等场景的图像分析精度。
1.1. 研究背景及意义
图像去噪任务是指根据被噪声污染的图像
(以灰度图为例)恢复“原图像”
,考虑到实际应用需要,本工作聚焦于椒盐脉冲噪声(Salt-and-Pepper Impulse Noise)的去噪,这种噪声通常由传感器故障、传输错误或拍摄环境中的干扰引起,表现为图像中一定比例的随机像素被脉冲成白点(最大像素值)或黑点(最小像素值)。显然,脉冲噪声干扰了图像中随机零散的像素点,具备稀疏特性,即矩阵
具备稀疏性。因此,本工作构建如下脉冲图像去噪模型
(1)
其中,
作为数据项,用于衡量脉冲噪声的稀疏性,确保恢复图像
与被观测的图像
的数据信息吻合;
是非光滑的全变分(Total Variation, TV)正则项,通过引入优化目标特点信息,提高结果的稳定性和可靠性。与光滑的Tikhonov正则化方法相比,TV正则方法能在平滑的同时,保留丰富的图像细节和边缘,在图像恢复任务中表现更加出色。
另一方面,大量研究表明数据项函数
的选取与噪声分布密切相关。例如,由
范数作为数据项函数的模型在恢复受加性高斯噪声污染的图像时表现出色,但在处理非高斯噪声时效果有限。另有其他研究将
范数作为数据函数,提出了在处理拉普拉斯噪声图像时表现出色的优化模型[1] [2]。相比
范数,
范数作为数据项构成的优化模型在非高斯噪声去噪的应用中表现得更稳健[3]。
尽管基于凸函数构建的优化模型在图像恢复任务中具备计算效率高、算法收敛性好、理论体系完备等优势,但其统计特性在特定场景下存在显著局限性。当观测数据存在显著局部差异时,
范数等凸函数倾向于强调局部数值偏差而非整体分布特性[4] [5]。这一现象在注重稀疏性的任务中尤为显著:凸模型的理论最优解可能与稀疏目标产生矛盾,导致实际应用中噪声估计性能显著下降。为此,在面向脉冲噪声去除等任务时,亟需构建具有更强稀疏表征能力的数学模型。
伪范数(定义为
),通过直接量化变量非零值个数,为噪声的稀疏性提供了最直观的数学表征。然而,求解
伪范数构成的优化模型在大多数情况下是一个NP难问题[6],这对算法设计提出了严峻挑战。因此,如何在保持稀疏表征理论优势的同时,开发具有实际可行性的脉冲图像去噪优化方法成为了医学影像诊断、卫星遥感监测等领域的迫切需求。
1.2. 国内外研究现状分析
近年来,非凸优化问题在理论与应用研究领域呈现泛化发展趋势,许多实证研究通过构建非凸稀疏函数拟合
惩罚,在保证稀疏表征的同时,规避NP难求解困境[7]。针对脉冲图像去噪任务,Gu等人[8]将TV正则化项与非凸平滑剪截绝对偏差(Smooth Clipped Absolution Deviation, SCAD)惩罚项相结合,提出TVSCAD模型;Zhang等人[9]结合TV正则化项和非凸的对数惩罚项,提出TVlog模型;Yuan和Ghanem [10]提出了一种采用
伪范数作为数据保真函数的稀疏优化方法,用于脉冲噪声下的图像去噪和去模糊。Wang等人[11]将核范数与检测
的TV模型结合,得到的优化模型能在去除脉冲噪声的同时,保留其低秩结构。此外,还有一些其他常用的非凸函数可以作为数据项函数,包括分数型和指数型函数[12] [13]以及一些凸函数的差[14]等。这些非凸的连续函数替代
惩罚构成的优化模型均能实现目标变量的稀疏表征。
为了求解含稀疏项的非凸模型,常见的优化方法是将其重新表述为等价的带均衡约束的数学规划问题(Mathematical Programming with Equilibrium Constraints, MPEC),然后再进行求解[10] [15] [16]。这种方法通过引入均衡约束,有效地将非凸优化问题转化为更易处理的形式。Yuan和Ghanem [10]提出一种近端交替方向乘子法(Proximal Alternating Direction Method of Multipliers)以求解MPEC,相比惩罚分解方法更加高效。此外,Tao等人[17]提出凸函数差分法(Difference of Convex Functions, DC),为处理此类非凸问题提供了另一种思路。如[8] [9]中所示,SCAD和对数函数都可以分解为两个凸函数之差,DC算法通过对第二个凸分量进行线性化处理,将原非凸问题转化为可迭代求解的凸优化序列,从而构建出系统的求解方案。需特别指出的是,尽管上述方法为稀疏优化提供了可行的求解框架,但其实际应用仍受制于显著的局限性:MPEC的方法在高维空间下需要处理大量约束条件,显著地增加了计算负担;DC方法则需严格限定稀疏函数的构造形式以满足凸差分解条件。
逐步非凸化(Graduated Non-Convexity, GNC)方法将原始模型中的非凸函数部分替换为一系列函数,这些函数从凸函数开始逐步收敛到原始的非凸函数。通过求解这些替代函数对应的优化模型,GNC方法最终使得最优解列逐步逼近原始模型的最优解[18] [19]。尽管GNC方法在优化非凸能量函数方面显示了巨大的应用潜力,复杂的求解过程与低下的计算效率限制了其在应用中的推广。与GNC思想类似,凸非凸(Convex Non-Convex, CNC)策略构建并优化一个包含非凸项的凸模型[20]。CNC策略与GNC方法的区别在于CNC策略通过调整模型参数控制模型整体的“非凸度”以确保模型整体是凸的,整个求解过程更加简化。Zhang [21]根据矩阵补全、多任务学习等复杂场景,提出了截断
正则的优化模型,并开发多阶段优化方法。该方法基于凹对偶性,通过交替优化目标变量和对偶变量,实现了将非凸问题转化为一系列凸优化子问题,后续通过迭代改进凸松弛的逼近效果,逐步接近原始非凸问题的解。
1.3. 本文主要内容及创新点
本研究将绝对值函数与连续凸函数复合,构建
惩罚的替代函数,提出含稀疏数据项的脉冲图像去噪模型,在保证稀疏表征的同时,规避NP难优化困境。针对所提出的模型,本工作延续文献[21]的主要思想,开发了新的双阶段优化算法。通过分别迭代目标变量与对偶变量,该方法形成了内外循环的优化框架,其中,外循环具备容易求解的闭式解,关键的内循环则采用基于对偶的交替方向乘子法(Alternating Direction Method of Multipliers, ADMM)求解。
2. 理论基础
2.1. 脉冲图像去噪模型
本工作围绕脉冲图像去噪的稀疏优化方法展开研究,通过构建具有理论依据的稀疏约束项实现脉冲噪声稀疏特征的刻画,提出了带有稀疏数据项的正则化模型
(2)
其中,
由绝对值函数与连续的凹函数
复合得到,是用于代替
伪范数的稀疏函数。
和
分别代表恢复图像
及受损图像
中的第i个像素。
2.2. 共轭函数
本研究基于共轭函数,给出稀疏函数以及绝对值函数的等价对偶形式,前者将原始非凸优化模型等价为双变量模型,提升变量空间维度以规避局部极值陷阱;后者能避免直接求解不光滑的凸模型。
定义2.1 定义函数
,那么函数
被称为
的共轭函数。
参考文献[22],共轭函数具有如下性质:
根据上述性质,可以将给定的闭凸函数
等价为一系列关于对偶变量
的仿射函数的逐点上确界:
这也被称为Fenchel变换,以
范数
为例,其共轭函数为:
因此,有如下等价表达:
通过引入第二个变量的方法,
范数等价为凹函数(仿射函数)的最大化,实现了凹凸性的转变。实际上,Zhang在[21]中介绍了凹对偶,能够将凹函数的极值问题转化为凸函数的最小化。该方法在形式上与共轭函数存在深刻关联,但在处理非凸函数类时展现出独特的数学结构。给定一个闭的、连续的凹函数
,其凹对偶函数及等价表达如下:
其中,凹对偶
为适当的凹函数。进一步,可以得到稀疏函数
的对偶等价形式:
(3)
2.3. 稀疏函数及其对偶表达
本节根据CNC策略,选择部分参数化凹函数
与绝对值函数复合,构建一系列具有应用潜力的稀疏函数,由参数
调整函数的非凸度。这些稀疏函数以及对偶等价形式列举在表1中,函数图像如图1所示。本工作所选取的凹函数
满足如下要求:
,
是一个连续凹的标量函数。
,当且仅当
,有
。
当
时,
逐点收敛于
伪范数。
Table 1. Sparsity-inducing function
and corresponding concave dual
表1. 稀疏函数
及对应凹对偶
稀疏函数
|
函数
的凹对偶
|
|
|
|
|
|
|
|
|
|
|
注:其中
。
(a)
(b)
(c)
(d)
(e)
Figure 1. Sparsity-inducing function graph with different
图1. 不同参数
的稀疏函数图像
3. 算法
将稀疏函数的等价对偶表达(3)代入提出的去噪模型(2)中,原模型等价为:
(4)
接下来,本研究通过构建双阶段优化框架求解上述双变量模型。将模型拆分为如下两个子问题,并在第
步迭代时,依次求解:
(5)
(6)
上述两个子问题分别对应算法的两个阶段,其中目标变量
在第二个阶段中求解,为此,一般将子问题(6)称为核心子问题。注意到,子问题(5)的主要作用是为核心子问题固定外参数
,使得双阶段优化框架能够通过迭代构造凸模型序列,实现对原非凸优化问题的渐进式逼近。一般而言,当凹对偶
连续可微时,离散子问题(5)能够简单求得闭式解
若凹对偶不光滑,以表1中
为例,解析易知
因而,
基于对偶的ADMM求解核心子问题
作为非光滑的凸优化问题,核心子问题(6)的计算复杂度决定了双阶段优化框架的整体计算性能。本节将介绍一种基于对偶的ADMM优化框架,其通过避免直接求解非光滑能量函数,以提高计算效率与收敛精度。具体而言,通过引入
范数的对偶表达,将目标函数中的非光滑项重构为以下等价形式:
其中,
是与
同维度的对偶变量;
因此,核心子问题优化模型等价为:
(7)
注意到,模型(7)是经典的Lagrange对偶问题,其中目标变量
作为Lagrange乘子,进而可以等价为如下带等式约束的优化模型:
该模型属于经典的两块可分凸优化模型,接下来采用ADMM的标准算法框架进行求解。首先,给出增广Lagrange函数:
(8)
其中,
作为增广系数控制对等式约束的惩罚强度。之后,不断迭代如下步骤直至收敛,在第
步,
(9)
(10)
(11)
其中,子问题(8)和(9)是单变量凸优化问题,可以通过解析求解或梯度下降方法求解。注意到,核心子问题的求解过程并不涉及凹函数
,这意味着算法受特定稀疏函数结构的限制很小。
基于对偶的ADMM优化方法通过非光滑
范数的Fenchel变换,在规避次梯度求解不稳定的同时,保障优化过程收敛,对提升算法稳定性具有重要作用。此外,本研究所提出的双阶段算法框架以矩阵分量作为基本优化单元,这种架构设计适配计算机并行计算架构,能充分发挥多核处理器的并行计算优势,使计算效率得到数量级提升。
4. 数值实验
本研究选取截断
范数
为例构建稀疏模型,并基于提出的双阶段算法框架优化求解。进一步地,通过与经典TV
凸模型优化方法[1]、
TV-PADMM算法[10]、TVSCAD算法[8]开展对比实验,以系统验证稀疏模型的去噪性能及双阶段方法的计算效能。
本实验在图2所示的原图像上添加噪声强度30%、50%或70%的椒盐噪声。这意味着,有30%、50%或70%的像素被随机替换。此外,双阶段优化方法的停止条件如下:
内循环停止条件要求
外循环停止条件要求
其中,
、
代表容忍度,N代表图像的像素总数。为全面且直观地比较几种算法的优化效果,本工作还特别引入:均方误差(Mean Squared Error, MSE)表征像素级保真度,峰值信噪比(Peak Signal to Noise Patio, PSNR)评估噪声抑制能力,结构相似度(Structural Similarity, SSIM)量化图像结构完整性以展示算法的图像恢复质量。
Figure 2. Test images with pixel sizes of 512 × 512
图2. 实验图像,像素尺寸均为512 × 512
表2列出了不同算法的客观评价指标对比结果,每列数据指标依次为PSNR、SSIM和MSE。考虑到脉冲噪声的随机特性,所有数据通过计算10次独立实验的平均值获得,其中以红色标注同等条件下最佳指标。实验对比表明,本文提出的脉冲图像去噪方法在多数情况下相较于其他现有模型具有明显优势,且得益于稀疏函数的结构简单性,该方法具有更高的工程可实现性。
Table 2. Comparison experiment of pulse image denoising (SP noise)
表2. 脉冲图像去噪对比实验(椒盐噪声)
图像 |
噪声强度 |
双阶段方法 |
TVl1模型 |
l0TV-PADMM算法 |
TVSCAD算法 |
pepper |
30 |
37.54/0.9831/2.6E−05 |
26.96/0.9823/2.7E−05 |
34.77/0.9827/2.6E−05 |
34.15/0.9814/2.7E−05 |
50 |
34.59/0.9663/3.6E−05 |
26.78/0.9575/3.7E−05 |
34.26/0.9617/3.7E−05 |
33.27/0.9568/3.7E−05 |
70 |
24.82/0.8098/1.1E−04 |
22.66/0.7937/1.1E−04 |
25.13/0.8076/1.1E−04 |
23.74/0.7972/1.1E−04 |
pirate |
30 |
32.61/0.9591/4.6E−05 |
20.51/0.9490/4.7E−05 |
30.71/0.9564/4.6E−05 |
27.02/0.9499/4.7E−05 |
50 |
29.28/0.9119/6.7E−05 |
24.61/0.9050/6.8E−05 |
26.47/0.9139/6.8E−05 |
25.29/0.9109/6.8E−05 |
70 |
26.29/0.8293/9.5E−05 |
23.70/0.8222/9.5E−05 |
25.26/0.8290/9.5E−05 |
23.32/0.8275/9.5E−05 |
lenna |
30 |
38.53/0.9736/2.3E−05 |
32.11/0.9560/2.4E−05 |
31.41/0.9661/2.3E−05 |
31.88/0.9634/2.4E−05 |
50 |
34.99/0.9470/3.5E−05 |
28.48/0.9333/3.6E−05 |
28.37/0.9442/3.6E−05 |
27.96/0.9393/3.5E−05 |
70 |
31.46/0.9006/5.2E−05 |
22.18/0.8926/5.3E−05 |
24.68/0.9024/5.3E−05 |
24.32/0.8999/5.3E−05 |
barbara |
30 |
29.53/0.9452/6.5E−05 |
23.83/0.9267/6.6E−05 |
27.95/0.9374/6.6E−05 |
26.13/0.9311/6.6E−05 |
50 |
26.71/0.8884/9.0E−05 |
21.01/0.8843/9.0E−05 |
24.78/0.8861/9.0E−05 |
24.22/0.8875/9.1E−05 |
70 |
24.82/0.8098/1.1E−04 |
21.24/0.8026/1.1E−04 |
22.63/0.8096/1.1E−04 |
22.38/0.8057/1.1E−04 |
walkbridge |
30 |
31.24/0.9471/5.4E−05 |
23.66/0.9379/5.5E−05 |
31.27/0.9404/5.4E−05 |
30.17/0.9405/5.5E−05 |
50 |
28.00/0.8828/7.8E−05 |
23.31/0.8785/7.8E−05 |
27.10/0.8813/7.8E−05 |
26.23/0.8781/7.8E−05 |
70 |
25.21/0.7695/1.1E−04 |
20.04/0.7646/1.1E−04 |
25.58/0.7684/1.1E−04 |
23.95/0.7678/1.1E−04 |
注:指标按PSNR/SSIM/MSE排列。
图3以图像“walkbridge”为例,展示了50%椒盐噪声污染下的图像恢复效果对比,其中(a)为原始图像,(b)为噪声污染图像,(c)为本文提出的双阶段框架优化截断
稀疏模型的恢复结果,(d)~(f)分别代表TV
凸模型优化方法、
TV-PADMM算法及TVSCAD算法的优化结果。
Figure 3. 50% salt and pepper noise denoising results and details
图3. 50%椒盐噪声去噪结果及细节
此外,图4还展示了不同稀疏函数构建的去噪算法在双阶段优化框架固定1000次迭代步数时的能量函数曲线,以验证所提出算法的收敛性。
Figure 4. Energy function curves of different sparsity-inducing functions under two-stage optimization method
图4. 不同稀疏函数在双阶段优化方法下的能量函数曲线
5. 总结与展望
本研究针对脉冲噪声图像去噪的建模与求解挑战,提出含稀疏数据项的去噪模型及双阶段优化方法。相较于传统图像去噪模型,本研究所提出的模型通过复合凹函数与绝对值函数构造稀疏函数拟合
惩罚,在保持对脉冲噪声稀疏表征的同时,有效规避了NP难求解困境。特别地,基于Fenchel变换的双阶段优化框架突破了DC方法依赖构造凸差分的局限,对更平凡稀疏函数的适应性显著增强。值得指出的是,在求解核心子问题(6)时,本研究设计基于对偶的ADMM实现了非光滑子模型快速有效地求解。凭借矩阵分量级优化单元特性,不仅使双阶段算法具有更优的工程实现性,其天然的并行计算结构还可与分布式计算架构深度耦合,为大规模图像处理提供了理论保障与效率支撑。
在后续实验中,本研究以表1中的截断函数
为例,将提出的脉冲噪声优化框架与其他脉冲噪声去噪模型在五张测试图像上进行了对比实验。结果表明,多数情况下,本文方法的多数指标相较于其他现有模型具有明显优势。进一步地,我们还就表1中所有稀疏函数构建的优化模型进行了去噪实验,从能量函数的角度验证了算法的收敛性。
在将来的研究中,我们将从以下方向进一步探索稀疏模型:1) 探索更高维数据(如视频/医学影像)中脉冲噪声的联合建模与去噪方法;2) 结合深度学习技术自适应优化稀疏函数参数,进一步提升模型泛化能力。