1. 引言
图像处理技术是现代公共事业决策的关键支撑,既是实时分析、异常识别的核心依据,也是事后追溯的重要证据。但现实场景中,恶劣天气、目标移动、镜头污染及硬件限制等易导致图像模糊,且模糊原因多样、模糊核难以预知。为此,本文提出无模糊核依赖的盲去模糊算法,无需模糊类型、强度、核尺寸等先验信息,可从单幅模糊图像中同步恢复清晰latent图像与未知模糊核,其数学模型描述为:
(1)
其中,
表示输入模糊的彩色图像,
表示原始的清晰图像,
为二维卷积运算,
表示模糊核,
为成像过程中引入的高斯噪声或椒盐噪声[1]。
近年来,遥感图像富含的复杂纹理信息为盲去模糊模型优化提供了关键支撑,基于先验约束的改进方法成为该领域的核心探索方向,这些方法通过不同维度的约束为图像复原提供了基础,为本文提出的“AFTS频域自适应增强正则化先验”的思想提供了借鉴。L0正则化先验[2]核心是通过约束图像梯度的稀疏性保留强边缘信息,以此抑制模糊导致的细节丢失,其“稀疏性约束”的核心思路被本文继承。局部二值模式先验[3]通过编码图像局部纹理特征实现模糊与清晰区域的区分,在遥感复杂背景下提升了纹理恢复质量,本文方法同样以“纹理区分”为目标,结合相位谱缩放进一步增强特征鲁棒性,更适配遥感多目标重叠场景的需求。潜在结构先验[4]利用图像几何表面积最小化的特性约束恢复图像的结构平滑性,避免去模糊过程中的结构失真,本文算法通过AFTS先验的频域特征稳定化处理,进一步强化了结构约束的可靠性。
在现有先验的改进探索中,曹等人[5]将暗通道先验与卷积模型结合,借助暗通道的稀疏性特征为遥感纹理密集区域的模糊核估计提供有效约束,本文AFTS先验的“频域稀疏性筛选”思路与此一脉相承,且针对暗通道的性能短板,通过类似的方式提升了低差异区域的细节约束能力。Mammei等[6]通过暗通道先验与双边滤波的融合,平衡了细节恢复与纹理保护,减少了平滑操作带来的纹理丢失,本文通过AFTS先验的ReLU非线性增强与特征放大,在频域直接强化高频纹理成分,实现了类似的效果,且有效提升了推理效率。Lim等人[7]针对纹理损失问题,融合梯度图像与纹理图像的L范数先验,强化对图像纹理结构的保护,本文AFTS先验整合了频域梯度与幅度特征,更全面地捕捉了遥感纹理的频域退化规律,其约束维度更贴合遥感图像的纹理分布特性,避免了单一维度约束导致的纹理失真。Song等人[8]将无参考图像质量评估特征融入去模糊模型,有效增强了模型的泛化能力,适配不同遥感模糊场景,本文方法的“由粗至精多尺度框架”与AFTS先验的自适应阈值设计,延续了这一泛化性优化思路,优化了现有方法对遥感多场景、多模糊类型的适配不足的问题。
现有遥感图像去模糊方法普遍存在若干共性局限:首先,对频域中纹理的退化规律捕捉不足,导致复杂纹理恢复精度有限;其次,对高噪声、低分辨率场景的鲁棒性较弱,传统空间域先验易受噪声干扰而失效;最后,计算效率与细节约束难以平衡,处理大尺寸图像时耗时显著,使其在多云雾、多目标重叠等复杂场景中难以拟合真实物理环境,去模糊效果欠佳。针对上述问题,本文在兼顾恢复精度与推理效率的前提下,于FFT-ReLU稀疏先验模型[1]基础上进行改进。该模型通过“FFT-ReLU-逆FFT”的频域-空间域转换操作,利用稀疏性差异实现清晰化,但其运行效率仍有提升空间。为此,本文提出一种卷积稀疏性增强新先验,旨在强化图像边缘高频信息与模糊核之间的关联特性,从而提升算法效率。同时,延续“盲反卷积 + 非盲反卷积”的两步架构,在优化去模糊质量的同时保持较低的计算复杂度,以满足监控、交通识别等实时处理场景的需求。
2. 相关工作
基于先验约束的图像盲去模糊方法主要建立在最大后验估计(MAP)框架之上,其核心是通过引入先验模型约束,在联合估计清晰图像与模糊核的过程中提升细节恢复质量与核估计精度。现有研究按其建模思路可归纳为以下三类:梯度与稀疏先验、通道与几何约束先验、结构与鲁棒优化方法。
在梯度与稀疏先验方向,研究主要通过建模图像梯度或稀疏特征来保持边缘与纹理结构。Lim等人[7]提出的L0梯度先验能有效保留强边缘,显著减轻传统平滑方法导致的细节损失。Chen等人[9]基于局部最大梯度先验的方法,通过编码局部纹理差异提升了模糊与清晰区域的区分能力。Levin等人[10]将梯度统计特性引入MAP框架,通过交替更新实现高质量联合估计。此类方法在计算效率和边缘恢复方面表现突出,但面对复杂纹理或低对比度场景时易出现过度平滑。
通道与几何约束的引入增强了模型对复杂场景的适应性。Chen等人[9]提出的非线性通道先验揭示了清晰图像在暗亮通道比上的非线性稀疏特性,提升了高噪声环境下的鲁棒性。Yan等人[11]通过极坐标通道先验,弥补了暗通道方法在低像素多样性场景中的不足,实现了对低差异区域的细节增强。Liu等人[12]提出的表面感知先验从几何角度出发,基于潜在清晰图像表面积更小的假设,在平滑性与细节恢复间取得了平衡。此类方法在复杂条件下稳定性较强,但模型复杂度高,对参数敏感。
为提高优化稳定性与噪声鲁棒性,部分研究从结构约束与鲁棒优化角度改进了传统MAP框架。Wen等人[13]提出的局部最小化先验兼顾效率与质量,通过约束局部极值实现快速收敛。Ge等人[14]将曲率约束与梯度先验结合,强化了对结构边缘的保持能力。Chen等人[15]设计了异常值检测与剔除机制,提升了算法在噪声等扰动下的稳健性。该类方法在真实场景中展现出较高的恢复质量与稳定性。
综上所述,现有方法虽各有进展,但在多场景适配性、核估计精度及噪声鲁棒性方面仍存不足。因此,本文在MAP框架下,针对上述问题,提出一种结合局部最大高频系数先验与图正则约束的盲去模糊方法,以实现对图像的高效精确复原。
3. 先验设计
在本节中,我们讨论了应用Radon傅里叶变换操作的稀疏性特性,并开发了AFTS稀疏性先验,以构建一个目标函数,从而估计潜在的清晰图像和模糊核。
3.1. 稀疏性
首先为了介绍我们的工作,我们讨论卷积对图像稀疏性的影响。在标准的去模糊模型中,模糊图像表示为清晰图像与模糊核的卷积。本质上,可以表示为:
(2)
这里,
表示像素位置,模糊核K的大小为
。I和B分别表示清晰图像和模糊图像。由于卷积的输出本质上是输入的局部加权线性组合,因此它比输入的稀疏度更低,意味着它具有更多的非零元素,因此,与相应的清晰图像相比,模糊图像中亮度非常低的像素较少,即具有更多的非零元素。
3.2. AFTS
本文引入了一种频域自适应增强正则化的先验(Adaptive Frequency-Domain Tuning for Sparse-Based Prior),特别关注于频域特征的智能增强与稳定化处理,缩写为AFTS先验。AFTS先验基于一个核心思想:对输入张量进行傅里叶变换后在频域中进行操作,比直接在空间域中操作能更有效地捕捉和增强图像的某些重要特征。AFTS定义为对图像进行以下操作的函数:
1) 对输入模糊图像的FFT (快速傅里叶变换)。
2) 计算频率幅度,只保留显著频率特征,增强重要信息的显著性,调整阈值计算模糊图像与清晰图像的L0范数,最终得到的最佳阈值为0.1。实验表明,该阈值可以有效过滤掉弱频率成分。
Figure 1. Threshold determination graph
图1. 阈值确定图
本节使用Kohler [16]等人的数据集进行阈值确定,由图1阈值小于0.1时模糊图像与清晰图像的L0范数差异均值不够明显;阈值大于0.1时差异开始恶化,阈值为0.1时为最佳差异。阈值为0.1时,稀疏性比率稳定在8:1,阈值大于0.1时,模糊图像的L0范数开始不必要地增加,阈值小于0.1时,虽然结果相似,但可能保留过多噪声。0.1提供了足够的阈值来滤除噪声,同时保留重要频率成分。
3) 对其相位谱施加一个微小的固定缩放,提升特征的鲁棒性。
4) 对保留的频率分量应用ReLU并放大1.2倍,ReLU引入非线性,增强重要频率特征的对比度,1.2倍放大进一步强化显著频率成分的贡献。
Figure 2. The average L0 norm of clear and blurred images after AFTS processing; 2. The average L1 norm of clear and blurred images after AFTS processing; 3. The difference in L0 norms between clear images and blurred images; 4. The difference in L1 norms between clear images and blurred images
图2. 清晰、模糊图像经过AFTS处理后的L0范数平均值;2. 清晰、模糊图像经过AFTS处理后的L1范数平均值;3. 清晰图像与模糊图像的L0范数差异;4. 清晰图像与模糊图像的L1范数差异
从图2可以清晰看出,在amplification = 1.2时,清晰图像与模糊图像的L0范数差异达到最大负值。L0范数衡量的是频率成分的稀疏性,差异值越负表明清晰图像相比模糊图像保留了更多有效的频率成分,同时抑制了噪声成分。说明1.2这个参数值能够最大程度地增强图像的重要频率特征,提升图像的锐度和清晰度表现;L1范数差异图,在1.2处也呈现出较好的区分效果。
虽然有些指标随amplification增大而单调变化,但关键的判别指标即清晰与模糊图像的特征差异在1.2时达到最优平衡。这个值既避免了过小的放大导致的特征提取不足,也防止了过大放大带来的噪声增强问题,在保持频率稀疏性的同时实现了最佳的图像质量提升效果。
5) 从上述结果中减去原始图像的一半,用数学公式表示,AFTS可以描述为:
(3)
我们对来自不同数据集的图像进行AFTS处理,包含Kohler [16]、Levin [17]等人提供的一个数据集,图3展示了当AFTS操作应用于模糊图像和其对应的清晰图像时L0范数和L1范数的变化情况。图中显示了经过AFTS处理后,模糊图像的稀疏性降低。
Figure 3. The variations of the L0 norm and L1 norm when the AFTS operation is applied to blurred images and their corresponding clear images
图3. AFTS操作应用于模糊图像和其对应的清晰图像时L0范数和L1范数的变化情况
通过应用这一操作,可以发现关于模糊模式的可靠信息,我们观察到,对清晰图像应用AFTS会导致比其模糊图像有更少的非零元素,因为这些非零结果表明了模糊的存在,这为我们提供一个机会。通过惩罚AFTS的非零结果来检测模糊,我们发现,清晰图像与模糊图像经过AFTS处理后,模糊图像的L0范数与L1范数始终高于其对应的清晰图像的L0范数与L1范数。利用这一特性,我们将其纳入优化模型当中,得到了一个非常高效的算法。
4. 算法理论
盲去卷积与非盲去卷积是图像复原中的两类核心问题,其根本区别在于对模糊核的认知程度。非盲去卷积假定模糊核已知,其任务是在给定模糊核k和模糊图像B的条件下恢复清晰图像I,是一个约束较良态的问题。标准的图像去模糊公式是:
(4)
而盲去卷积则更为病态,需从单幅模糊图像B中联合估计清晰图像I与未知模糊核k,因此必须依赖更强的先验约束来求得物理合理的解。本文引进了一种新先验AFTS,在未知模糊核的情况下,能够更稳定、准确地同时估计出清晰图像和模糊核,新的去模糊公式如下:
(5)
我们第一项确保给定的模糊图像与估计的潜在图像和模糊核的卷积尽可能相似。第二项对核进行正则化。第三项保留较大的梯度并丢弃较小的梯度[18] [19]。第四项为新引入的先验。
、
和
是惩罚参数。
我们分别使用坐标下降法交替求解I和k,算法可以分为盲去卷积和非盲去卷积两个部分。在盲去卷积中,使用先验知识或启发式方法,在没有准确点扩散函数(PSF)的情况下计算潜在图像和模糊核。非盲去卷积则用于去除由盲去卷积过程中可能出现的振铃伪影。
4.1. 盲去卷积
盲去卷积是在完全未知点扩散函数的前提下,仅依赖输入的模糊图像B,联合估计出潜在清晰图像I以及模糊核k。这是一个典型的病态逆问题,若没有合适的先验约束,其解通常并不唯一,也容易产生过拟合或伪影。因此,我们在优化模型中引入了改进的AFTS先验,使问题得到更为稳定和高效的求解,盲反卷积的伪代码见表1。
I的估计:目标函数中式(5)包含非线性的AFTS算子和L0范数正则项,直接优化求解比较困难。为此,我们采用半二次分裂优化策略[20]来处理非凸的L0最小化问题。具体地,引入与图像空间梯度
相对应的辅助变量
,并为AFER(I)引入辅助变量h,将原问题转化为:
(6)
其中,g与h为辅助变量,用于近似图像梯度
,简化L0的优化;
是惩罚参数,用于控制
与
的一致性;
是惩罚参数,控制梯度
的稀疏性;
与
是稀疏性参数,分别用于控制图像梯度
与AFTS(I)的稀疏性。该问题可通过交替优化每个变量求解。为了在算法中实现清晰图像估计,接下来我们将问题转换至频域,并推导出关于I、h和g的闭式解。
值得注意的是,由于AFTS(I)本身具有非线性与复数特性,直接求解困难。为此,本文借助线性算子AF对其进行近似,即在向量形式下满足
。算子F的学习通过基于Adam的梯度下降实现,并在实际实验中表现出较快的收敛性。在多个不同类型的数据集(TextOCR, LOL, LFW)上测试结果表明,该近似过程通常在100步迭代以内即可稳定收敛,并能较好地保留AFTS先验的稀疏性特征。
因此,潜在图像的优化问题可进一步转化为:
(7)
其中,
是由模糊核k构成的Toeplitz矩阵;AF是线性算子,近似AFTS操作;其余的参数与半二次分裂形式的公式相同。使用快速傅里叶变换实现高效乘积[11]。该问题具有闭式解:
(8)
对于辅助变量h和g,其更新规则可通过逐元素优化得到:
(9)
和
(10)
以上两个分解的问题都可以通过逐点最小化的方式求解,其中h和g的更新规则为:
(11)
(12)
模糊核k估计:在给定当前估计的图像I后,式(13)转化为一个最小二乘问题。根据中提出图像块先验[21]、概率估计框架[10]与L0梯度稀疏性[20]等有效方法,利用图像梯度信息估计模糊核:
(13)
其中,
是清晰图像的梯度;
是模糊图像B的梯度。该优化同样在频域中高效求解,随后对核的负值部分进行截断,并进行归一化处理,以确保其符合物理意义并避免异常响应。
Table 1. Blind deconvolution is a pseudo-code used for blurring images and kernel restoration
表1. 盲反卷积用于模糊图像与核恢复的伪代码
Algorithm 1:Pseudocode of Blind Deconvolution Algorithm for Blurry Image and Kernel Restoration |
|
Input: I,B (Image,Blurry) |
1 |
k ←initialised from coarse resolution |
2 |
scale ← computed according to k |
3 |
for r ← 0 to max_scale do |
4 |
|
B_downsample ← downsample(IB,scale) |
5 |
|
for j ← 0 to max_iter do |
6 |
|
|
I ← solution of Equation (6) |
7 |
|
|
k ← solution of Equation (5) |
8 |
|
|
k ← remove isolated noise (k) |
9 |
|
|
k ← adjust_psf_center(k) |
10 |
|
end |
11 |
|
k ← estimate_psf(k, scale) |
12 |
|
scale ← scale + 1 |
13 |
end |
14 |
return I, k |
15 |
Output: I (Latent Image (Intermediate)), k (Blurry Kernel) |
为提升解的鲁棒性与收敛性,本文采用由粗至精多尺度优化框架。粗尺度下,AFTS先验增强主频、抑制噪声,稳定捕捉模糊核整体结构;尺度细化后逐步恢复高频细节,兼顾核估计一致性与图像清晰度。AFTS函数衰减因子设为0.5、频谱增强系数设为1.2,经交叉验证泛化能力与复原稳定性良好,二者结合可避免优化陷入局部极小,显著加速收敛。
4.2. 非盲去卷积
本文非盲去卷积部分,基于Laplace先验的方法[22]在保留细小空间细节方面通常是有效的。我们首先使用先验估计一个图像I1每个通道,计算Laplacian先验估计值得到I1,形成多通道图像I1。因为基于梯度的方法在抑制振铃伪影方面已被证明能提供准确的结果,使用方程(4)中的梯度的L0范数来估计另一个潜在图像I2,与[23]中讨论的振铃抑制方法类似,本文计算I1和I2两个估计图像的差异图diff,定位振铃伪影及其他不一致区域;对diff进行双边滤波以平滑噪声、保留边缘,再从I1中减去滤波结果,平滑伪影并完成非盲去卷积,其伪代码如表2中算法2的非盲去卷积部分所示。
Table 2. Joint optimization and post-processing pseudocode based on intermediate latent images and fuzzy kernels
表2. 基于中间潜在图像与模糊核的联合优化及后处理伪代码
Algorithm 2:Pseudocode of Non-blind Deconvolution Algorithm |
1. |
Input: I (Intermediate Latent Image), K (Intermediate Blur Kernel) |
2. |
Output: I_result |
3. |
I1 ← I |
4. |
for i from 0 to num_channels - 1 do |
5. |
|
Ic ← laplacian_prior_estimation(I, i) |
6. |
|
I1 ← concatenate(I1, Ic) |
7. |
end for |
8. |
I2 ← solution_for_I_using_equation(I, K) |
9. |
diff ← I1-I2 |
10. |
filtered_diff ← bilateral_filter(diff) |
11. |
I_result ← I1 - filtered_diff |
5. 实验
本章通过盲图像去模糊实验,使用基准数据集[16] [17]定量对比结果,分析在不同分布图像上的定性表现。
5.1. 实验设置
在参数配置上,正则化参数
、
与
的取值分别设定为
、0.004和2。为探究这些参数对算法收敛性的影响,我们以核相似度,即估计模糊核与真实模糊核之间的结构相似性指数(Structural Similarity Index, SSIM)作为核心评估指标。迭代次数上限max_iter设为5,此数值是综合权衡运行效率与图像恢复精度后确定的最优折中方案。在去卷积模块的实现中,本文参照Pan等人[18]提出的非盲去模糊框架;为确保与现有非Python实现方法对比时的公平性,实验过程中未启用GPU加速。
当前主流盲去模糊方法多基于MATLAB开发,面对强光导致图像模糊加剧、算法耗时增加的问题,本文采用Python实现可有效改善:Python兼容GPU加速框架,能快速启用硬件加速应对高负载实时处理需求,且其深度学习工具链丰富,可便捷结合深度模型优化强光下模糊核估计精度,相比MATLAB在硬件加速适配、深度学习融合上的局限,为复杂场景问题解决提供了更灵活的技术路径。
5.2. 定量结果
在本节中,实验基于Kohler [16]、Levin [17]等人两个广泛使用的基准数据集展开。其中Kohler等人的数据集是用高精度机器人精确回放6自由度运动轨迹包含旋转,本质上是空间变化来生成模糊图像;Levin等人的数据集是平面场景,包含高频噪声图案,由4幅255 × 255的灰度图像构成,每张图像配备8个不同的卷积核,每个模糊核是通过非负最小二乘拟合从清晰参考图像和模糊图像中估计出来的,它们用于在相同条件下公平比较不同盲反卷积算法的性能。
我们采用峰值信噪比(PSNR)、结构相似性指数(SSIM) [24]以及误差比率等指标,对比了本文方法与当前主流盲去模糊算法的性能。结果如表3所示,在衡量复原保真度的PSNR指标上,本文方法以28.5136的数值处于第一,显著优于[9] [13] [25]等其他方法,这得益于AFTS先验对高频特征退化规律的精准捕捉;在结构一致性SSIM指标上,略低于[26],但高于[25]等对比算法,证明其在图像结构复原上的能力。即便在误差比率上未达最优,但通过“盲反卷积 + 非盲反卷积”的两步架构与伪影抑制策略,保障了最终复原质量,凸显整体框架的鲁棒性。
在关键的推理效率方面,其7.73秒的平均推理时间,处于优势。比[25]快超14倍。效率提升得益于AFTS先验的频域简化计算及半二次分裂与坐标下降的高效求解,无GPU加速下便解决了传统方法低效、深度学习方法高成本的痛点,实现“高精度 + 高效率”兼顾,为实时监控等场景部署提供关键支撑,PSNR、SSIM及推理时间对比结果显示其综合性能优异,结果见表3。
Table 3. Comparative analysis of the dataset by Levin et al.
表3. Levin等人的数据集比较分析
|
PSNR |
SSIM |
误差率 |
平均推理时间(秒) |
Pan et al. [25] |
27.5400 |
0.8626 |
1.2076 |
109.6088 |
Pan et al. [26] |
28.3800 |
0.9250 |
0.8776 |
15.0949 |
Wen et al. [13] |
26.1235 |
0.8364 |
1.4800 |
18.6100 |
Chen et al. [9] |
26.4869 |
0.8515 |
1.0123 |
65.2000 |
Radi et al. [1] |
28.3400 |
0.8870 |
1.7800 |
8.0570 |
Ours |
28.5136 |
0.8933 |
1.1408 |
7.7300 |
通过估计模糊核与真实模糊核分别恢复图像后,计算两者恢复结果的误差比率并绘制累计分布图。如图4所示,本文方法的累积误差比率曲线在误差比较小的区域上升极快,且更快趋近于1,这表明在绝大多数情况下,本文方法的误差比显著低于Pan et al. [25]、Wen et al. [13]等对比方法,误差控制能力更优。
实验结果见表4所示与[26]相比,本文方法在运行速度上实现了近两倍的提升。(1) 在255 × 255分辨率下,Pan et al. [25]需109.609秒、Chen et al. [9]需65.2秒、Pan et al. [26]需15.095秒、Wen et al. [13]需18.61秒,而本文方法需7.73秒,耗时低于其他四类算法;(2) 当分辨率提升至800 × 800,其他算法耗时大幅增加,Pan et al. [25]达1550.932秒、Chen et al. [9]达755.43秒,本文方法以45.0578秒保持最低;(3) 从分辨率适配性与效率优势稳定性来看,其他算法随图像分辨率提升,推理时间多呈指数级增长,Pan et al. [25]从255 × 255到1024 × 800分辨率,耗时增长超20倍,Chen et al. [9]增长超12倍,而本文方法耗时增长仅6.2倍,增长幅度最小。
5.3. 可视化结果
本节展示了本文方法在来自不同领域的模糊图像上的恢复效果,并与多种最新的盲图像去模糊算法进行了对比,如图5所示。结果表明,本文方法在保持结构细节与视觉清晰度方面均表现出较强的竞争力。
Figure 4. In the reasoning time comparison experiment, the error ratio was accumulated. To simultaneously demonstrate the dual advantages of this method in terms of quality and efficiency, we compared the method proposed in this paper with [25] and [26] based on three datasets with different resolutions: Levin [17], Kohler [16], and Sun [27]
图4. 误差比率累计在推理时间对比实验中,为了能同时证明本方法在质量和效率上的双重优势,我们基于低中高三种有不同分辨率的数据集Levin [17]、Kohler [16]与Sun [27],将本文方法与[25]和[26]进行比较
Table 4. The reasoning time of algorithms for images of different dimensions
表4. 不同维度图像的算法推理时间
算法 |
推断时间(秒) |
255 × 255 |
800 × 800 |
1024 × 800 |
Pan et al. [25] |
109.609 |
1550.932 |
2280.716 |
Pan et al. [26] |
15.095 |
210.981 |
269.872 |
Wen et al. [13] |
18.61 |
54.416 |
66.134 |
Chen et al. [9] |
65.2 |
755.43 |
794.186 |
Ours |
7.73 |
45.0578 |
55.72 |
Figure 5. The results of our blind image deblurring algorithm, compared with those of other state-of-the-art algorithms. From left to right: 1) Input the blurred image, followed by 2) the result of Chen et al. [9], 3) the result of Wen et al. [13], 4) the result of Pan et al. [25], 5) the result of Pan et al. [26], and 6) the result of our algorithm
图5. 我们的去模糊算法的结果,与其他先进算法相比。从左到右:1) 输入模糊图像,随后依次为2) Chen等人[9]的结果,3) Wen等人[13]的结果,4) Pan等人[25]的结果,5) Pan等人[26]的结果,以及6) 我们的算法结果
5.4. 结论
本研究聚焦盲图像去模糊问题,提出融合AFTS先验的新型复原模型——该核心创新先验基于“卷积降低图像稀疏性”特性,通过频域自适应增强(筛选显著频率特征、微缩放相位谱、非线性激活)精准刻画模糊过程中高频特征稀疏性变化,强化模糊核估计约束,解决传统先验对复杂模糊场景适配不足的问题。算法设计上,另一创新是将AFTS先验嵌入MAP框架,结合半二次分裂与交替优化策略实现清晰图像与模糊核的联合推理及高效更新;同时保留“盲反卷积 + 非盲反卷积”两步架构,前者初步估计核与图像,后者通过双边滤波抑制振铃伪影,兼顾求解稳定性与复原质量。
本文的主要贡献:首先,本文提出一种适用于监控图像的稀疏增强先验:针对“卷积操作会降低图像稀疏性”的痛点,结合图像的边缘分布规律,设计新先验因子,有效区分模糊与清晰图像的高频特征,为模糊核估计提供更强约束;其次,本文构建了一种监控图像专用盲去模糊模型,具体而言,它将新先验嵌入目标函数,采用坐标下降法交替优化清晰图像
与模糊核
,并通过半二次分裂算法处理非凸优化问题,兼顾求解稳定性与算法效率;最后,为了验证模型有效性,本文在实际数据集与公开基准数据集上进行了验证操作。验证的实验结果表明,所提方法在诸如误差比率的指标上优于FFT-ReLU稀疏先验模型提出的算法,且推理速度比主流深度学习方法快1.8~2.3倍,可满足边缘设备的部署需求。
5.5. 未来工作
未来研究将聚焦三方面:一是融合本方法快速推理特性与深度学习框架,通过神经网络学习模糊核隐式表示以适配非均匀模糊等复杂场景,优化结构兼顾效率与复原精度、鲁棒性,推动在监控图像等场景落地;二是在AFTS先验计算中,针对频域变换与线性近似引入高效数值优化策略,减少迭代开销与内存消耗;三是结合图像亮度分布、色彩统计等底层特征,拓展模型适应性与泛化能力。
基金项目
长春理工大学大学生创新创业训练计划项目(项目编号:202510186012)。
NOTES
*通讯作者。