1. 引言
在图像处理领域,针对图像的去块处理,是提升压缩图像视觉质量的关键环节之一,其目的意在消除在压缩或传输过程中所生成的结构性伪影,以此来恢复图像的自然纹理与视觉的连续性。为克服块效应所带来的图像失真,研究者们提出了多种技术路径。基于后处理的图像块效应去除方法已成为当前图像去块领域的研究主流方案。此类方法的核心思想是,在解码端对已压缩图像进行增强,从而在兼容现有编码框架的同时,可有效改善重建画面的主观质量问题。传统的后处理方法通常可进一步细分为两类:一类以图像增强为目标,通过调整局部统计特性提升视觉观感;另一类以图像复原为核心,旨在重建更加真实和连续的结构细节。
图像增强类技术主要通过直接的信号处理手段,以此来提升图像的主观质量。这类方法的核心在于,通过滤波等手段在空域或变换域进行直接操作,以达到削弱块状伪影、增强图像细节的目的。早期具有代表性的研究由Foi等[1]提出,他们利用点状自适应DCT模型对图像进行高质量去噪与去块。随后,Zhai等[2]进一步提出一种高效的去块方案,将系数正则化、形状自适应滤波与量化约束联合建模。List等[3]则从视频编码后处理角度出发,通过利用块边界活动信息实现方向性去块处理。Sendur和Selesnick [4]基于双变量小波收缩提出了高效的图像去块算法,可在低噪声放大的条件下恢复更多边缘细节。此外,Zhang等[5]提出了一个两阶段非局部去块框架,有效缓解平滑过度问题并提升纹理重建能力。尽管这类方法具有实现简单、计算复杂度低等优点,但仍存在显著不足。此类方法高度的依赖于预设滤波的规则,难以适应自然图像结构复杂的特征,容易产生纹理过度平滑和细节缺失类的现象。同时,该方法在复杂边缘和高频纹理处理中,其恢复能力存在限制,且对参数敏感,导致在不同压缩率与图像内容下的泛化性能不足。这些所存在的局限,使得图像增强方法在处理低码率的图像时,性能提升面临瓶颈。
图像复原则遵循一条不同的技术路径,该方法的核心在于构建出一个逆向的成像模型。该模型依赖于对自然图像的先验假设,估计出最可能的原始清晰图像。在这一模型框架下,衍生出了包括凸集投影、全变分正则化、低秩矩阵恢复以及各类稀疏表示模型在内的多种代表性方法。近年来,由于图像梯度场的稀疏性先验能有效地刻画物体边缘和轮廓结构,受到了研究者的持续关注。其典型研究包括Pan等[6]所提出了一种基于暗通道先验的高效盲图像去模糊方法,随后又进一步提出了一种基于强度和梯度的高效L0正则化先验[7]用于文本图像去模糊。Chen等[8]提出了一种基于局部最大梯度先验的盲去模糊方法,通过引入辅助算子以应对在特殊场景中所可能产生的极端情况。Yan等[9]则提出了一种同时利用了亮通道先验和暗通道先验的极端通道先验。然而,诸如暗通道先验、L0梯度先验等模型,虽然在复原任务中效果显著,但其复杂的优化过程常伴随着高昂的计算开销,并且其子问题往往难以高效求解,这在一定程度上限制了其应用发展。
为此,本文提出了融合图像内部和外部先验信息,并嵌入分数阶总变分正则化项的图像去块模型,以此有效区分块化图像和清晰图像。实验结果表明,所提出的模型在客观感知和视觉感知方面与当前几种先进去块算法相当的水平。
2. 准备工作
2.1. 量化噪声模型
受压缩伪影影响的图像通常可表述为以下正向退化模型
(1)
其中Y表示观测到的块效应图像,X为原始清晰图像,图像的压缩过程由特定算子H描述,它表征了图像从原始状态到压缩状态的转换。令
为8 × 8的量化矩阵,其元素由质量因子q决定。压缩过程产生量化噪声误差记为e,其方差
为
(2)
其中
(3)
基于最大后验概率框架的图像去块模型为
(4)
其中
(5)
2.2. 基于结构稀疏表示的图像去块模型
本文采用一种混合稀疏表示框架,该框架旨在协同利用图像内部的非局部自相似性(NSS)先验与外部的通用图像块先验。具体地,将图像划分为若干重叠块,再通过块匹配将其重叠组块聚类为n个非局部自相似块集合,其中
表示非局部自相似块的识别算子。对每个由
定义的图像块组,分别定义内部字典
和外部字典
,则内部字典稀疏系数
和外部字典稀疏系数
为求解下述模型获得
(6)
其中
是Frobenius范数,
是
范数,
是平衡因子,
,
和
都是正则化参数,则有
(7)
(8)
2.3. 分数阶总变分
本文将分数阶总变差作为图像先验引入。给定图像域
,先将其离散化为矩形网格
,此时图像可表示为欧几里得空间
中的矩阵,记为
。对于特定阶数
,
可表示分数阶导数阶数,函数
的
阶总变分通过引入分数阶导数对传统总变分(TV) [10]进行了扩展。特别地,基于Grunwald-Letnikov分数阶导数,本文定义离散分数阶梯度为
(9)
其中,沿
轴和
轴的分数阶导数
近似为
(10)
用于确定每个像素处近似分数阶导数时所涉及的相邻像素个数。系数
定义为
,与Gamma函数
相关。据此,则
的离散分数阶TV (全变分)可定义为
(11)
根据
的关系,对于
,离散分数阶散度
由[11]给出
(12)
3. 提出的算法
本文构建了一个融合分数阶总变分与结构稀疏表示的联合去块模型。该模型的核心在于,通过同时利用分数阶梯度域的稀疏性先验,与图像块组在字典下的稀疏性先验,以共同约束复原图像的解空间。本文模型具体的表述如下
(13)
其中
表示为图像X的分数阶微分图像。
本文利用半二次分裂法对模型(13)求解,引入辅助变量
和
,模型(13)可改写为:
(14)
其中
和
是平衡因子,
。本小节采用交替最小化法,有效地解决了所提出的去块模型。首先,采用与HSSE模型相同的方法计算
和
。接下来,当
和
时,模型(14)简化为
(15)
显然,子模型(15)可以分为以下几个子问题来解决,即
(16)
(17)
(18)
模型(16) (17) (18)的解依次为
(19)
(20)
(21)
4. 分数阶阶数选取分析
在本文提出的基于分数阶总变分(FOTV)稀疏约束的去块算法中,分数阶阶数的选择对去块效果具有重要影响。在实验中,我们选择了多个不同的“α”值(从
到
)进行对比。首先,考虑PSNR和SSIM两个常见的质量指标。PSNR值越大,表示图像质量越好;SSIM值越接近1,表示图像结构和纹理的保留效果越好。我们分析了这些指标在不同“α”值下的变化趋势。
在不同的图像块大小(q值)下,随着“α”值的降低(从1.0逐步减小至0.5),PSNR值的变化较小,基本保持在23到28之间。见表1所示,在q = 10时,当α从1.0降至0.5时,PSNR的变化在25.2777到25.2775之间几乎没有变化。此时,“α”的变化对PSNR的影响较小,表明去块效果对不同“α”值具有较强的鲁棒性。
Table 1. Variation of PSNR values of images under different α values
表1. 不同α值下图像的PSNR值变化
PSNR |
|
|
|
|
|
|
|
|
n = 1 |
101,085 |
21.7273 |
21.7266 |
21.7241 |
21.7277 |
21.7275 |
21.7268 |
19,021 |
23.7515 |
23.7512 |
23.7523 |
23.7522 |
23.7520 |
23.7516 |
271,035 |
23.8716 |
23.8728 |
23.8721 |
23.8725 |
23.8731 |
23.8721 |
304,074 |
23.0719 |
23.0725 |
23.0725 |
23.0723 |
23.0726 |
23.0723 |
n = 5 |
101,085 |
23.3566 |
23.3564 |
23.3503 |
23.3566 |
23.3564 |
23.3564 |
19,021 |
25.8831 |
25.8827 |
25.8868 |
25.8826 |
25.8831 |
25.8832 |
271,035 |
26.3703 |
26.3701 |
26.3709 |
26.3708 |
26.3701 |
26.3702 |
304,074 |
24.9012 |
24.9012 |
24.9046 |
24.9013 |
24.9014 |
24.9010 |
n = 10 |
101,085 |
25.2777 |
25.2776 |
25.2756 |
25.2775 |
25.2775 |
25.2776 |
19,021 |
28.0533 |
28.0532 |
28.0546 |
28.0560 |
28.0560 |
28.0558 |
271,035 |
28.9651 |
28.9649 |
28.9620 |
28.9648 |
28.9648 |
28.9649 |
304,074 |
26.8820 |
26.8819 |
26.8806 |
26.8819 |
26.8815 |
26.8816 |
n = 20 |
101,085 |
27.3139 |
27.3138 |
27.3150 |
27.3138 |
27.3137 |
27.3138 |
19,021 |
30.3062 |
30.3064 |
30.3052 |
30.3063 |
30.3062 |
30.3061 |
271,035 |
31.4841 |
31.4842 |
31.4851 |
31.4832 |
31.4831 |
31.4828 |
304,074 |
28.8967 |
28.8971 |
28.8987 |
28.8968 |
28.8969 |
28.8977 |
与PSNR不同,SSIM对于“α”值的变化更加敏感。见表2所示,在q = 1时,随着“α”的降低,SSIM值呈现逐步上升的趋势。例如,在q = 1时,α从1.0降至0.5,SSIM值从0.4565增加到0.4563,变化较为显著,而在较大块(如q = 20)时,SSIM值变化较为平稳。尤其是当
时,SSIM值对于图像纹理和结构的保留效果达到了最佳平衡,显示出较高的视觉质量。
Table 2. Variation of SSIM values of images under different α values
表2. 不同α值下图像的SSIM值变化
SSIM |
|
|
|
|
|
|
|
|
n = 1 |
101,085 |
0.4565 |
0.4563 |
0.4567 |
0.4566 |
0.4565 |
0.4563 |
19,021 |
0.5974 |
0.5974 |
0.5975 |
0.5974 |
0.5974 |
0.5974 |
271,035 |
0.6228 |
0.6229 |
0.6228 |
0.6228 |
0.6228 |
0.6228 |
304,074 |
0.4638 |
0.4638 |
0.4641 |
0.4638 |
0.4638 |
0.4638 |
n = 5 |
101,085 |
0.5783 |
0.5783 |
0.5781 |
0.5783 |
0.5783 |
0.5783 |
19,021 |
0.7016 |
0.7016 |
0.7013 |
0.7016 |
0.7016 |
0.7016 |
271,035 |
0.7303 |
0.7303 |
0.7304 |
0.7303 |
0.7303 |
0.7303 |
304,074 |
0.5828 |
0.5828 |
0.5826 |
0.5828 |
0.5828 |
0.5828 |
n = 10 |
101,085 |
0.6946 |
0.6946 |
0.6946 |
0.6946 |
0.6946 |
0.6946 |
19,021 |
0.7885 |
0.7885 |
0.7886 |
0.7885 |
0.7885 |
0.7885 |
271,035 |
0.8210 |
0.8210 |
0.8212 |
0.8211 |
0.8211 |
0.8211 |
304,074 |
0.7005 |
0.7005 |
0.7005 |
0.7005 |
0.7005 |
0.7005 |
n = 20 |
101,085 |
0.7980 |
0.7980 |
0.7982 |
0.7980 |
0.7980 |
0.7980 |
19,021 |
0.8656 |
0.8656 |
0.8656 |
0.8656 |
0.8656 |
0.8656 |
271,035 |
0.8868 |
0.8868 |
0.8868 |
0.8868 |
0.8868 |
0.8868 |
304,074 |
0.8056 |
0.8056 |
0.8056 |
0.8056 |
0.8056 |
0.8056 |
综上所述,
表现出最佳的平衡效果,无论是在PSNR还是SSIM的表现上,都优于其他的“α”值。这一选择能够有效减少块效应,同时保持图像的细节和边缘清晰性。因此,本文建议采用
作为优化模型中的默认参数,确保在去块的同时,尽可能保留图像的纹理和视觉质量。
5. 实验结果
为系统性地检验本算法的综合性能,本文采取了SSR-QC、JPG-SR及HSSE三种当前先进的去块算法作为对照。客观评价方面,采用峰值信噪比(PSNR)与结构相似性指数(SSIM)作为量化度量。此外,为深入探究算法在不同压缩强度中的适应能力,实验涵盖了从极端压缩(q = 1)到轻度压缩(q = 20)的多个JPEG质量因子。
为验证算法性能,我们在广泛使用的CBSD68自然图像数据集上进行了系统测试。该数据集包含68张真实场景图像,具有良好的内容多样性,常被用于评估去噪与复原类算法[12]。表3汇总了CBSD68数据集上不同方法的平均峰值信噪比(PSNR)和结构相似性指数(SSIM)值。具体而言,在q = 1时,相较于SSR-QC、JPG-SR及HSSE算法,我们提出的算法在恢复图像的平均PSNR上分别提升了0.3330 dB、0.3258 dB、0.1194 dB。值得注意的是,在q = 20时,我们的模型在平均PSNR上比HSSE算法低0.0050 dB,并且随着质量因子的增大,我们的效果提升相比于其他模型逐渐减小,这是因为我们的算法采用的结合分数阶总变分和结构稀疏的混合先验模型,在处理高度退化的图像时表现出更强的适应性,故不能很好地处理低退化图像。
Table 3. Mean PSNR (dB)/SSIM comparison across different methods on the CBSD68 dataset
表3. 在CBSD68数据集上,不同方法的平均PSNR (dB)/SSIM比较
|
SSR-QC |
JPG-SR |
HSSE |
OURS |
|
PSNR |
SSIM |
PSNR |
SSIM |
PSNR |
SSIM |
PSNR |
SSIM |
q = 1 |
23.8502 |
0.5992 |
23.8574 |
0.6088 |
24.0638 |
0.6118 |
24.1832 |
0.6108 |
q = 5 |
26.1736 |
0.7091 |
26.1741 |
0.7160 |
26.3961 |
0.7188 |
26.3942 |
0.7205 |
q = 10 |
28.6202 |
0.7998 |
28.6521 |
0.8087 |
28.8699 |
0.8107 |
28.8709 |
0.8113 |
q = 20 |
30.9674 |
0.8710 |
31.0612 |
0.8787 |
31.2199 |
0.8801 |
31.2149 |
0.8801 |
本文基于CBSD68数据集挑选了4幅具有典型特征的图像,用于直观校验各算法的去块性能差异。从图1可见,所提模型对石像人物表情细节的还原精度较高,在确保边界结构不丢失的前提下,成功规避了过度平滑现象,凸显对复杂纹理场景的强适配力。在图2的花卉场景中,本算法则清晰地重建花枝、花瓣等微小结构,同时背景中由压缩引起的斑块状伪影也被更为干净地消除,整体画面显得纯净而自然。观察图3不难发现,SSR-QC、JPG-SR与HSSE三款算法在人脸核心特征还原上虽处于同一水平,但在房屋、树枝等背景区域仍残留明显块状痕迹,而所提模型能够有效保障背景纹理的自然连续性。图4中,模型在羚羊羊角及皮毛这类高频细节的重建任务中表现亮眼,不仅彻底消除了伪影干扰,更成功复原了目标的自然质感。综合上述多场景实验结果,所提模型在处理细节密度高、结构复杂度大的图像时,其恢复性能更为卓越。
(a) (b) (c) (d) (e)
Figure 1. Block removal results of different methods for image 101085 from the CBSD68 dataset at q = 1. (a) Original image; (b) HSSE (PSNR = 21.7280, SSIM = 0.4560); (c) JPG-SR (PSNR = 21.4303, SSIM = 0.4395); (d) SSR-QC (PSNR = 21.5145, SSIM = 0.4397); (e) Proposed method (PSNR = 21.7241, SSIM = 0.4567)
图1. 不同方法对图像在q = 1处的CBSD68的101085的去块结果。(a) 原始图像;(b) HSSE (PSNR = 21.7280, SSIM = 0.4560);(c) JPG-SR (PSNR = 21.4303, SSIM = 0.4395);(d) SSR-QC (PSNR = 21.5145, SSIM = 0.4397);(e) 本文方法(PSNR = 21.7241, SSIM = 0.4567)
(a) (b) (c)
(d) (e)
Figure 2. Block removal results of different methods for image 19,021 from the CBSD68 dataset at q = 5. (a) Original image; (b) HSSE (PSNR = 25.8941, SSIM = 0.7014); (c) JPG-SR (PSNR = 25.5987, SSIM = 0.6956); (d) SSR-QC (PSNR = 25.6890, SSIM = 0.6897); (e) Proposed method (PSNR = 25.8868, SSIM = 0.7013)
图2. 不同方法对图像在q = 5处的CBSD68的19,021的去块结果。(a) 原始图像;(b) HSSE (PSNR = 25.8941, SSIM = 0.7014);(c) JPG-SR (PSNR = 25.5987, SSIM = 0.6956);(d) SSR-QC (PSNR = 25.6890, SSIM = 0.6897);(e) 本文方法(PSNR = 25.8868, SSIM = 0.7013)
(a) (b) (c) (d) (e)
Figure 3. Block removal results of different methods for image 271,035 from the CBSD68 dataset at q = 10. (a) Original image; (b) HSSE (PSNR = 28.9441, SSIM = 0.8202); (c) JPG-SR (PSNR = 28.7089, SSIM = 0.8877); (d) SSR-QC (PSNR = 28.7343, SSIM = 0.8113); (e) Proposed method (PSNR = 28.9620, SSIM = 0.8212)
图3. 不同方法对图像在q = 10处的CBSD68的271035的去块结果。(a) 原始图像;(b) HSSE (PSNR = 28.9441, SSIM = 0.8202);(c) JPG-SR (PSNR = 28.7089, SSIM = 0.8877);(d) SSR-QC (PSNR = 28.7343, SSIM = 0.8113);(e) 本文方法(PSNR = 28.9620, SSIM = 0.8212)
(a) (b) (c) (d) (e)
Figure 4. Block removal results of different methods for image 304074 from the CBSD68 dataset at q = 20. (a) Original image; (b) HSSE (PSNR = 28.9295, SSIM = 0.8064); (c) JPG-SR (PSNR = 28.7307, SSIM = 0.8020); (d) SSR-QC (PSNR = 28.5790, SSIM = 0.7821); (e) Proposed method (PSNR = 28.8987, SSIM = 0.8056)
图4. 不同方法对图像在q = 20处的CBSD68的304,074的去块结果。(a) 原始图像;(b) HSSE (PSNR = 28.9295, SSIM = 0.8064);(c) JPG-SR (PSNR = 28.7307, SSIM = 0.8020);(d) SSR-QC (PSNR = 28.5790, SSIM = 0.7821);(e) 本文方法(PSNR = 28.8987, SSIM = 0.8056)
6. 结论
本研究提出了一种结合分数阶总变分与结构稀疏表示的图像去块算法。在CBSD68数据集上的实验表明,本方法在客观指标与主观视觉方面均优于或媲美现有主流去块算法。尤其在复杂纹理与强梯度结构场景中,分数阶TV能够显著减少块状伪影。综上所述,本文提出的基于分数阶总变分的去块方法,不仅具备了良好的去伪影能力,同时在细节恢复方面具有显著优势,为进一步研究基于变分模型的图像复原方法提供了有效途径。
NOTES
*通讯作者。