基于分数阶总变分和结构稀疏表示的图像去块算法

doi:10.12677/aam.2026.151039

期刊菜单

基于分数阶总变分和结构稀疏表示的图像去块算法
Image Deblocking Algorithm via Fractional-Order Total Variation and Structural Sparse Representation

DOI: 10.12677/aam.2026.151039, PDF, HTML, XML,
作者: 郑奕阳, 李喆^*：长春理工大学数学与统计学院，吉林长春
关键词: 分数阶总变分(FOTV)；图像去块；压缩图像恢复；Fractional-Order Total Variation (FOTV)； Image Deblocking； Compressed Image Restoration

摘要: 基于块离散余弦变换的编码技术，是图像与视频压缩的基石，但其固有的分块处理和量化步骤往往会引入诸如块效应、纹理退化及边缘模糊等多种失真现象，严重损害了图像的视觉质量。为解决上述问题，本文将分数阶总变分(FOTV)稀疏约束嵌入基于字典表示的图像块效应去除模型中，并通过优化分数阶阶数以自适应平衡去块强度与细节保持能力。该模型利用FOTV在刻画纹理细节方面的优势，在强力抑制块效应的同时，能更好地保持边缘结构与复杂纹理。实验结果表明，所提出方法在客观指标与主观视觉质量上均优于或达到现有多种去块算法的水平，特别是在保持边缘锐利性与纹理一致性方面展现出显著优势。

Abstract: Block Discrete Cosine Transform based coding technology serves as the cornerstone of image and video compression. However, its inherent block-based processing and quantization steps often introduce various distortions such as block artifacts, texture degradation, and edge blurring, which severely impair the visual quality of images. To address these issues, this paper introduces Fractional-Order Total Variation (FOTV) into the field of image deblocking and constructs a restoration model integrated with structural sparse priors. By optimizing the fractional order, the model adaptively balances deblocking strength and detail preservation capability. Leveraging the advantage of FOTV in characterizing texture details, the proposed model can effectively suppress block artifacts while better preserving edge structures and complex textures. Experimental results demonstrate that the proposed method outperforms or achieves comparable performance to several state-of-the-art deblocking algorithms in both objective metrics and subjective visual quality. In particular, it exhibits significant advantages in maintaining edge sharpness and texture consistency.

文章引用：郑奕阳, 李喆. 基于分数阶总变分和结构稀疏表示的图像去块算法 [J]. 应用数学进展, 2026, 15(1): 404-413. https://doi.org/10.12677/aam.2026.151039

1. 引言

在图像处理领域，针对图像的去块处理，是提升压缩图像视觉质量的关键环节之一，其目的意在消除在压缩或传输过程中所生成的结构性伪影，以此来恢复图像的自然纹理与视觉的连续性。为克服块效应所带来的图像失真，研究者们提出了多种技术路径。基于后处理的图像块效应去除方法已成为当前图像去块领域的研究主流方案。此类方法的核心思想是，在解码端对已压缩图像进行增强，从而在兼容现有编码框架的同时，可有效改善重建画面的主观质量问题。传统的后处理方法通常可进一步细分为两类：一类以图像增强为目标，通过调整局部统计特性提升视觉观感；另一类以图像复原为核心，旨在重建更加真实和连续的结构细节。

图像增强类技术主要通过直接的信号处理手段，以此来提升图像的主观质量。这类方法的核心在于，通过滤波等手段在空域或变换域进行直接操作，以达到削弱块状伪影、增强图像细节的目的。早期具有代表性的研究由Foi等[1]提出，他们利用点状自适应DCT模型对图像进行高质量去噪与去块。随后，Zhai等[2]进一步提出一种高效的去块方案，将系数正则化、形状自适应滤波与量化约束联合建模。List等[3]则从视频编码后处理角度出发，通过利用块边界活动信息实现方向性去块处理。Sendur和Selesnick [4]基于双变量小波收缩提出了高效的图像去块算法，可在低噪声放大的条件下恢复更多边缘细节。此外，Zhang等[5]提出了一个两阶段非局部去块框架，有效缓解平滑过度问题并提升纹理重建能力。尽管这类方法具有实现简单、计算复杂度低等优点，但仍存在显著不足。此类方法高度的依赖于预设滤波的规则，难以适应自然图像结构复杂的特征，容易产生纹理过度平滑和细节缺失类的现象。同时，该方法在复杂边缘和高频纹理处理中，其恢复能力存在限制，且对参数敏感，导致在不同压缩率与图像内容下的泛化性能不足。这些所存在的局限，使得图像增强方法在处理低码率的图像时，性能提升面临瓶颈。

图像复原则遵循一条不同的技术路径，该方法的核心在于构建出一个逆向的成像模型。该模型依赖于对自然图像的先验假设，估计出最可能的原始清晰图像。在这一模型框架下，衍生出了包括凸集投影、全变分正则化、低秩矩阵恢复以及各类稀疏表示模型在内的多种代表性方法。近年来，由于图像梯度场的稀疏性先验能有效地刻画物体边缘和轮廓结构，受到了研究者的持续关注。其典型研究包括Pan等[6]所提出了一种基于暗通道先验的高效盲图像去模糊方法，随后又进一步提出了一种基于强度和梯度的高效L0正则化先验[7]用于文本图像去模糊。Chen等[8]提出了一种基于局部最大梯度先验的盲去模糊方法，通过引入辅助算子以应对在特殊场景中所可能产生的极端情况。Yan等[9]则提出了一种同时利用了亮通道先验和暗通道先验的极端通道先验。然而，诸如暗通道先验、L0梯度先验等模型，虽然在复原任务中效果显著，但其复杂的优化过程常伴随着高昂的计算开销，并且其子问题往往难以高效求解，这在一定程度上限制了其应用发展。

为此，本文提出了融合图像内部和外部先验信息，并嵌入分数阶总变分正则化项的图像去块模型，以此有效区分块化图像和清晰图像。实验结果表明，所提出的模型在客观感知和视觉感知方面与当前几种先进去块算法相当的水平。

2. 准备工作

2.1. 量化噪声模型

受压缩伪影影响的图像通常可表述为以下正向退化模型

$Y = H X + e,$ (1)

其中Y表示观测到的块效应图像，X为原始清晰图像，图像的压缩过程由特定算子H描述，它表征了图像从原始状态到压缩状态的转换。令 $M^{q}$ 为8 × 8的量化矩阵，其元素由质量因子q决定。压缩过程产生量化噪声误差记为e，其方差 $σ_{s}^{2}$ 为

$σ_{s}^{2} = 1.195 {\hat{s}}^{0.6394} + 0.9693.$ (2)

其中

$\hat{s} = \frac{1}{9} \sum_{i, j = 1}^{3} M_{i, j}^{q},$ (3)

基于最大后验概率框架的图像去块模型为

$\hat{X} = \underset{X}{\arg \max} \log (p (Y | X)) + \log (p (X)),$ (4)

其中

$\log (p (Y | X)) = \frac{1}{2 σ_{s}^{2}} {‖ Y - H X ‖}_{2}^{2},$ (5)

2.2. 基于结构稀疏表示的图像去块模型

本文采用一种混合稀疏表示框架，该框架旨在协同利用图像内部的非局部自相似性(NSS)先验与外部的通用图像块先验。具体地，将图像划分为若干重叠块，再通过块匹配将其重叠组块聚类为n个非局部自相似块集合，其中 $R_{i} (\cdot)$ 表示非局部自相似块的识别算子。对每个由 $R_{i} Z$ 定义的图像块组，分别定义内部字典 $D_{i}$ 和外部字典 $U_{i}$ ，则内部字典稀疏系数 $A_{i}$ 和外部字典稀疏系数 $B_{i}$ 为求解下述模型获得

$\begin{matrix} ({{\hat{A}}_{i}}_{i = 1}^{n}, {{\hat{B}}_{i}}_{i = 1}^{n}) = \underset{A_{i}, B_{i}}{\arg \min} \frac{1}{2 ρ} \sum_{i = 1}^{n} {‖ R_{i} Z - D_{i} A_{i} ‖}_{F}^{2} + \sum_{i = 1}^{n} λ_{i} {‖ A_{i} ‖}_{1} \\ + \frac{1}{2 μ} \sum_{i = 1}^{n} {‖ U_{i} B_{i} - D_{i} A_{i} ‖}_{F}^{2} + \sum_{i = 1}^{n} τ_{i} {‖ B_{i} ‖}_{1}, \end{matrix}$ (6)

其中 ${‖ \cdot ‖}_{F}$ 是Frobenius范数， ${‖ \cdot ‖}_{1}$ 是 $L_{1}$ 范数， $μ$ 是平衡因子， ${λ_{i}}_{i = 1}^{n}$ ， ${τ_{i}}_{i = 1}^{n}$ 和 $ρ$ 都是正则化参数，则有

${B_{i}}_{i = 1}^{n} = \underset{{B_{i}}_{i = 1}^{n}}{\arg \min} \sum_{i = 1}^{n} (\frac{1}{2} {‖ R_{i} Z - U_{i} B_{i} ‖}_{F}^{2} + μ τ_{i} {‖ B_{i} ‖}_{1}) .$ (7)

${A_{i}}_{i = 1}^{n} = \underset{{A_{i}}_{i = 1}^{n}}{\arg \min} \frac{1}{2 ρ} \sum_{i = 1}^{n} {‖ R_{i} Z - D_{i} A_{i} ‖}_{F}^{2} + \sum_{i = 1}^{n} λ_{i} {‖ A_{i} ‖}_{1} + \frac{1}{2 μ} \sum_{i = 1}^{n} {‖ U_{i} B_{i} - D_{i} A_{i} ‖}_{F}^{2} .$ (8)

2.3. 分数阶总变分

本文将分数阶总变差作为图像先验引入。给定图像域 $Ω \subset ℝ^{2}$ ，先将其离散化为矩形网格 ${(x_{i}, y_{j}) : 1 \leq i \leq m, 1 \leq j \leq n}$ ，此时图像可表示为欧几里得空间 $ℝ^{m \times n}$ 中的矩阵，记为 $u_{i, j} = u (x_{i}, y_{j})$ 。对于特定阶数 $α > 0$ ， $α$ 可表示分数阶导数阶数，函数 $u : Ω \to R$ 的 $α$ 阶总变分通过引入分数阶导数对传统总变分(TV) [10]进行了扩展。特别地，基于Grunwald-Letnikov分数阶导数，本文定义离散分数阶梯度为

$\nabla^{α} u = {[D_{1}^{α} u, D_{2}^{α} u]}^{T},$ (9)

其中，沿 $x$ 轴和 $y$ 轴的分数阶导数 $D_{1}^{α} u, D_{2}^{α} u \in ℝ^{m \times n}$ 近似为

${(D_{1}^{α} u)}_{i, j} = \sum_{k = 0}^{K - 1} {(- 1)}^{k} C_{k}^{α} u_{i - k, j}, {(D_{2}^{α} u)}_{i, j} = \sum_{k = 0}^{K - 1} {(- 1)}^{k} C_{k}^{α} u_{i, j - k} .$ (10)

$K$ 用于确定每个像素处近似分数阶导数时所涉及的相邻像素个数。系数 ${C_{K}^{α}}_{k = 0}^{K - 1}$ 定义为 $C_{K}^{α} = \frac{Γ (α + 1)}{Γ (k + 1) Γ (α + 1 - k)}$ ，与Gamma函数 $Γ (x)$ 相关。据此，则 $u$ 的离散分数阶TV (全变分)可定义为

${‖ \nabla^{α} u ‖}_{1} : = \sum_{i, j} (| {(D_{1}^{α} u)}_{i, j} | + | {(D_{2}^{α} u)}_{i, j} |) .$ (11)

根据 ${(\nabla^{α})}^{*} = \bar{{(- 1)}^{α}} d i v^{α}$ 的关系，对于 $p = (p^{(1)}, p^{(2)}) \in ℝ^{m \times n} \times ℝ^{m \times n}$ ，离散分数阶散度 $d i v^{α} p \in ℝ^{m \times n}$ 由[11]给出

${(d i v^{α} p)}_{i, j} = {(- 1)}^{α} \sum_{k = 0}^{K - 1} {(- 1)}^{k} C_{k}^{α} (p_{i + k, j}^{(1)} + p_{i, j + k}^{(2)}) .$ (12)

3. 提出的算法

本文构建了一个融合分数阶总变分与结构稀疏表示的联合去块模型。该模型的核心在于，通过同时利用分数阶梯度域的稀疏性先验，与图像块组在字典下的稀疏性先验，以共同约束复原图像的解空间。本文模型具体的表述如下

$\begin{array}{l} \min_{x} \frac{1}{2 σ_{s}^{2}} {‖ Y - H X ‖}_{F}^{2} + \frac{1}{2 ρ} \sum_{i = 1}^{n} {‖ R_{i} X - D_{i} A_{i} ‖}_{F}^{2} + \sum_{i = 1}^{n} λ_{i} {‖ A_{i} ‖}_{1} + \frac{1}{2 μ} \sum_{i = 1}^{n} {‖ U_{i} B_{i} - D_{i} A_{i} ‖}_{F}^{2} \\ + \sum_{i = 1}^{n} τ_{i} {‖ B_{i} ‖}_{1} + β {‖ \nabla^{α} X ‖}_{1}, \end{array}$ (13)

其中 $\nabla^{α} X$ 表示为图像X的分数阶微分图像。

本文利用半二次分裂法对模型(13)求解，引入辅助变量 $Z$ 和 $V$ ，模型(13)可改写为：

$\begin{array}{l} \min_{x} \frac{1}{2 σ_{s}^{2}} {‖ Y - H X ‖}_{F}^{2} + \frac{1}{2 ρ} \sum_{i = 1}^{n} {‖ R_{i} Z - D_{i} A_{i} ‖}_{F}^{2} + \sum_{i = 1}^{n} λ_{i} {‖ A_{i} ‖}_{1} + \frac{1}{2 μ} \sum_{i = 1}^{n} {‖ U_{i} B_{i} - D_{i} A_{i} ‖}_{F}^{2} \\ + \sum_{i = 1}^{n} τ_{i} {‖ B_{i} ‖}_{1} + β {‖ \nabla^{α} V ‖}_{1} + \frac{1}{2 γ} {‖ Z - V ‖}_{F}^{2} + \frac{1}{2 η} {‖ X - Z ‖}_{F}^{2}, \end{array}$ (14)

其中 $γ$ 和 $η$ 是平衡因子， $α = 0.8$ 。本小节采用交替最小化法，有效地解决了所提出的去块模型。首先，采用与HSSE模型相同的方法计算 ${A_{i}}_{i = 1}^{n}$ 和 ${B_{i}}_{i = 1}^{n}$ 。接下来，当 ${A_{i}}_{i = 1}^{n}$ 和 ${B_{i}}_{i = 1}^{n}$ 时，模型(14)简化为

$\min_{x, z, u} \frac{1}{2 σ_{s}^{2}} {‖ Y - H X ‖}_{F}^{2} + \frac{1}{2 ρ} \sum_{i = 1}^{n} {‖ R_{i} Z - D_{i} A_{i} ‖}_{F}^{2} + β {‖ \nabla^{α} V ‖}_{1} + \frac{1}{2 γ} {‖ Z - V ‖}_{F}^{2} + \frac{1}{2 η} {‖ X - Z ‖}_{F}^{2},$ (15)

显然，子模型(15)可以分为以下几个子问题来解决，即

$V \leftarrow \min_{U} \frac{1}{2 γ} {‖ Z - V ‖}_{F}^{2} + β {‖ \nabla^{α} V ‖}_{1},$ (16)

$Z \leftarrow \min_{Z} \frac{1}{2 ρ} \sum_{i = 1}^{n} {‖ R_{i} Z - D_{i} A_{i} ‖}_{F}^{2} + \frac{1}{2 η} {‖ Z - X ‖}_{F}^{2} + \frac{1}{2 γ} {‖ Z - V ‖}_{F}^{2},$ (17)

$X \leftarrow \min_{X} \frac{1}{2 σ_{s}^{2}} {‖ Y - H X ‖}_{F}^{2} + \frac{1}{2 η} {‖ X - Z ‖}_{F}^{2} .$ (18)

模型(16) (17) (18)的解依次为

$V = shrink (\nabla^{α} Z - \frac{1}{2 γ β}, \frac{1}{2 γ β}),$ (19)

$Z = {(η γ \sum_{i = 1}^{n} R_{i}^{T} R_{i} + (ρ γ + ρ η) I)}^{- 1} (ρ γ X + ρ η V + η γ \sum_{i = 1}^{n} R_{i}^{T} D_{i} A_{i}) .$ (20)

$X = {(η H^{T} H + σ_{s}^{2} I)}^{- 1} (η H^{T} Y + σ_{s}^{2} Z) .$ (21)

4. 分数阶阶数选取分析

在本文提出的基于分数阶总变分(FOTV)稀疏约束的去块算法中，分数阶阶数的选择对去块效果具有重要影响。在实验中，我们选择了多个不同的“α”值(从 $α = 1.0$ 到 $α = 0.5$ )进行对比。首先，考虑PSNR和SSIM两个常见的质量指标。PSNR值越大，表示图像质量越好；SSIM值越接近1，表示图像结构和纹理的保留效果越好。我们分析了这些指标在不同“α”值下的变化趋势。

在不同的图像块大小(q值)下，随着“α”值的降低(从1.0逐步减小至0.5)，PSNR值的变化较小，基本保持在23到28之间。见表1所示，在q = 10时，当α从1.0降至0.5时，PSNR的变化在25.2777到25.2775之间几乎没有变化。此时，“α”的变化对PSNR的影响较小，表明去块效果对不同“α”值具有较强的鲁棒性。

Table 1. Variation of PSNR values of images under different α values

表1. 不同α值下图像的PSNR值变化

PSNR
		$α = 1.0$	$α = 0.9$	$α = 0.8$	$α = 0.7$	$α = 0.6$	$α = 0.5$
n = 1	101,085	21.7273	21.7266	21.7241	21.7277	21.7275	21.7268
	19,021	23.7515	23.7512	23.7523	23.7522	23.7520	23.7516
	271,035	23.8716	23.8728	23.8721	23.8725	23.8731	23.8721
	304,074	23.0719	23.0725	23.0725	23.0723	23.0726	23.0723
n = 5	101,085	23.3566	23.3564	23.3503	23.3566	23.3564	23.3564
	19,021	25.8831	25.8827	25.8868	25.8826	25.8831	25.8832
	271,035	26.3703	26.3701	26.3709	26.3708	26.3701	26.3702
	304,074	24.9012	24.9012	24.9046	24.9013	24.9014	24.9010
n = 10	101,085	25.2777	25.2776	25.2756	25.2775	25.2775	25.2776
	19,021	28.0533	28.0532	28.0546	28.0560	28.0560	28.0558
	271,035	28.9651	28.9649	28.9620	28.9648	28.9648	28.9649
	304,074	26.8820	26.8819	26.8806	26.8819	26.8815	26.8816
n = 20	101,085	27.3139	27.3138	27.3150	27.3138	27.3137	27.3138
	19,021	30.3062	30.3064	30.3052	30.3063	30.3062	30.3061
	271,035	31.4841	31.4842	31.4851	31.4832	31.4831	31.4828
	304,074	28.8967	28.8971	28.8987	28.8968	28.8969	28.8977

与PSNR不同，SSIM对于“α”值的变化更加敏感。见表2所示，在q = 1时，随着“α”的降低，SSIM值呈现逐步上升的趋势。例如，在q = 1时，α从1.0降至0.5，SSIM值从0.4565增加到0.4563，变化较为显著，而在较大块(如q = 20)时，SSIM值变化较为平稳。尤其是当 $α = 0.8$ 时，SSIM值对于图像纹理和结构的保留效果达到了最佳平衡，显示出较高的视觉质量。

Table 2. Variation of SSIM values of images under different α values

表2. 不同α值下图像的SSIM值变化

SSIM
		$α = 1.0$	$α = 0.9$	$α = 0.8$	$α = 0.7$	$α = 0.6$	$α = 0.5$
n = 1	101,085	0.4565	0.4563	0.4567	0.4566	0.4565	0.4563
	19,021	0.5974	0.5974	0.5975	0.5974	0.5974	0.5974
	271,035	0.6228	0.6229	0.6228	0.6228	0.6228	0.6228
	304,074	0.4638	0.4638	0.4641	0.4638	0.4638	0.4638
n = 5	101,085	0.5783	0.5783	0.5781	0.5783	0.5783	0.5783
	19,021	0.7016	0.7016	0.7013	0.7016	0.7016	0.7016
	271,035	0.7303	0.7303	0.7304	0.7303	0.7303	0.7303
	304,074	0.5828	0.5828	0.5826	0.5828	0.5828	0.5828
n = 10	101,085	0.6946	0.6946	0.6946	0.6946	0.6946	0.6946
	19,021	0.7885	0.7885	0.7886	0.7885	0.7885	0.7885
	271,035	0.8210	0.8210	0.8212	0.8211	0.8211	0.8211
	304,074	0.7005	0.7005	0.7005	0.7005	0.7005	0.7005
n = 20	101,085	0.7980	0.7980	0.7982	0.7980	0.7980	0.7980
	19,021	0.8656	0.8656	0.8656	0.8656	0.8656	0.8656
	271,035	0.8868	0.8868	0.8868	0.8868	0.8868	0.8868
	304,074	0.8056	0.8056	0.8056	0.8056	0.8056	0.8056

综上所述， $α = 0.8$ 表现出最佳的平衡效果，无论是在PSNR还是SSIM的表现上，都优于其他的“α”值。这一选择能够有效减少块效应，同时保持图像的细节和边缘清晰性。因此，本文建议采用 $α = 0.8$ 作为优化模型中的默认参数，确保在去块的同时，尽可能保留图像的纹理和视觉质量。

5. 实验结果

为系统性地检验本算法的综合性能，本文采取了SSR-QC、JPG-SR及HSSE三种当前先进的去块算法作为对照。客观评价方面，采用峰值信噪比(PSNR)与结构相似性指数(SSIM)作为量化度量。此外，为深入探究算法在不同压缩强度中的适应能力，实验涵盖了从极端压缩(q = 1)到轻度压缩(q = 20)的多个JPEG质量因子。

为验证算法性能，我们在广泛使用的CBSD68自然图像数据集上进行了系统测试。该数据集包含68张真实场景图像，具有良好的内容多样性，常被用于评估去噪与复原类算法[12]。表3汇总了CBSD68数据集上不同方法的平均峰值信噪比(PSNR)和结构相似性指数(SSIM)值。具体而言，在q = 1时，相较于SSR-QC、JPG-SR及HSSE算法，我们提出的算法在恢复图像的平均PSNR上分别提升了0.3330 dB、0.3258 dB、0.1194 dB。值得注意的是，在q = 20时，我们的模型在平均PSNR上比HSSE算法低0.0050 dB，并且随着质量因子的增大，我们的效果提升相比于其他模型逐渐减小，这是因为我们的算法采用的结合分数阶总变分和结构稀疏的混合先验模型，在处理高度退化的图像时表现出更强的适应性，故不能很好地处理低退化图像。

Table 3. Mean PSNR (dB)/SSIM comparison across different methods on the CBSD68 dataset

表3. 在CBSD68数据集上，不同方法的平均PSNR (dB)/SSIM比较

	SSR-QC		JPG-SR		HSSE		OURS
	PSNR	SSIM	PSNR	SSIM	PSNR	SSIM	PSNR	SSIM
q = 1	23.8502	0.5992	23.8574	0.6088	24.0638	0.6118	24.1832	0.6108
q = 5	26.1736	0.7091	26.1741	0.7160	26.3961	0.7188	26.3942	0.7205
q = 10	28.6202	0.7998	28.6521	0.8087	28.8699	0.8107	28.8709	0.8113
q = 20	30.9674	0.8710	31.0612	0.8787	31.2199	0.8801	31.2149	0.8801

本文基于CBSD68数据集挑选了4幅具有典型特征的图像，用于直观校验各算法的去块性能差异。从图1可见，所提模型对石像人物表情细节的还原精度较高，在确保边界结构不丢失的前提下，成功规避了过度平滑现象，凸显对复杂纹理场景的强适配力。在图2的花卉场景中，本算法则清晰地重建花枝、花瓣等微小结构，同时背景中由压缩引起的斑块状伪影也被更为干净地消除，整体画面显得纯净而自然。观察图3不难发现，SSR-QC、JPG-SR与HSSE三款算法在人脸核心特征还原上虽处于同一水平，但在房屋、树枝等背景区域仍残留明显块状痕迹，而所提模型能够有效保障背景纹理的自然连续性。图4中，模型在羚羊羊角及皮毛这类高频细节的重建任务中表现亮眼，不仅彻底消除了伪影干扰，更成功复原了目标的自然质感。综合上述多场景实验结果，所提模型在处理细节密度高、结构复杂度大的图像时，其恢复性能更为卓越。

(a) (b) (c) (d) (e)

Figure 1. Block removal results of different methods for image 101085 from the CBSD68 dataset at q = 1. (a) Original image; (b) HSSE (PSNR = 21.7280, SSIM = 0.4560); (c) JPG-SR (PSNR = 21.4303, SSIM = 0.4395); (d) SSR-QC (PSNR = 21.5145, SSIM = 0.4397); (e) Proposed method (PSNR = 21.7241, SSIM = 0.4567)

图1. 不同方法对图像在q = 1处的CBSD68的101085的去块结果。(a) 原始图像；(b) HSSE (PSNR = 21.7280, SSIM = 0.4560)；(c) JPG-SR (PSNR = 21.4303, SSIM = 0.4395)；(d) SSR-QC (PSNR = 21.5145, SSIM = 0.4397)；(e) 本文方法(PSNR = 21.7241, SSIM = 0.4567)

(a) (b) (c)

(d) (e)

Figure 2. Block removal results of different methods for image 19,021 from the CBSD68 dataset at q = 5. (a) Original image; (b) HSSE (PSNR = 25.8941, SSIM = 0.7014); (c) JPG-SR (PSNR = 25.5987, SSIM = 0.6956); (d) SSR-QC (PSNR = 25.6890, SSIM = 0.6897); (e) Proposed method (PSNR = 25.8868, SSIM = 0.7013)

图2. 不同方法对图像在q = 5处的CBSD68的19,021的去块结果。(a) 原始图像；(b) HSSE (PSNR = 25.8941, SSIM = 0.7014)；(c) JPG-SR (PSNR = 25.5987, SSIM = 0.6956)；(d) SSR-QC (PSNR = 25.6890, SSIM = 0.6897)；(e) 本文方法(PSNR = 25.8868, SSIM = 0.7013)

(a) (b) (c) (d) (e)

Figure 3. Block removal results of different methods for image 271,035 from the CBSD68 dataset at q = 10. (a) Original image; (b) HSSE (PSNR = 28.9441, SSIM = 0.8202); (c) JPG-SR (PSNR = 28.7089, SSIM = 0.8877); (d) SSR-QC (PSNR = 28.7343, SSIM = 0.8113); (e) Proposed method (PSNR = 28.9620, SSIM = 0.8212)

图3. 不同方法对图像在q = 10处的CBSD68的271035的去块结果。(a) 原始图像；(b) HSSE (PSNR = 28.9441, SSIM = 0.8202)；(c) JPG-SR (PSNR = 28.7089, SSIM = 0.8877)；(d) SSR-QC (PSNR = 28.7343, SSIM = 0.8113)；(e) 本文方法(PSNR = 28.9620, SSIM = 0.8212)

(a) (b) (c) (d) (e)

Figure 4. Block removal results of different methods for image 304074 from the CBSD68 dataset at q = 20. (a) Original image; (b) HSSE (PSNR = 28.9295, SSIM = 0.8064); (c) JPG-SR (PSNR = 28.7307, SSIM = 0.8020); (d) SSR-QC (PSNR = 28.5790, SSIM = 0.7821); (e) Proposed method (PSNR = 28.8987, SSIM = 0.8056)

图4. 不同方法对图像在q = 20处的CBSD68的304,074的去块结果。(a) 原始图像；(b) HSSE (PSNR = 28.9295, SSIM = 0.8064)；(c) JPG-SR (PSNR = 28.7307, SSIM = 0.8020)；(d) SSR-QC (PSNR = 28.5790, SSIM = 0.7821)；(e) 本文方法(PSNR = 28.8987, SSIM = 0.8056)

6. 结论

本研究提出了一种结合分数阶总变分与结构稀疏表示的图像去块算法。在CBSD68数据集上的实验表明，本方法在客观指标与主观视觉方面均优于或媲美现有主流去块算法。尤其在复杂纹理与强梯度结构场景中，分数阶TV能够显著减少块状伪影。综上所述，本文提出的基于分数阶总变分的去块方法，不仅具备了良好的去伪影能力，同时在细节恢复方面具有显著优势，为进一步研究基于变分模型的图像复原方法提供了有效途径。

NOTES

^*通讯作者。

参考文献

[1]	Foi, A., Katkovnik, V. and Egiazarian, K. (2007) Pointwise Shape-Adaptive DCT for High-Quality Denoising and Deblocking of Grayscale and Color Images. IEEE Transactions on Image Processing, 16, 1395-1411. [Google Scholar] [CrossRef] [PubMed]
[2]	Zhai, G., Yang, X., Zhang, W., et al. (2008) Efficient Deblocking with Coefficient Regularization, Shape-Adaptive Filtering, and Quantization Constraint. IEEE Transactions on Multimedia, 10, 735-745. [Google Scholar] [CrossRef]
[3]	List, P., Joch, A., Lainema, J., Bjontegaard, G. and Karczewicz, M. (2003) Adaptive Deblocking Filter. IEEE Transactions on Circuits and Systems for Video Technology, 13, 614-619. [Google Scholar] [CrossRef]
[4]	Donoho, D.L. (1998) Bivariate Shrinkage Functions for Wavelet-Based Denoising Exploiting Interscale Dependency. IEEE Transactions on Signal Processing, 46, 2209-2221.
[5]	Zhang, L., Dong, W., Zhang, D. and Shi, G. (2010) Two-Stage Image Denoising by Principal Component Analysis with Local Pixel Grouping. Pattern Recognition, 43, 1531-1549. [Google Scholar] [CrossRef]
[6]	Pan, J., Sun, D., Pfister, H. and Yang, M. (2016) Blind Image Deblurring Using Dark Channel Prior. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, 27-30 June 2016, 1628-1636. [Google Scholar] [CrossRef]
[7]	Pan, J., Hu, Z., Su, Z. and Yang, M. (2014) Deblurring Text Images via L0-Regularized Intensity and Gradient Prior. 2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, 23-28 June 2014, 2901-2908. [Google Scholar] [CrossRef]
[8]	Chen, L., Fang, F., Wang, T. and Zhang, G. (2019) Blind Image Deblurring with Local Maximum Gradient Prior. 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, 15-20 June 2019, 1742-1750. [Google Scholar] [CrossRef]
[9]	Yan, Y., Ren, W., Guo, Y., Wang, R. and Cao, X. (2017) Image Deblurring via Extreme Channels Prior. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, 21-26 July 2017, 6978-6986. [Google Scholar] [CrossRef]
[10]	Rudin, L.I., Osher, S. and Fatemi, E. (1992) Nonlinear Total Variation Based Noise Removal Algorithms. Physica D: Nonlinear Phenomena, 60, 259-268. [Google Scholar] [CrossRef]
[11]	Zhang, J., Wei, Z. and Xiao, L. (2011) Adaptive Fractional-Order Multi-Scale Method for Image Denoising. Journal of Mathematical Imaging and Vision, 43, 39-49. [Google Scholar] [CrossRef]
[12]	Martin, D., Fowlkes, C., Tal, D. and Malik, J. (2001) A Database of Human Segmented Natural Images and Its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics. Proceedings 8th IEEE International Conference on Computer Vision. ICCV 2001, Vol. 2, 416-423. [Google Scholar] [CrossRef]

为你推荐

友情链接