1. 引言
1.1. 研究背景
数字图像处理在人类生活中是不可或缺的存在,日常生活中常见的有图像拼接和图像修复,常用于交互娱乐与图像艺术等;在关键科技领域中也常看见数字图像处理的使用,如医学,监控与公共治理,工业与航拍技术应用等。然而数字图像在获取或传输过程中易遇到噪声污染、遮挡破损等各种问题。为了提升数字图像的使用效率与便利性,人们越来越关注图像修复技术。图像修复技术通过分析图像上下文信息重建缺失区域,在文化遗产保护、个人情感留存、影视工业提质及医学诊断优化等各领域发挥关键作用,从而实现从物理修复到语义重建的多维度价值。
1.2. 研究现状
针对图像在拍摄、存储或传输过程中可能因噪声污染(如椒盐噪声)、物理损伤(如老照片划痕、胶片霉变)或人为遮挡(如马赛克、涂鸦)等导致图像信息丢失或损坏,本文提出基于改进Criminisi算法修复图像。Criminisi算法是一种基于样本块的图像修复方法,通过优先级驱动的迭代过程填补缺失区域,核心思想是利用图像未损坏区域的相似性信息进行局部纹理和结构重建,从而完成视觉上的图像修复效果[1]。
传统的Criminisi算法主要为[2]:
(1) 初始化:标记破损区域(Ω)与已知区域(Φ),初始化边界像素的置信度矩阵。
(2) 迭代修复:计算破损边界所有像素的优先级,选择最高优先级的点p作为当前修复中心,在已知区域搜索与Ψp (以p为中心的块)最相似的样本块Ψq (中心为q)。将Ψq的像素复制到Ψp的破损部分,更新修复区域的置信度值。
(3) 终止条件:破损区域完全填充或者达到预设迭代次数。
现有Criminisi算法存在两大瓶颈:
① 全局搜索导致时间复杂度高(O(n2));
② 固定置信度参数引发边缘误差累积。
将图像分为已知区域(source region)和待填充或移除区域(target region),填充从target region的边界开始,以边界点p为中心,设置块的大小形成像素块,然后在已知区域中根据匹配准则找到相似的块,最后选取最佳匹配的块进行填充,从而完成图像修复。
本文提出基于改进Criminisi算法,提出基于图像局部模块匹配加速策略,设计动态置信度衰减因子抑制误差传播等。旨在减少时间复杂度以及减少图像边缘误差,达到优化图像修复的作用。
2. 改进算法设计
2.1. 算法框架
本文提出的基于改进Criminisi算法,针对优先级最高的图像轮廓点,在原图已知区域寻找最佳匹配的图像块并进行填充,更新边缘轮廓,若边缘轮廓大于0,表示还未填充完毕,则更新轮廓,开启新一轮迭代,直到填充完毕(没有边缘轮廓点)。本文图像修复算法解析如下图1所示:
Figure 1. Analysis diagram of image restoration algorithm in this article
图1. 本文图像修复算法解析图
其中Φ区域为图像完好区域,Ω区域为图像破损区域,δΩ为完好区域与破损区域的边界,Ψp为以像素点p为中心的像素块,np为以像素点p为中心的像素块的法线方向,
为以像素点p为中心的像素块的等照度方向,在Criminisi算法中需要计算图像待修复像素点p的优先权,其结果为C(p)与D(p)的乘积。C(p)为置信度项。D(p)为数据项,表示图像结构信息量,其值越大,表示图像表面的结构信息越复杂,需优先修复对应的图像区域。公式如下:
(1)
(2)
2.2. 关键技术
2.2.1. 梯度预计算
在置信度项C(p)和数据项D(p)的乘积计算中,引入梯度方向权重因子,优化破损区域边界点的填充顺序,梯度幅值用于计算数据项优先级,增强边缘结构连续性。
Prewitt算子提取梯度场公式如下:
(3)
(4)
2.2.2. 动态置信度衰减
采用金字塔分层策略,先修复大块破损区域(低分辨率层),再精细化修复细节(高分辨率层),避免误匹配,引入指数衰减因子控制置信度更新:
(5)
2.2.3. 局部搜索窗口
根据破损区域复杂度调整搜索半径,并在SSD (平方误差和)基础上融合颜色直方图、梯度方向直方图(HOG)等特征,提升匹配鲁棒性,引入结构相似性(SSIM)作为辅助评价指标。
融合结构相似性(SSD)、颜色直方图和方向梯度直方图(HOG)的混合相似性度量公式为:
(6)
各权重系数满足α + β + γ = 1。其中权重α为衡量图像块间像素值的直接差异,是结构重建的基础;权重β为确保修复区域与周边在颜色统计上的一致性;权重γ为捕捉图像块的局部形状和纹理信息。根据图像的整体特征(如纹理复杂度、颜色一致性)预先选择一组较优的固定参数。本文算法选择的固定参数为(α, β, γ) = (0.5, 0.3, 0.2),对于不同的权重参数选择进行三组不同验证测试,它们在关键评估指标上的性能对比如下表1所示:
Table 1. Performance comparison of algorithm weight parameters on evaluation metrics
表1. 本文算法权重参数在评估指标上的性能对比
权重参数 |
PSNR (dB) |
时间(s) |
SSIM |
(0.6, 0.3, 0.1) |
36.3 |
67.5 |
0.856 |
(0.5, 0.3, 0.2) |
35.5 |
51.6 |
0.901 |
(0.4, 0.4, 0.2) |
33.2 |
50.3 |
0.953 |
定义搜索半径R与图像尺寸自适应公式如下,其中W、H为图像宽高,限制搜索范围至局部区域:
(7)
3. 实验结果
实验由本文算法与其他几种算法在PSNR和SSIM上的数据对比作为结果。
3.1. 评价指标
PSNR (峰值信噪比)是衡量图像或信号失真程度的经典指标,通过计算原始信号与失真信号之间的均方误差(MSE)与最大信号功率的比值来量化质量[3]。其中,MAXI为像素最大值255,MSE为均方误差。
(8)
SSIM (结构相似性指数)是一种基于人类视觉系统(HVS)特性的图像质量评估指标,通过比较两幅图像的亮度、对比度和结构信息来量化相似度[4]。其核心公式为:
(9)
其中,μx、μy为图像均值(亮度),σx、σy为标准差(对比度),σxy为协方差(结构相似性),C1、C2为稳定常数。
3.2. 实验效果
实验针对不同实物图片进行修复,以下展示为其中一组本实验算法与其他算法的实验效果修复对比图。图2中a为原图,b为破损图像,c为本文算法修复结果,d为传统Criminisi算法修复结果,e为TV模型算法修复结果,f为KSVD稀疏编码算法修复结果。
Figure 2. Comparison of damaged image restoration results
图2. 破损图像修复结果对比
传统Criminisi算法:基于样本的图像补全方法,通过优先填充具有高置信度的结构信息区域来保持图像连续性;本文算法(改进的Criminisi算法):在传统Criminisi算法基础上优化优先级计算和匹配策略,减少误差传播[5];TV模型算法:基于变分原理,通过最小化全变分正则项实现图像去噪和重建[6];KSVD稀疏编码算法:通过字典学习和稀疏表示实现信号处理,核心是交替更新字典和稀疏系数矩阵[7]。本文算法的PSNR较传统Criminisi方法提升1.9 dB,改善了结构边缘的视觉连续性(SSIM提升0.028),本文算法较TV模型算法减少29.3秒,本文算法较KSVD稀疏编码算法减少66.2秒。不同算法的性能对比如下表2所示。
Table 2. Performance comparison of different algorithms
表2. 不同算法的性能对比
方法 |
PSNR (dB) |
时间(s) |
SSIM |
传统Criminisi |
33.6 |
108.2 |
0.873 |
本文方法 |
35.5 |
51.6 |
0.901 |
TV模型 |
31.8 |
80.9 |
0.826 |
KSVD稀疏编码 |
36.2 |
117.8 |
0.913 |
4. 结论与展望
本文提出的改进Criminisi算法通过局部搜索和设计动态置信度衰减因子抑制误差等方式,解决了传统方法图像修复效率低下的问题,提升了图像修复的质量与效率。未来工作将聚焦于:融合深度学习实现语义级修复,开发移动端实时修复系统。
致 谢
在论文完成过程中,遇到了很多技术上的问题以及科研时产生的不良情绪,而身边的亲人和同事总是能给予我很多的帮助以及心理开解,我心中满是感激之情。在此,我谨向所有给予我帮助、支持与鼓励的人致以最诚挚的谢意。