1. 引言
在图像的拍摄、采集、传输等过程中,不可避免地会引入不必要的信号,这些信号会影响图像的质量,并且在后续图像处理中产生相应的干扰,这些干扰信号称为噪声[1]。图像去噪就是除去图像中的不必要的信号,提高图像的质量,更好地进行图像处理操作。
目前,传统的图像去噪方法[2]包括均值滤波、中值滤波、维纳滤波[3]等,这些方法在去除噪声的同时往往会引入一定的模糊,导致图像细节的损失。为了克服这一问题,研究者们提出了许多先进的图像去噪方法,包括基于稀疏表示、低秩分解[4]、图像先验知识[5] [6]等的方法。
图像去噪在图像处理中占有重要地位,许多去噪方法依赖于对噪声和图像信号的精确建模。高斯分布在建模噪声方面具有重要作用。Meng和La Torre开发了基于MoG的LRMF模型[7] (MoG-LRMF)。MoG的普遍逼近特性使得该模型能够自适应地拟合具有未知统计分布的噪声,这一思想也被应用于低秩张量分解[8]。然而,只有当高斯分量的数量达到无穷大时,MoG才能近似复杂的分布(例如拉普拉斯分布),因此在实践中是不可行的。针对这个问题,Cao等人提出了一种指数功率分布的混合(PMoEP) [9]来对未知噪声进行建模,并设计了一种惩罚方法来自适应地选择混合分量数。MoEP中的成分非常复杂,可以在一定程度上缓解MoG的不足。高斯混合模型克服了单一高斯分布无法准确描述图像等复杂数据信息的难题,2018年,Chen等人首先观察到不同波段图像的噪声分布在统计上是不同的,但具有一定的相关性,然后提出了非i.i.d. MoG (NMoG)模型[10]来描述这一现象。与高斯模型相比,非对称高斯模型强调了图像的非对称性特征,具有更强的边缘保持能力。
广义高斯混合模型能够适应多种形状的噪声分布,提供比单一高斯模型和传统高斯混合模型更精确的噪声建模。1999年,Molina等人提出了将广义高斯分布用于图像去噪的应用,通过最大后验估计(MAP)方法进行噪声建模和去除[11]。2012年,Yuan等人提出了一种基于广义高斯混合模型的图像去噪方法[12],通过期望最大化(EM)算法优化模型参数,实现了高效地去噪。接下来,还有将广义高斯混合模型与矩阵补全技术结合,提出了一种新的图像去噪方法,通过对图像矩阵的低秩补全和广义高斯建模,实现了高效的噪声去除。牛津大学采用变分推断方法结合广义高斯混合模型,提出了一种新的图像去噪方法,通过变分推断优化广义高斯模型的参数[13],有效去除了图像噪声。多伦多大学将贝叶斯推断方法与广义高斯混合模型结合,提出了一种基于贝叶斯框架的图像去噪算法。通过构建复杂的先验模型和后验推断[14],取得了高质量的去噪效果。2020年至今,出现了许多将GGMM与深度学习等前沿技术结合的方法,并取得了显著的成果。
针对上述问题,本文假设噪声服从广义高斯混合分布,建立基于广义高斯混合模型的低秩矩阵分解模型。模型的参数采用EM算法进行迭代更新,在合成数据和真实图像数据上的大量实验证明了算法的有效性。
2. 相关工作
2.1. 广义高斯混合分布
2.1.1. 广义高斯分布
广义高斯分布在统计学中是一种参数化的连续概率分布,是高斯分布的扩展形式。广义高斯分布是一种灵活的概率模型,通过调整形状参数可以改变分布曲线的形状,从而描述出多种数据特性,如从尖峰到平坦,从轻尾到重尾。
广义高斯分布的模型参数有三个,均值
,方差
和形状参数
,它的概率密度函数通常表示为:
(1)
其中,
。
2.1.2. 广义高斯混合分布
广义高斯混合模型是基于广义高斯分布的概率模型,通过将多个广义高斯分布加权组合,能够更灵活地拟合复杂数据的分布。广义高斯混合模型的分布为:
(2)
广义高斯混合模型(GGMM)相比单一广义高斯分布(GGD),拥有更强的灵活性。GGMM通过多个广义高斯分布的加权组合,能够建模多模态分布,捕捉数据中不同区域的多样化特性。相比之下,单一GGD仅适用于单峰分布,无法刻画复杂分布的局部变化和多模态特性。GGMM在数据拟合、精度提升和多样性描述方面显著优于单一GGD,是复杂分布建模中的更优选择。
2.2. 低秩矩阵分解
低秩矩阵分解[15]是一种将矩阵分解为几个较小矩阵的技术,这些较小矩阵的乘积近似原矩阵,并且具有较低的秩。低秩矩阵分解在数据分析、图像处理和机器学习等领域有广泛应用,尤其在图像去噪中表现出色。常见的低秩矩阵分解方法包括:奇异值分解[16],主成分分析[17],非负矩阵分解[18]。
给定一个矩阵
,低秩矩阵分解是将它近似表示为两个低维矩阵
、
的乘积:
(3)
其中,
是分解矩阵的秩。在低秩矩阵分解中,分解矩阵的秩r决定了所保留的特征信息量。通过选择适当的r,可以在压缩数据维度的同时尽量保持原始矩阵的主要结构特征。
3. 算法模型
3.1. 噪声建模与目标函数
首先,利用GGMM对输入矩阵的噪声元素进行建模,从而获得对数似然优化目标;然后通过假设一个高维的潜变量,在EM框架下迭代求解。
考虑噪声部分(记为
),每个元素
在低秩矩阵分解中的表达式可以写成:
(4)
用GGMM对原始数据中的未知噪声进行建模。因此,每个
服从一个GGMM分布
定义为:
(5)
则式(5)中的每个
服从GGMM分布,其均值为
,标准差为
,形状参数为
。
因此,输入矩阵
中每个元素
的概率可表示为:
(6)
然后定义输入矩阵
的可能性:
(7)
目标是最大化关于参数
,
,
,
的对数似然函数,即:
(8)
EM算法是求解对数似然函数最大化问题的有效算法。因此,在求解式(8)时,我们假设在EM框架下存在一个高维的潜变量。那么原问题可以看作是均值为0的高斯尺度混合(GSM)。定义
,
则公式(8)可以改写为:
(9)
为了最大化误差函数
,我们定义了一个变量
。变量
定义为:
(10)
M步使E步给出的关于每个参数的上界最大化,得到新的误差函数:
(11)
3.2. 算法求解
M步更新U、V:仅对未知分量U、V重写公式(11),如下所示:
(12)
这里
表示Hadamard乘积(组件式乘法),W的元素
为
(13)
3.2.1. 先验概率更新
构建惩罚PGGMM模型:
(14)
其中,
,J为数据矩阵的列数,
是一个非常小的正数,
为调优参数(
),
是第n个分量自由参数的数量。
构造Q函数:
(15)
本文通过最大化Q函数来更新
,对Q求一阶偏导数,并令导数为0,即可得到更新方程,
(16)
其中
。
3.2.2. 标准差更新
在更新参数前,先简单介绍一下稳健统计理论。稳健统计理论是一门研究统计估计在存在异常值或非正常分布数据条件下依然保持可靠性的学科。传统的统计方法,如最小二乘法(LS),虽然在处理正态分布数据时表现良好,但对异常值极其敏感,可能导致估计结果失真。稳健统计通过引入对异常值不敏感的估计方法,提高估计的稳健性和准确性。
M估计是稳健统计中的一种重要方法,其核心思想是通过选择适当的目标函数
,使得估计量对异常值的影响降到最低。具体来说,假设有一批观测值
,其中U为估计值,
为误差项。M估
计通过最小化
来估计,即U的M估计量是使得其残差的某个函数值达到最小时的值。目标
函数
的选择影响估计的稳健性。选定合适的目标函数后,求
关于U的导数并设其和为零,得到更新后的U,将新的估计值带入
对
的导数,并令其为零,即可得到新的更新公式。具体操作如下。
在迭代步骤设置误差函数
对
的导数,我们有
(17)
根据稳健统计理论,任何估计值U是由一个隐式方程定义的:
(18)
这就给出了U位置作为加权平均值的数值解:
,
(19)
其中,
是目标函数
的导数:
(20)
(21)
将其带入权重公式:
(22)
利用权重更新U,将新的估计值U带入到偏导数公式中,并求解使偏导数为零的
更新公式:
(23)
简化并解出
的表达式:
(24)
3.2.3. 形状参数更新
下一步是更新
参数。这涉及到保持其他参数不变,并使用Newton Raphson方法改进
的估计。每次迭代都要求目标函数
对参数
求一阶导数和二阶导数:
(25)
(26)
3.2.4. U,V更新
U,V是通过求解
来评估的。为了计算公式(12),本文采用ALMF算法(改
进的梯度下降算法),U和V矩阵的更新基于Adam优化器,并引入了动量项、学习率调度、梯度裁剪和Lookahead技术。
首先,计算误差矩阵和带权重的误差。误差矩阵
。带权重的误差
:
(27)
其中,W是输入的权重矩阵,X是原始数据矩阵,
是逐元素乘法。
基于误差矩阵,分别U和V进行梯度计算,并引入正则化项
和
,得到U和V的梯度计算结果:
(28)
(29)
为了避免梯度爆炸问题,梯度裁剪将梯度限制在一个阈值c之内:
(30)
(31)
接下来,通过Adam优化器更新梯度,分别计算一阶和二阶动量估计
,
以及
,
,并对动量进行偏差校正,得到修正后的
,
和,
,
。利用这些修正后的动量更新矩阵U和V,同时引入权重衰减项,使得优化过程更加稳定。
一阶和二阶动量估计为:
(32)
偏差校正结果为:
(33)
使用校正后的动量来更新U和V,同时引入权重衰减项:
(34)
其中,
是学习率,
是一个防止分母为零的小常数。
每隔k次迭代时执行Lookahead更新,通过在原始更新基础上慢更新U和V,并将慢更新结果赋值给U和V。
(35)
,
。
每次迭代后,重新计算误差:
(36)
如果误差小于设定的阈值,则停止迭代。采用ALMF方法更新U,V的过程由算法1给出,针对GGMM模型提出的算法总结在算法2中。
算法1 ALMF算法求解公式(12) |
输入:初始化U,V,
,
,
,
,c。 |
1. 通过(27)计算
; |
2. 通过(28)(29)计算
,
; |
3. 通过(32)(33)(34)更新
,
,
,
,U,V; |
4. 通过(35)更新
,
|
输出U,V。 |
算法2 模型求解算法 |
输入:数据X;算法参数:秩r和
。 |
初始化
,t = 0。 |
1:通过(16)更新
; |
2:通过(24)更新
; |
3:通过(26)更新
; |
4:通过算法1更新
、
; |
5:t = t + 1; |
输出:参数
|
4. 实验
在本节中,为了验证算法的有效性,进行了大量的合成数据实验和真实数据实验,并与MoG WLRMF、GGMM + EPLL进行对比。采用峰值信噪比(PSNR)、结构相似性(SSIM)、特征相似性(FSIM)、相对标准误差(RSE)四种评价指标来评价每种方法的性能。
4.1. 合成数据实验
为了验证算法的有效性,选择了干净图像Facade数据集进行合成数据实验。并设置了4种不同的噪声设置,分别为:
1) 加入零均值高斯噪声,方差为0.06;
2) 加入零均值高斯噪声,方差为30;
3) 加入混合噪声:[−5, 5]均匀噪声,(0, 0.2)和(0, 0.01)的高斯噪声
4) 加入混合噪声:[−35, −35]均匀噪声,(0, 20)和(0, 10)的高斯噪声
表1展示了Facade数据集上4种不同噪声情况下的指标数据,最佳结果由粗体表示。根据表中数据得出,在零均值高斯噪声情况下,本文提出的算法的各项指标均优于另外两个算法;在高斯和均匀噪声混合的情况下,只有FSIM在第三种噪声情况下MoG WLRMF算法表现更好,其他情况均本文提出的算法表现更好。
图1展示了三种去噪方法对Facade数据集的去噪效果图,从图中可以看出,MoG WLRMF对零均值噪声表现效果相对较差,GGMM + EPLL可以对噪声有效去除,相比之下,本文的方法获得的视觉效果更好。
Table 1. Comparison of denoising effects of different algorithms on Facade datasets under different noise conditions
表1. 不同算法在不同噪声情况下对Facade数据集去噪效果对比
情况 |
评价指标 |
MoG WLRMF |
GGMM + EPLL |
Ours |
1 |
PSNR |
17.91 |
19.29 |
28.48 |
SSIM |
0.4865 |
0.8020 |
0.8526 |
FSIM |
0.9891 |
0.9670 |
0.9978 |
RSE |
0.2442 |
0.2120 |
0.0737 |
2 |
PSNR |
15.29 |
18.93 |
28.42 |
SSIM |
0.1212 |
0.6090 |
0.8521 |
FSIM |
0.8824 |
0.9420 |
0.9966 |
RSE |
0.2420 |
0.2210 |
0.0768 |
3 |
PSNR |
25.65 |
5.93 |
28.49 |
SSIM |
0.8236 |
0.0090 |
0.8528 |
FSIM |
0.9961 |
0.8930 |
0.9898 |
RSE |
0.1416 |
0.9880 |
0.0742 |
4 |
PSNR |
23.69 |
5.64 |
28.45 |
SSIM |
0.7862 |
0.0040 |
0.8528 |
FSIM |
0.9268 |
0.8930 |
0.9878 |
RSE |
0.1260 |
1.0210 |
0.0736 |
Figure 1. Comparison of Facade datasets by various denoising methods in Case 4
图1. 情况1下各种去噪方法对Facade数据集的对比图
4.2. 真实数据实验
真实高光谱图像的数据实验使用HYDICE城市图像进行演示,此数据集的图像受到大气和水吸收等噪声的严重污染,图2展示了HYDICE城市影像中3个严重污染波段的恢复结果,可以看出,该算法在处理这样的真实粗噪声时仍然有很好的性能。
Figure 2. Real hyperspectral image restoration. (a) Original polluted bands; (b) Corresponding bands recovered by the proposed algorithm
图2. 真实的高光谱图像恢复。(a) 原始污染波段;(b) 本文算法恢复后的相应波段
5. 结论
本文提出了一种新的基于GGMM的图像去噪算法,通过将GGMM引入低秩矩阵分解框架,对图像中的噪声进行建模,从而能够处理不同类型和复杂度的噪声。算法的参数通过EM算法进行求解。本文算法在多种公共数据集上的实验结果表明,与现有经典去噪方法(如MoG WLRMF、GGMM + EPLL等)相比,在PSNR和SSIM指标上具有显著提升,尤其在处理尖峰噪声和重尾噪声时表现出更强的鲁棒性和细节恢复能力。同时主观视觉质量也显著优于其他方法,充分验证了本研究的先进性和实用价值。
基金项目
吉林省自然科学基金,NO. 20240101298JC;国家自然科学基金,NO. 12171054。