1. 引言
图像处理技术在我们的日常生活中已得到广泛应用,大量的图像信息的处理为我们的生活带来极大方便。在日常拍摄图像时,可能产生模糊图像的情况,模糊图像主要分为离焦模糊和运动模糊。模糊图像会导致图像质量变差,让我们在得到图像信息时会产生难度。判断图像的模糊类别后可以更便捷的对模糊图像进行恢复。
至今为止,在判断模糊图像类别方面有许多学者进行过研究,提出许多关于判断模糊图像类别的方法,例如:毛建旭等采用基于小波基函数神经网络的图像分类器 [1] ;林光忠等提出了一种基于图像奇异值分解与傅里叶变换相结合的方法 [2] ;禹晶等提出了一种基于频域零值的散焦与运动模糊模型参数求解的过程 [3] ;王冠军等提出一种结合图像二次模糊范围和奇异值分解的无参考图像质量评价方法 [4] ;李涛等提出了KDL图像分类模型,基于DSD算法进行改进,提出基于卷积神经网络的图像分类模型 [5] ;沈新宇等提出了基于直推式支持向量机的图像分类算法 [6] ;Shmik Tiwari等采用脊波变换和前馈神经网络进行模糊分类,将前馈神经网络应用于模糊图像分类中 [7]。
现有模糊图像的识别与分类技术往往具有计算繁琐、计算量大等弊端,较大的计算量会为生活中该技术的应用带来不便。本文提出一种基于支持向量机的小波分解的模糊图像分类方法。该方法能够大大减少模糊图像分类的计算量,提高模糊图像分类的速度和准确率,为后续的模糊图像复原等提供技术支持。
本文结构如下,第二部分介绍模糊图像小波变换的频谱特点;第三部分介绍本文结合支持向量机的算法;第四部分介绍识别结果;最后对全文进行总结。
2. 数字图像的小波变换与模糊图像的频域特征
2.1. 图像特征
将
空间的任意函数
在小波基下展开,小波变换式为 [8] :
式中:
为小波基共轭函数,小波变换具体步骤:
1. 把小波w(t)和原函数f(t)的开始部分进行比较,计算系数C。系数C表示该部分函数与小波的相似程度。
2. 把小波向右移k单位,得到小波w(t − k),重复1。重复该步骤直至函数f结束。
3. 扩展小波w(t),得到小波w(t/2),重复步骤1,2。
4. 不断扩展小波,重复1,2,3。
根据此方法,能够将任意一图像都分解得出水平、垂直、对角三个方向上的信息。再对图形进行傅里叶变换 [9]。如图1所示,三行分别表示离焦模糊,运动模糊和正常图像对水平、垂直、对角三个方向上的分量。

Figure 1. (a1) Defocus fuzzy image level information; (b1) Vertical information of defocused fuzzy image; (c1) Diagonal information of defocused fuzzy image; (a2) Horizontal information of moving fuzzy image; (b2) Vertical information of moving fuzzy image; (c2) Diagonal information of moving fuzzy image; (a3) Normal image level information; (b3) Vertical information of normal image; (c3) Diagonal information of normal image
图1. (a1) 离焦模糊图像水平信息;(b1) 离焦模糊图像垂直信息;(c1) 离焦模糊图像对角信息;(a2) 运动模糊图像水平信息;(b2) 运动模糊图像垂直信息;(c2) 运动模糊图像对角信息;(a3) 正常图像水平信息;(b3) 正常图像垂直信息;(c3) 正常图像对角信息
可以很明显看出,对于离焦模糊图像,图像垂直与水平频谱信息主要集中在中心区域,而对角频谱信息相对薄弱;对于运动模糊图像,三个方向的频谱信息有明显的运动趋向;而对于正常图像三个方向的频谱信息较为散乱,没有明显特点。
2.2. 模糊分类方法
根据上文所述方法,最终可以得到对一组模糊图像的分类情况。图2表示经过形态学操作后的边界框图。

Figure 2. (a1) Block diagram of horizontal connected domain of defocused fuzzy image; (b1) Block diagram of vertically connected domain of defocused fuzzy image; (c1) Block diagram of diagonally connected domain of defocused fuzzy image; (a2) Block diagram of vertically connected domain of moving fuzzy image; (b2) Block diagram of horizontally connected domain of moving fuzzy image; (c2) Diagonally connected domain diagram of moving fuzzy image; (a3) Block diagram of horizontally connected domain of normal image; (b3) Block diagram of vertically connected domain of normal image; (c3) Diagonally connected domain block diagram of normal image
图2. (a1) 离焦模糊图像水平连通域框图;(b1) 离焦模糊图像垂直连通域框图;(c1) 离焦模糊图像对角连通域框图;(a2) 运动模糊图像垂直连通域框图;(b2) 运动模糊图像水平连通域框图;(c2) 运动模糊图像对角连通域框图;(a3) 正常图像水平连通域框图;(b3) 正常图像垂直连通域框图;(c3) 正常图像对角连通域框图
在上图中,由于正常图像的频谱连通域不存在,故图中无法圈出有效的连通域,最终得到的是一幅全黑的图像。而对于离焦模糊与运动模糊图像,很明显看出离焦模糊的频谱连通域大致呈正方形,而运动模糊的频谱连通域大致呈长方形。根据三种图像连通域的特征,将每种模糊的连通域的长宽比进行神经网络训练,即可得到最佳的分类的阈值。
2.3. 支持向量机基本原理
给定含有l个训练样本的训练集样本对为
,其中
是第i个训练样本的输入列向量,
为输出值。设在高维特征空间中建立的线性回归函数为 [10] :
其中
为非线性映射函数,
返回的为函数预测值;
为对应的真实值。引入松弛变量
,并将上述求解w和b的问题转化为下述求解二次规划问题:
(3)
式中C为惩罚因子;
规定了回归函数的误差。由拉格朗日乘子法得到上式的对偶形式为:
3. 算法流程
本文区分运动模糊,离焦模糊和正常图像大致分为以下步骤,图3为本文算法流程图。
1) 采集样本图片,修改尺寸为500 × 500并输入其灰度值图像。如图3(a)所示。
2) 进行小波变换分解得到水平、垂直、对角三个方向上的图像信息,然后再分别对分解后的图像进行傅里叶变换,经过对数变换和中心处理后得到合适的傅里叶频谱图,再进行二值化处理,得到三种模糊更加明显的特征信息。
3) 对处理后的频谱图进行形态学操作,以消除部分无关信息的干扰。最后得到连通域较大的频谱特征区域。
4) 计算该连通区域的长宽比,定义
,如果有多个连通区域则进行近似拼接,计算拼接后连通区域的长宽比。若没有连通区域定义为0。如图3(b)所示。
5) 建立以支持向量机的网络训练模型。将同一张图像在三个不同方向上的长宽比
作为网络输入层,再将离焦模糊定义为1,运动模糊图像定义为2,正常图片定义为3,将这三种分类作为网络输出层,最终可以形成一个100 × 4的训练矩阵,其中前3列为网络输入,最后1列为网络输出。最后将训练样本进行网络训练。
6) 输入一系列模糊图像,得到最终的结果。如图3(c)所示。
4. 实验结果
本文实验最终将141张任意图片输入到训练完成的神经网络进行测试。如图4,为示例图像。最终得到这141张图像的模糊分类。如表1,表示最终分类结果。

Figure 4. Two random blur images and normal image
图4. 两张随机模糊图片与正常图片
本文给出的识别方法对于识别离焦模糊的正确率为93.617%,运动模糊的正确率为93.617%,正常图像的正确率为100.000%,而Bolan Sun等人所提出α通道约束方法 [11] 的识别以上两种模糊图像正确率为80.85%和85.10%,林光忠等人提出的基于奇异值分解与傅里叶变换的方法 [1] 正确率为90.91%与90.91%,并且二者都没有对正常图像进行区分。可以看出,对比于文献识别情况,本文方法的正确率非常高,且具有非常强的普适性,能够很好地运用于实际生活。
5. 结论
在本文中,结合小波分解与支持向量机提出了一种新的区分离焦模糊、运动模糊和正常图像的方法,在网络训练完成后可任意输入图片得到这种图像的模糊分类。该方法拥有识别速度快、计算简单等优点,可以广泛运用于图像复原、机器视觉、相册分类等图像处理的领域。同时,对以后解决类似问题提供了很高的参考价值。
基金项目
科学技术研究计划优秀中青年人才项目(Z2019121/Q20191203)。
NOTES
*通讯作者。