基于支持向量机的小波分解的图像模糊分类方法

doi:10.12677/JISP.2020.91009

期刊菜单

基于支持向量机的小波分解的图像模糊分类方法
An Image Fuzzy Classification Method Based on Support Vector Machine (SVM) Wavelet Decomposition

DOI: 10.12677/JISP.2020.91009, PDF, HTML, XML, 下载: 707 浏览: 1,914 科研立项经费支持
作者: 蔡明轩, 左肖雄, 刘磊, 黄伶俐, 曾曙光^*：三峡大学理学院，湖北宜昌
关键词: 模糊图像分类；支持向量机；形态学操作；小波分解；Fuzzy Image Classification； Support Vector Machines； Morphological Operations； Wavelet Decomposition

摘要: 针对模糊图像的分类问题，提出了一种基于支持向量机的小波分解的图像模糊分类方法。采集样本后，首先，对图像进行灰度处理，其次对图像进行小波分解，获取第二层的水平、垂直、对角三个方向的信息，之后对图像进行傅里叶对数变换，得出三个方向的频谱信息，随即利用合适的阈值对频谱图像进行二值化，然后对频谱中的连通域边框标记处理，计算长宽比，以长宽比作为训练标准进行网络训练。实验结果表明，该方法能够大大减少模糊图像分类的计算量，在对模糊图像进行处理和分类时有很高的准确度。

Abstract: To solve the problem of fuzzy image classification, an image fuzzy classification method based on support vector machine (SVM) wavelet decomposition was proposed. After collecting the samples, firstly, the image is processed in grayscale, and then the image is decomposed in wavelet transform to obtain the horizontal, vertical and diagonal messages of the second layer. After that, Fourier logarithm transform is performed on the image to obtain the spectral information in three directions, and then appropriate threshold is used to carry out the spectral image. Then, the connected domain border markers in the spectrum are processed, the aspect ratio is calculated, and the aspect ratio is taken as the training standard for network training. The experimental results show that this method can greatly reduce the computation of fuzzy image classification and has high accuracy in processing and classifying fuzzy images.

文章引用：蔡明轩, 左肖雄, 刘磊, 黄伶俐, 曾曙光. 基于支持向量机的小波分解的图像模糊分类方法[J]. 图像与信号处理, 2020, 9(1): 71-77. https://doi.org/10.12677/JISP.2020.91009

1. 引言

图像处理技术在我们的日常生活中已得到广泛应用，大量的图像信息的处理为我们的生活带来极大方便。在日常拍摄图像时，可能产生模糊图像的情况，模糊图像主要分为离焦模糊和运动模糊。模糊图像会导致图像质量变差，让我们在得到图像信息时会产生难度。判断图像的模糊类别后可以更便捷的对模糊图像进行恢复。

至今为止，在判断模糊图像类别方面有许多学者进行过研究，提出许多关于判断模糊图像类别的方法，例如：毛建旭等采用基于小波基函数神经网络的图像分类器 [1] ；林光忠等提出了一种基于图像奇异值分解与傅里叶变换相结合的方法 [2] ；禹晶等提出了一种基于频域零值的散焦与运动模糊模型参数求解的过程 [3] ；王冠军等提出一种结合图像二次模糊范围和奇异值分解的无参考图像质量评价方法 [4] ；李涛等提出了KDL图像分类模型，基于DSD算法进行改进，提出基于卷积神经网络的图像分类模型 [5] ；沈新宇等提出了基于直推式支持向量机的图像分类算法 [6] ；Shmik Tiwari等采用脊波变换和前馈神经网络进行模糊分类，将前馈神经网络应用于模糊图像分类中 [7]。

现有模糊图像的识别与分类技术往往具有计算繁琐、计算量大等弊端，较大的计算量会为生活中该技术的应用带来不便。本文提出一种基于支持向量机的小波分解的模糊图像分类方法。该方法能够大大减少模糊图像分类的计算量，提高模糊图像分类的速度和准确率，为后续的模糊图像复原等提供技术支持。

本文结构如下，第二部分介绍模糊图像小波变换的频谱特点；第三部分介绍本文结合支持向量机的算法；第四部分介绍识别结果；最后对全文进行总结。

2. 数字图像的小波变换与模糊图像的频域特征

2.1. 图像特征

将 $L^{2} (R)$ 空间的任意函数 $f (t)$ 在小波基下展开，小波变换式为 [8] ：

$W T_{f} (a, τ) = \frac{1}{\sqrt{a}} \int f (t) ψ (\frac{t - τ}{a}) d t$

式中： $ψ (\frac{t - τ}{a})$ 为小波基共轭函数，小波变换具体步骤：

1. 把小波w(t)和原函数f(t)的开始部分进行比较，计算系数C。系数C表示该部分函数与小波的相似程度。

2. 把小波向右移k单位，得到小波w(t − k)，重复1。重复该步骤直至函数f结束。

3. 扩展小波w(t)，得到小波w(t/2)，重复步骤1，2。

4. 不断扩展小波，重复1，2，3。

根据此方法，能够将任意一图像都分解得出水平、垂直、对角三个方向上的信息。再对图形进行傅里叶变换 [9]。如图1所示，三行分别表示离焦模糊，运动模糊和正常图像对水平、垂直、对角三个方向上的分量。

Figure 1. (a1) Defocus fuzzy image level information; (b1) Vertical information of defocused fuzzy image; (c1) Diagonal information of defocused fuzzy image; (a2) Horizontal information of moving fuzzy image; (b2) Vertical information of moving fuzzy image; (c2) Diagonal information of moving fuzzy image; (a3) Normal image level information; (b3) Vertical information of normal image; (c3) Diagonal information of normal image

图1. (a1) 离焦模糊图像水平信息；(b1) 离焦模糊图像垂直信息；(c1) 离焦模糊图像对角信息；(a2) 运动模糊图像水平信息；(b2) 运动模糊图像垂直信息；(c2) 运动模糊图像对角信息；(a3) 正常图像水平信息；(b3) 正常图像垂直信息；(c3) 正常图像对角信息

可以很明显看出，对于离焦模糊图像，图像垂直与水平频谱信息主要集中在中心区域，而对角频谱信息相对薄弱；对于运动模糊图像，三个方向的频谱信息有明显的运动趋向；而对于正常图像三个方向的频谱信息较为散乱，没有明显特点。

2.2. 模糊分类方法

根据上文所述方法，最终可以得到对一组模糊图像的分类情况。图2表示经过形态学操作后的边界框图。

Figure 2. (a1) Block diagram of horizontal connected domain of defocused fuzzy image; (b1) Block diagram of vertically connected domain of defocused fuzzy image; (c1) Block diagram of diagonally connected domain of defocused fuzzy image; (a2) Block diagram of vertically connected domain of moving fuzzy image; (b2) Block diagram of horizontally connected domain of moving fuzzy image; (c2) Diagonally connected domain diagram of moving fuzzy image; (a3) Block diagram of horizontally connected domain of normal image; (b3) Block diagram of vertically connected domain of normal image; (c3) Diagonally connected domain block diagram of normal image

图2. (a1) 离焦模糊图像水平连通域框图；(b1) 离焦模糊图像垂直连通域框图；(c1) 离焦模糊图像对角连通域框图；(a2) 运动模糊图像垂直连通域框图；(b2) 运动模糊图像水平连通域框图；(c2) 运动模糊图像对角连通域框图；(a3) 正常图像水平连通域框图；(b3) 正常图像垂直连通域框图；(c3) 正常图像对角连通域框图

在上图中，由于正常图像的频谱连通域不存在，故图中无法圈出有效的连通域，最终得到的是一幅全黑的图像。而对于离焦模糊与运动模糊图像，很明显看出离焦模糊的频谱连通域大致呈正方形，而运动模糊的频谱连通域大致呈长方形。根据三种图像连通域的特征，将每种模糊的连通域的长宽比进行神经网络训练，即可得到最佳的分类的阈值。

2.3. 支持向量机基本原理

给定含有l个训练样本的训练集样本对为 ${(x_{i}, y_{i}), i = 1, 2, \dots l}$ ，其中 $x_{i}$ 是第i个训练样本的输入列向量， $y_{i}$ 为输出值。设在高维特征空间中建立的线性回归函数为 [10] ：

$f (x) = ω ϕ (x) + b$

其中 $ϕ (x)$ 为非线性映射函数， $f (x)$ 返回的为函数预测值； $y$ 为对应的真实值。引入松弛变量 $ξ_{i}, ξ_{i}^{*}$ ，并将上述求解w和b的问题转化为下述求解二次规划问题：

$\min \frac{1}{2} {‖ ω ‖}^{2} + C \sum_{i = 1}^{l} (ξ_{i} + ξ_{i}^{*})$

$s . t . {\begin{cases} y_{i} - (ω ϕ (x) + b) \leq ε + ξ_{i} \\ - y_{i} + (ω ϕ (x) + b) \leq ε + ξ_{i}^{*} \\ ξ_{i}, ξ_{i}^{*} \geq 0, i = 1, 2, \dots l \end{cases}$ (3)

式中C为惩罚因子； $ε$ 规定了回归函数的误差。由拉格朗日乘子法得到上式的对偶形式为：

$\min D = \frac{1}{2} \sum_{i = 1}^{l} \sum_{j = 1}^{l} (α_{i} - α_{i}^{*}) (α_{j} - α_{j}^{*}) K (x_{i}, x_{j}) + \sum_{i = 1}^{l} (α_{i} + α_{i}^{*}) ε - \sum_{i = 1}^{l} (α_{i} - α_{i}^{*}) y_{i}$

$s . t . {\begin{cases} \sum_{i = 1}^{l} (α_{i} - α_{i}^{*}) = 0 \\ 0 \leq α_{i}, α_{i}^{*} \leq C \end{cases}$

3. 算法流程

本文区分运动模糊，离焦模糊和正常图像大致分为以下步骤，图3为本文算法流程图。

Figure 3. Algorithm flow chart

图3. 算法流程图

1) 采集样本图片，修改尺寸为500 × 500并输入其灰度值图像。如图3(a)所示。

2) 进行小波变换分解得到水平、垂直、对角三个方向上的图像信息，然后再分别对分解后的图像进行傅里叶变换，经过对数变换和中心处理后得到合适的傅里叶频谱图，再进行二值化处理，得到三种模糊更加明显的特征信息。

3) 对处理后的频谱图进行形态学操作，以消除部分无关信息的干扰。最后得到连通域较大的频谱特征区域。

4) 计算该连通区域的长宽比，定义 $\partial = l_{c} / l_{k}$ ，如果有多个连通区域则进行近似拼接,计算拼接后连通区域的长宽比。若没有连通区域定义为0。如图3(b)所示。

5) 建立以支持向量机的网络训练模型。将同一张图像在三个不同方向上的长宽比 $\partial_{1}, \partial_{2}, \partial_{3}$ 作为网络输入层，再将离焦模糊定义为1，运动模糊图像定义为2，正常图片定义为3，将这三种分类作为网络输出层，最终可以形成一个100 × 4的训练矩阵，其中前3列为网络输入，最后1列为网络输出。最后将训练样本进行网络训练。

6) 输入一系列模糊图像，得到最终的结果。如图3(c)所示。

4. 实验结果

本文实验最终将141张任意图片输入到训练完成的神经网络进行测试。如图4，为示例图像。最终得到这141张图像的模糊分类。如表1，表示最终分类结果。

Figure 4. Two random blur images and normal image

图4. 两张随机模糊图片与正常图片

Table 1. Final test accuracy

表1. 最终测试正确率

本文给出的识别方法对于识别离焦模糊的正确率为93.617%，运动模糊的正确率为93.617%，正常图像的正确率为100.000%，而Bolan Sun等人所提出α通道约束方法 [11] 的识别以上两种模糊图像正确率为80.85%和85.10%，林光忠等人提出的基于奇异值分解与傅里叶变换的方法 [1] 正确率为90.91%与90.91%，并且二者都没有对正常图像进行区分。可以看出，对比于文献识别情况，本文方法的正确率非常高，且具有非常强的普适性，能够很好地运用于实际生活。

5. 结论

在本文中，结合小波分解与支持向量机提出了一种新的区分离焦模糊、运动模糊和正常图像的方法，在网络训练完成后可任意输入图片得到这种图像的模糊分类。该方法拥有识别速度快、计算简单等优点，可以广泛运用于图像复原、机器视觉、相册分类等图像处理的领域。同时，对以后解决类似问题提供了很高的参考价值。

基金项目

科学技术研究计划优秀中青年人才项目(Z2019121/Q20191203)。

NOTES

^*通讯作者。

参考文献

[1]	毛建旭, 王耀南, 孙炜. 一种基于模糊小波基函数神经网络的图像分类器[J]. 仪器仪报, 2003(2): 114-118.
[2]	林光忠, 张超兰, 周俊, 曾曙光. 奇异值分解与傅里叶变换相结合的模糊图像分类方法[J]. 图像与信号处理, 2019, 8(2): 36-42.
[3]	禹晶. 散焦与运动模糊图像参数辨识的研究[C]//中国图象图形学学会. 第十三届全国图象图形学学术会议论文集. 南京: 中国图象图形学学会, 2006: 5.
[4]	王冠军, 吴志勇, 云海姣, 梁敏华, 杨华. 结合图像二次模糊范围和奇异值分解的无参考模糊图像质量评价[J]. 计算机辅助设计与图形学学报, 2016, 28(4): 653-661.
[5]	李涛. 基于卷积神经网络的图像分类模型的研究与应用[D]: [硕士学位论文]. 武汉: 湖北工业大学, 2018.
[6]	Wu, Z.J. (2018) Image Classification Based on Support Vector Machines. Proceedings of 2018 8th International Conference on Education and Sports Education, Saint Julian’s, 22-24 August 2018, 8.
[7]	Tiwari, S., et al. (2014) Blur Classification Using Ridgelet Transform and Feed Forward Neural Network. International Journal of Image, Graphics and Signal Processing, 9, 47-53. https://doi.org/10.5815/ijigsp.2014.09.06
[8]	米晨, 汤秀芬, 魏凤兰. 基于Haar小波变换的图像分解与重构[J]. 实验室研究与探索, 2003(2): 78-81.
[9]	任鸿鹏. 基于傅里叶变换的MATLAB图像处理[J]. 科技资讯, 2019, 17(16): 11-12+14.
[10]	田万春, 张贵宇, 庹先国, 吴昊翰, 石小仕. 基于支持向量机的白酒上甑探汽方法研究[J/OL]. 食品与机械: 1-9. http://kns.cnki.net/kcms/detail/43.1183.TS.20191211.1426.008.html, 2019-12-18.
[11]	Su, B., Lu, S. and Tan, C.L. (2011) Blurred Image Region Detection and Classification. Proceedings of the 19th ACM International Conference on Multimedia, New York, 28 November-1 December 2011, 1397-1400. https://doi.org/10.1145/2072298.2072024

友情链接