基于半监督模糊聚类的图像压缩研究

doi:10.12677/JISP.2021.103014

期刊菜单

基于半监督模糊聚类的图像压缩研究
Research on Image Compression Based on Semi-Supervised Fuzzy Clustering

DOI: 10.12677/JISP.2021.103014, PDF, HTML, XML, 下载: 462 浏览: 672 科研立项经费支持
作者: 王宇, 徐圣兵^*, 蔡炜, 夏泓禧, 黄永盛：广东工业大学，应用数学学院，广东广州
关键词: 半监督模糊聚类；图像压缩；标签信息；Semi-Supervised Fuzzy Clustering； Image Compression； Label Information

摘要: 针对主流图像压缩方法色彩深度冗余、无法针对特定场景加入标签以优化压缩质量等问题，本文提出了一种基于半监督模糊聚类(SFCM)的图像压缩方法，相比传统的图像压缩算法，该方法能通过引入模糊标签信息以提高特定应用场景下图像压缩的质量，即对特定区域进行标记以达到更好的压缩效果，从而使得图像压缩在更多不同应用场景保留更丰富的信息。本文实验选取传统的Lena图和COVID-19CT图像，实验结果显示此改进的图像压缩方法相比JPEG、K-Means等方法压缩得到的图像具有更好的信噪比。

Abstract: To solve the problems of image compression methods such as color redundancy and the inability to add label for specific scenes to gain compression quality, this paper proposes an image compression method based on semi-supervised fuzzy clustering (SFCM). Compared with traditional image compression algorithms, this method can improve the quality of image compression in specific scenarios by introducing fuzzy label, marking specific areas to achieve better compression effects, so that image compression retains more details in specific scenarios. The experiments using Lena images and COVID-19 CT images show that this improved image compression method has a better SNR than traditional methods such as JPEG and K-Means.

文章引用：王宇, 徐圣兵, 蔡炜, 夏泓禧, 黄永盛. 基于半监督模糊聚类的图像压缩研究[J]. 图像与信号处理, 2021, 10(3): 127-134. https://doi.org/10.12677/JISP.2021.103014

1. 引言

随着互联网技术的飞速发展，对于图像/视频数据的存储、传输等实际应用的需求也不断增加，因此出现了很多图像压缩算法以满足需求。传统压缩方法有RLE压缩算法 [1]、哈夫曼编码 [2] [3]、LZW压缩算法 [4]、DCT压缩算法 [5] 等，其中效果较好的有损图像压缩算法 [6] 有WebP [7]、JPEG [8]。JPEG在编码中高码率图像质量不错，且性能较好，但低码率的时候明显能看出色块效应 [9]。WebP对于低码率的图像编码效果也较好，但是性能不佳 [10]，编解码比JPEG慢几倍。且以上两种主流压缩算法重复压缩都会产生损失 [11]。

然而这些压缩方法主要这些压缩方法具有不确定性，比如图像的纹理细节可能会被改变，因此在医学图像压缩的领域里面很难推广到实际应用。

基于聚类的图像压缩算法是近几年来机器学习应用于图像压缩的一种经典算法，基于K-means聚类的图像压缩算法 [12] 既可以避免色块效应的产生，又可以优化相邻像素点的选取 [13]，从而有着更高的信噪比 [14]，且编解码性能优越，重复压缩不造成任何损失。

本文提出基于半监督模糊聚类(SFCM)的图像压缩方法，该方法可以加入标签信息大大满足需求，实验证明该方法相比传统的聚类压缩方法压缩得到的图像具有更高的信噪比。

2. 相关工作

2.1. 模糊聚类

模糊C均值聚类算法(FCM)是一种常用的聚类算法 [15]。目前，FCM及其导数聚类方法已广泛应用于计算机视觉、模式识别、数据挖掘等领域。FCM算法是Bezdek于1973年提出的一种改进硬C均值聚类的方法 [16]。与HCM和k-means [17] 等硬算法相比，它最大的优点是用区间[0, 1]的隶属度来表示样本的聚类结果，以表示样本趋于的某种纯度 [18]。

设在p维的欧几里得空间 $R^{p}$ 中的n个样本 $X = {x_{1}, x_{2}, x_{3}, \dots, x_{n}} \in R^{p}$ ,其中 $j = 1, 2, \dots, n$ ；则FCM的聚类准则目标函数为：

$J (U, V) = \sum_{i = 1}^{c} \sum_{j = 1}^{n} {(u_{i j})}^{m} {‖ x_{j} - v_{i} ‖}^{2}$

其中c 为预先给定的聚类中心数，且 $1 < c < n$ ；m 为预先给定的加权幂指数，用于影响隶属度矩阵的模糊

度； $v_{i}$ 为第i类的聚类中心； $u_{i j}$ 表示样本j属于第i类的程度，并且满足 $\sum_{i = 1}^{c} u_{i j} = 1$ 。由目标函数可知需求

得当J达到最小值时的U和V，因此由J作为目标变量对 $u_{i j}, v_{i}$ 求偏导，令它们的导数为零并代入条件

$\sum_{i = 1}^{c} u_{i j} = 1$ 得到隶属度与聚类中心的迭代公式：

$u_{i j} = \frac{{(\frac{1}{{‖ x_{j} - v_{k} ‖}^{2}})}^{\frac{1}{m - 1}}}{\sum_{i = 1}^{c} {(\frac{1}{{‖ x_{j} - v_{i} ‖}^{2}})}^{\frac{1}{m - 1}}}$

$v_{i} = \frac{\sum_{j = 1}^{n} {(u_{i j})}^{m} x_{j}}{\sum_{j = 1}^{n} {(u_{i j})}^{m}}$

通过对上述两个公式进行迭代求得当J收敛到极小值 $u_{i j}$ 和 $v_{i}$ 的值，即隶属度矩阵U和聚类中心V，此为最终聚类结果。

2.2. 半监督模糊聚类

SFCM是一种半监督模糊聚类算法，其目标函数如下：

$J_{SFCM} (U, V) = \sum_{i = 1}^{c} \sum_{j = 1}^{n} u_{i j}^{m} {‖ x_{j} - v_{i} ‖}^{2} + α \sum_{i = 1}^{c} \sum_{j = 1}^{n} (u_{i j} - {\tilde{u}}_{i j}) {‖ x_{j} - v_{i} ‖}^{2}$

其中 $m (m > 1)$ 表示模糊程度， ${‖ x_{j} - v_{i} ‖}^{2}$ 代表第j个样本(灰度值)距离第i类样本中心(压缩后的灰度值)的欧氏距离， $u_{i j} (0 \leq u_{i j} \leq 1)$ 是第j个样本属于第i类隶属度函数，样本中心为 $v_{i}$ , $U = (u_{i j})$ , $V = [v_{1}, v_{2}, \dots, v_{c}]$ , $1 \leq i \leq c$ , $1 \leq j \leq n$ , $2 \leq c < n$ , $u_{j} = {(u_{1 j}, \dots, u_{c j})}^{T}$ 并且 $u_{i j}$ 满足以下约束条件：

$s .t . μ_{i j} \in [0, 1]; \sum_{i = 1}^{c} μ_{i j} = 1, (j = 1, 2, ϵ, n)$

m为加权指数，它是一个可以调整的参数，通常为2。然后我们得到隶属度和聚类中心的迭代公式：

$u_{i j} = \frac{1}{1 + α} [\frac{1 + α {(1 - \sum_{i = 1}^{c} {\tilde{u}}_{i j})}^{m - 1}}{\frac{{‖ x_{j} - v_{i} ‖}^{2}}{\sum_{h = 1}^{c} {‖ x_{j} - v_{h} ‖}^{2}}} + α {\tilde{u}}_{i j}]$

$v_{i} = \frac{\sum_{j = 1}^{n} μ_{i j}^{m} x_{j}}{\sum_{j = 1}^{n} μ_{i j}^{m}}$

其中 $f_{i j}$ 表示标记数据信息的真实隶属度矩阵， $b_{j}$ 是布尔值，当 $x_{j}$ 有标签时等于1。 $α$ 是预定的抑制系数。

3. 基于半监督模糊聚类的图像压缩

3.1. 动机

我们需要在不影响医生诊断的情况下，对图像进行压缩。传统的图像压缩方法中，往往都是一些无监督的压缩方法，例如K-means。但是这类压缩方法很不利于对图像进行限制每个区域的像素点划分，从而导致压缩效果不佳。

针对上述情况，我们提出了基于半监督模糊聚类的图像压缩方法。首先对新冠病灶部位打上标签信息(如图1)，使得CT图像在病灶等关键部位能够保持细节上的一致，最后采用半监督模糊聚类方法完成对像素点的聚类。

Figure 1. COVID-19 the disease on a CT image of lung marked by doctors

图1. 专家标记的COVID-19肺部CT图像的病灶

3.2. 压缩方法

如图1所示，图像为一个M * N的矩阵，转换成M * N个一维向量，每个向量(每个像素点的灰度值)都代表一个样本。然后对这些M * N个样本进行半监督模糊聚类。

由于半监督模糊聚类可以加入标签信息，使用者可以对给定区域进行标记，大幅增强它在某种场景下的信噪比。

然后把聚类结果中所有类别的的样本中心(代表灰度值)作为整个类别所有像素点的灰度值，如图2，大圈内的表示划分为同一类的像素点，大圈中间的小圈表示聚类中心，数值均表示灰度值。

Figure 2. Pixel gray value conversion

图2. 像素点灰度值转换

最后将M * N个一维向量转换回M * N的矩阵，从而完成整个基于半监督模糊聚类的压缩过程(如图2)。

在一个分辨率为3 * 3的灰度图，对其进行压缩，其过程如图3。

Figure 3. Image compression process based on Clustering

图3. 基于聚类的图像压缩过程

半监督模糊聚类图像压缩方法流程如图4。

Figure 4. SFCM image compression process

图4. 半监督模糊聚类图像压缩方法流程

半监督模糊聚类运用到新冠CT图像压缩上的对比如图5。

Figure 5. Semi-supervised fuzzy clustering compression method to reduce the gray-scale accuracy without losing any diagnostic details

图5. 半监督模糊聚类降低灰度精度的压缩方法，不会损失标注的重要诊断细节

4. 实验实验及结果分析

4.1. 实验数据及参数设置

图6为分辨率为512*512的标准Lena测试图像，类簇数c = 100；图7为COVID-19 CT图像数据¹，类簇数c = 10。图像及标注信息如图6和图7。

(a) Lena image (b) Lena with label

Figure 6. Luna test image and label information

图6. Lena测试图及标注信息

(a) COVID19-CT (b) COVID19-CT Label

Figure 7. COVID19-CT test image and label information

图7. COVID19-CT测试图及标注信息

4.2. 评价指标

信噪比是一种常用的用于评价图像质量的方法，其公式如下：

$PSNR = 10 \log_{10} \frac{255^{2} \times M \times N}{\sum_{i = 1}^{M} \sum_{j = 1}^{N} {(f^{'} (i, j) - f (i, j))}^{2}}$

其中， $f^{'} (i, j)$ 和 $f (i, j)$ 分别表示的是待评价图像和原始图像的灰度值，M, N分别表示图像的宽与高。信噪比越高则表示图像压缩效果越好。

4.3. 实验结果

实验结果表1表明，基于SFCM的图像压缩算法比传统JPEG压缩方法以及传统聚类压缩方法都有明显的优势，尤其是针对医学CT图像。

Table 1. System result

表1. 实验结果

5. 结论

针对目前对主流图像压缩算法的分析，本文指出了传统图像存在着压缩算法扩展性较差、信噪比较低的局限性，提出了半监督模糊聚类在图像压缩上的应用，解释了这种半监督模糊聚类图像压缩的流程，最后经过实验后分析得出，它不仅可以提高信噪比、还能针对不同的应用场景加入标签，起到优化的作用。

基金项目

广东省2020年科技创新战略专项资金(项目编号：pdjh2020b0182)；2021年广东工业大学大学生创新训练项目(项目编号：D202011302238462422)。

NOTES

^*通讯作者。

¹https://github.com/UCSD-AI4H/COVID-CT.

参考文献

[1]	林小竹, 万建邦. 灰度图像的有损RLE压缩[J]. 石油化工高等学校学报, 2004, 17(3): 89-92.
[2]	黄福莹, 黄开志. 基于矢量量化和Huffman编码的图像压缩[C]//广西计算机学会2009年年会论文集. 广西: 广西计算机学会, 2009: 257-258.
[3]	饶兴. 基于Huffman编码的图像压缩解压研究[J]. 电脑知识与技术, 2011, 7(4): 887-889. https://doi.org/10.3969/j.issn.1009-3044.2011.04.071
[4]	蓝波, 林小竹, 籍俊伟. 一种改进的LZW算法在图像编码中的应用[J]. 计算机工程与科学, 2006, 28(6): 55-57.
[5]	丛爽, 蒲亚坤, 王军南. DCT图像压缩方法的改进及其应用[J]. 计算机工程与应用, 2010, 46(18): 160-163. https://doi.org/10.3778/j.issn.1002-8331.2010.18.050
[6]	Chen, C.C. (1998) On the Selection of Image Compression Algorithms. International Conference on Pattern Recognition IEEE, Brisbane, 16-20 August 1998, 1-2.
[7]	李莲, 魏石磊. 一种基于VP8编码的Webp图片压缩格式研究[J]. 单片机与嵌入式系统应用, 2012, 12(3): 40-43. https://doi.org/10.3969/j.issn.1009-623X.2012.03.016
[8]	王成优, 侯正信. JPEG图像压缩编码及其MATLAB仿真实现[J]. 电子测量技术, 2007, 30(1): 135-137. https://doi.org/10.3969/j.issn.1002-7300.2007.01.045
[9]	Lee, Y.L. (1998) Blocking Effect Reduction of JPEG Images by Signal Adaptive Filtering. IEEE Transactions on Image Processing, 7, 229-234. https://doi.org/10.1109/83.661000
[10]	Ginesu, G., Pintus, M. and Giusto, D.D. (2012) Objective Assessment of the WebP Image Coding Algorithm. Signal Processing: Image Communication, 27, 867-874. https://doi.org/10.1016/j.image.2012.01.011
[11]	吴雪. 压缩质量相同的双重JPEG压缩检测算法研究[D]: [硕士学位论文]. 武汉: 武汉理工大学, 2019.
[12]	Karayiannis, N.B. (1995) Generalized Fuzzy k-Means Algorithms and Their Application in Image Compression. Proceedings of SPIE—The International Society for Optical Engineering, Orlando, 17-21 April 1995, 1-2. https://doi.org/10.1117/12.211803
[13]	殷俊. K-Means聚类算法的优化及在图片去重中的应用[D]: [硕士学位论文]. 武汉: 华中科技大学, 2016.
[14]	白福均, 高建瓴, 宋文慧, 等. 半监督模糊聚类算法的研究与改进[J]. 通信技术, 2018, 51(5): 71-75.
[15]	Bezdek, J.C., Ehrlich, R. and Full, W. (1984) FCM: The Fuzzy C-Means Clustering Algorithm. Computers & Geosciences, 10, 191-203. https://doi.org/10.1016/0098-3004(84)90020-7
[16]	Hathaway, R.J., Davenport, J.W. and Bezdek, J.C. (1989) Relational Duals of the c-Means Clustering Algorithms. Pattern Recognition, 22, 205-212. https://doi.org/10.1016/0031-3203(89)90066-6
[17]	Steinley, D. (2011) K-Means Clustering: A Half-Century Synthesis. British Journal of Mathematical & Statal Psychology, 59, 1-34. https://doi.org/10.1348/000711005X48266
[18]	Bora, D.J. and Gupta, A.K. (2014) A Comparative Study between Fuzzy Clustering Algorithm and Hard Clustering Algorithm. International Journal of Emerging Trends & Technology in Computer Science, 10, 108-113. https://doi.org/10.14445/22312803/IJCTT-V10P119

友情链接