1. 引言
随着互联网技术的飞速发展,对于图像/视频数据的存储、传输等实际应用的需求也不断增加,因此出现了很多图像压缩算法以满足需求。传统压缩方法有RLE压缩算法 [1]、哈夫曼编码 [2] [3]、LZW压缩算法 [4]、DCT压缩算法 [5] 等,其中效果较好的有损图像压缩算法 [6] 有WebP [7]、JPEG [8]。JPEG在编码中高码率图像质量不错,且性能较好,但低码率的时候明显能看出色块效应 [9]。WebP对于低码率的图像编码效果也较好,但是性能不佳 [10],编解码比JPEG慢几倍。且以上两种主流压缩算法重复压缩都会产生损失 [11]。
然而这些压缩方法主要这些压缩方法具有不确定性,比如图像的纹理细节可能会被改变,因此在医学图像压缩的领域里面很难推广到实际应用。
基于聚类的图像压缩算法是近几年来机器学习应用于图像压缩的一种经典算法,基于K-means聚类的图像压缩算法 [12] 既可以避免色块效应的产生,又可以优化相邻像素点的选取 [13],从而有着更高的信噪比 [14],且编解码性能优越,重复压缩不造成任何损失。
本文提出基于半监督模糊聚类(SFCM)的图像压缩方法,该方法可以加入标签信息大大满足需求,实验证明该方法相比传统的聚类压缩方法压缩得到的图像具有更高的信噪比。
2. 相关工作
2.1. 模糊聚类
模糊C均值聚类算法(FCM)是一种常用的聚类算法 [15]。目前,FCM及其导数聚类方法已广泛应用于计算机视觉、模式识别、数据挖掘等领域。FCM算法是Bezdek于1973年提出的一种改进硬C均值聚类的方法 [16]。与HCM和k-means [17] 等硬算法相比,它最大的优点是用区间[0, 1]的隶属度来表示样本的聚类结果,以表示样本趋于的某种纯度 [18]。
设在p维的欧几里得空间
中的n个样本
,其中
;则FCM的聚类准则目标函数为:
其中c 为预先给定的聚类中心数,且
;m 为预先给定的加权幂指数,用于影响隶属度矩阵的模糊
度;
为第i类的聚类中心;
表示样本j属于第i类的程度,并且满足
。由目标函数可知需求
得当J达到最小值时的U和V,因此由J作为目标变量对
求偏导,令它们的导数为零并代入条件
得到隶属度与聚类中心的迭代公式:
通过对上述两个公式进行迭代求得当J收敛到极小值
和
的值,即隶属度矩阵U和聚类中心V,此为最终聚类结果。
2.2. 半监督模糊聚类
SFCM是一种半监督模糊聚类算法,其目标函数如下:
其中
表示模糊程度,
代表第j个样本(灰度值)距离第i类样本中心(压缩后的灰度值)的欧氏距离,
是第j个样本属于第i类隶属度函数,样本中心为
,
,
,
,
,
,
并且
满足以下约束条件:
m为加权指数,它是一个可以调整的参数,通常为2。然后我们得到隶属度和聚类中心的迭代公式:
其中
表示标记数据信息的真实隶属度矩阵,
是布尔值,当
有标签时等于1。
是预定的抑制系数。
3. 基于半监督模糊聚类的图像压缩
3.1. 动机
我们需要在不影响医生诊断的情况下,对图像进行压缩。传统的图像压缩方法中,往往都是一些无监督的压缩方法,例如K-means。但是这类压缩方法很不利于对图像进行限制每个区域的像素点划分,从而导致压缩效果不佳。
针对上述情况,我们提出了基于半监督模糊聚类的图像压缩方法。首先对新冠病灶部位打上标签信息(如图1),使得CT图像在病灶等关键部位能够保持细节上的一致,最后采用半监督模糊聚类方法完成对像素点的聚类。

Figure 1. COVID-19 the disease on a CT image of lung marked by doctors
图1. 专家标记的COVID-19肺部CT图像的病灶
3.2. 压缩方法
如图1所示,图像为一个M * N的矩阵,转换成M * N个一维向量,每个向量(每个像素点的灰度值)都代表一个样本。然后对这些M * N个样本进行半监督模糊聚类。
由于半监督模糊聚类可以加入标签信息,使用者可以对给定区域进行标记,大幅增强它在某种场景下的信噪比。
然后把聚类结果中所有类别的的样本中心(代表灰度值)作为整个类别所有像素点的灰度值,如图2,大圈内的表示划分为同一类的像素点,大圈中间的小圈表示聚类中心,数值均表示灰度值。
最后将M * N个一维向量转换回M * N的矩阵,从而完成整个基于半监督模糊聚类的压缩过程(如图2)。
在一个分辨率为3 * 3的灰度图,对其进行压缩,其过程如图3。

Figure 3. Image compression process based on Clustering
图3. 基于聚类的图像压缩过程
半监督模糊聚类图像压缩方法流程如图4。

Figure 4. SFCM image compression process
图4. 半监督模糊聚类图像压缩方法流程
半监督模糊聚类运用到新冠CT图像压缩上的对比如图5。

Figure 5. Semi-supervised fuzzy clustering compression method to reduce the gray-scale accuracy without losing any diagnostic details
图5. 半监督模糊聚类降低灰度精度的压缩方法,不会损失标注的重要诊断细节
4. 实验实验及结果分析
4.1. 实验数据及参数设置
图6为分辨率为512*512的标准Lena测试图像,类簇数c = 100;图7为COVID-19 CT图像数据1,类簇数c = 10。图像及标注信息如图6和图7。
(a) Lena image
(b) Lena with label
Figure 6. Luna test image and label information
图6. Lena测试图及标注信息
(a) COVID19-CT
(b) COVID19-CT Label
Figure 7. COVID19-CT test image and label information
图7. COVID19-CT测试图及标注信息
4.2. 评价指标
信噪比是一种常用的用于评价图像质量的方法,其公式如下:
其中,
和
分别表示的是待评价图像和原始图像的灰度值,M, N分别表示图像的宽与高。信噪比越高则表示图像压缩效果越好。
4.3. 实验结果
实验结果表1表明,基于SFCM的图像压缩算法比传统JPEG压缩方法以及传统聚类压缩方法都有明显的优势,尤其是针对医学CT图像。
5. 结论
针对目前对主流图像压缩算法的分析,本文指出了传统图像存在着压缩算法扩展性较差、信噪比较低的局限性,提出了半监督模糊聚类在图像压缩上的应用,解释了这种半监督模糊聚类图像压缩的流程,最后经过实验后分析得出,它不仅可以提高信噪比、还能针对不同的应用场景加入标签,起到优化的作用。
基金项目
广东省2020年科技创新战略专项资金(项目编号:pdjh2020b0182);2021年广东工业大学大学生创新训练项目(项目编号:D202011302238462422)。
NOTES
*通讯作者。
1https://github.com/UCSD-AI4H/COVID-CT.