1. 引言
恶性黑色素瘤是一种常见的临床恶性皮肤肿瘤,严重威胁着人们的生命健康。在借助皮肤镜进行临床辅助诊断时,由于实际中采集角度、光线环境和患者的病症表现等差异,造成病变皮损边界模糊、病变形状不规则和颜色分布不均匀等情况。准确检测出皮肤镜图像的病变边界是提取病变特征、黑色素瘤定性和分类的前提,帮助患者尽早确诊、及时治疗。
常用的皮肤镜病变区域图像分割算法,主要分为阈值分割、边缘检测、聚类分割、活动轮廓等,由于受到皮肤镜图像病变区域灰度不均匀的限制,这些方法很难从皮肤镜图像准确提取出病变区域。Faal等人 [1] [2] 利用皮肤镜图像的灰度直方图设定合适的阈值,最终提取出病变区域。该方法计算简单,但当病灶区域与正常皮肤区域之间对比度较低的情况下,难以找到合适的阈值;Mag等人 [3] 采用预处理以及微分算子方式得到皮损病变区域的边界,由于皮肤病变图像边界模糊且存在毛发、气泡等不同噪声的干扰,在一定程度上影响了分割出的病变边界;Liu等人 [4] 依据图像内部结构划分为多个类别将均值漂移算法引入皮肤镜图像分割中,Devanathan等人 [5] 利用核函数的思想将模糊C均值聚类方法引入皮肤镜图像分割中,当病变灰度分布参差不一的时候,这两种方法分割效果均不佳;随着活动轮廓方法的发展,Chan和Vese [6] 设计C-V模型利用图像的区域统计信息来构造轮廓演化的驱动力,该模型对强度均匀的目标图像有较好的分割效果,却不能准确分割灰度不均匀图像,后续Zhang等人 [7] 提出了基于区域符号压力函数驱动的活动轮廓模型,将测地线模型 [8] 和CV模型结合,然而还是不能有效地分割灰度不均匀的图像。
为了解决上述问题,本文提出了一种基于KFCM与多特征融合的病变区域提取模型。采用模糊核C均值聚类方法,将样本空间映射到高维的特征空间并聚类,聚类结果作为初始轮廓,利用全局和局部符号压力函数并用自适应权重系数构建的多特征融合的活动轮廓演化模型,提取皮肤镜病变区域。
2. 病变区域聚类
由于皮肤镜图像边界模糊以及受到毛发、气泡等噪声的干扰,通过模糊核聚类算法对图像进行聚类,在聚类皮肤边缘信息的同时降低了图像中各种噪声的干扰。模糊核聚类算法(KFCM)是基于模糊C均值算法改进的算法,将核函数引入到模糊C均值聚类算法中,该方法利用核函数将数据预处理集映射到高维特征空间上,通过迭代优化目标函数,实现对输入样本的模糊聚类 [9] 。核函数聚类的方法实用性强于传统的FCM算法,迭代次数较少,同时能够聚类被噪声污染、不对称的数据。
待聚类的样本数据集
表示图像灰度值的集合,n为样本总数,数据集到特征空间F的映射关系为:
。利用径向基函数改变FCM中的距离的定义方式,得到目标函数 [10] :
(1)
其中,参数c是聚类数,m是模糊加权指数参数,决定最终结果的模糊程度,参数
表示像素k归属于第i类的隶属度,参数
表示是第i类的聚类中心,式中
,同时
、
和
的运算公式选取常用的高斯径向基函数:
(2)
其中,
表示核函数的宽度,由于
和
的值都为1,因此目标函数可简写为:
(3)
对于任意j,样本数据
对于所有聚类中心的隶属度和为1;对于任意i,j,
隶属度取值范围为区间
;对于一个类中所有样本数据的隶属度和范围为
;在约束条件下使目标函数
最小,为此使用Lagrange乘法求极值得到隶属度矩阵
和聚类中心V为:
(4)
(5)
3. 病变区域提取
3.1. 经典活动轮廓模型
3.1.1. Chan-Vese模型
Chan和Vese [6] 提出的C-V (Chan-Vese, CV)模型是经典的活动轮廓模型,该模型利用图像全局灰度信息构建能量函数,能够有效的解决图像弱边界的问题,极小化能量函数 [11] :
(6)
其中,
为原图像,
均大于0,
为加权系数,
为水平集函数,式中
为Heaviside函数,
为Dirac函数,定义分别为:
(7)
(8)
以交替迭代算法的方式极小化能量函数,先固定水平集函数
,得到变量
和
的极小值点:
(9)
(10)
分别是轮廓曲线C内外的灰度均值,固定
和
引入时间变量t,利用变分法和梯度下降法得到能量函数关于水平集函数
的极小点,最终得到演化方程的稳态解为:
(11)
由于C-V模型是基于全局信息对图像进行分割,即利用轮廓曲线内外的灰度均值,对于目标和背景对比明显的图像处理效果好,但是由于受到其能量泛函的限制,不能有效分割灰度不均匀的图像。
3.1.2. SLGS模型
Zhang等人 [7] 提出了基于区域的符号压力函数驱动的活动轮廓模型(SLGS),该模型在保持了CV模型的优点的基础上,又构造了符号压力函数(SPF),以活动轮廓内外的平均灰度为驱动,计算输入图像与驱动中心的灰度差值来引导曲线的演化,其水平集演化方程为:
(12)
其中,
表示原图像,
为气球力参数,调节水平集演化的速率,SPF为符号压力函数 [12] [13] 定义如下:
(13)
SLGS模型比C-V模型效率更快,但是该模型和C-V模型一样基于图像全局信息,图像的局部信息没有参与模型的构建,致使对灰度不均匀图像的分割效果不理想,易受噪声干扰。
3.2. 多特征融合的轮廓提取模型
考虑到经典的活动轮廓模型不能有效的分割灰度不均匀的图像,本文采用Zhang等人的水平集的方法,同时结合全局信息与局部熵、局部标准差和局部梯度构造的局部信息设计新的符号压力函数,并通过自适应权重系数来设计总SPF函数,通过此函数来构造模型的演化方程。
3.2.1. 全局项
为了避免演化曲线陷入局部最小值,同时使曲线可以快速通过灰度均匀的背景,本文利用图像全局灰度平均信息形成全局项,符号可以指导曲线演化的方向,使曲线收缩或者膨胀,定义为:
(14)
表示原图像,
函数的第二项表示拟合图像,利用
函数将轮廓内外的平均强度组合起来。当原图像
与拟合图像的差值最小时
趋于0,轮廓曲线停止演化。
3.2.2. 局部项
仅考虑全局灰度信息分割灰度不均匀的病变图像效果是不理想的,为了更精确地指导演化方向,还要结合局部熵、局部标准差和局部梯度信息一同构造局部信息 [14] 。在中心像素
的周围设一个大小为
的局部窗口
,则图像的熵、标准差和梯度分别为:
(15)
(16)
(17)
其中,L代表图像灰度最大值,i代表某一灰度值,
代表i对应的像素数,
代表为i的灰度值在窗口区域内出现的概率大小,
指的是窗口内灰度均值。同时,在局部熵、局部标准差和局部梯度中引入高斯核函数
,
代表卷积,
,
,轮廓内外的局部特征信息定义如下:
(18)
(19)
通过Heaviside函数构成轮廓两侧的特征信息,因此我们可以得到由三个局部特征支配的SPF,它们分别被定义为:
(20)
(21)
(22)
利用局部特征信息得出局部项的SPF函数,其定义如下:
(23)
3.2.3. 自适应权重系数
在曲线演化的过程中,为了结合全局项和局部项以控制演化的方向,突出分割目标,引入自适应权重系数 [15] ,形成总的SPF函数:
(24)
自适应权重系数
决定SPF函数主要受全局项还是局部项的影响,起到动态调整全局项和局部项的作用。当图像的强度变化显著时,只靠全局信息可能会造成错误分割;当图像强度变化缓慢时,应该增加全局项的比重,使曲线扩张并快速通过。因此,我们选择局部范围来定量地反映图像强度的变化,计算一个
大小窗口中的最大值与最小值的差值,其表示式如下:
(25)
自适应权重系数的表达式如下:
(26)
其中,
且
是一个常数,利用自适应权重系数,这样可以克服传统的符号压力函数仅利用全局区域信息或仅利用局部信息,而不能有效的处理灰度不均匀图像的缺点。通过结合符号压力函数
和自适应权重系数
,给出新的水平集演化方程为:
(27)
3.2.4. 提取流程
在传统的ACM中符号距离函数(SDF)用于表示从一个像素点到轮廓曲线上的最短距离,当曲线的位置发生改变时,SDF的值也会相应的进行改变。为了减少SDF的计算时间和水平集初始化的过程,选择Zhang等人 [7] 提出的水平集函数:
(28)
对于水平集函数重新正则化问题 [16] ,使用高斯函数对每次迭代后的水平集函数进行处理:
(29)
符合以下条件时,曲线停止演化:
(30)
综合上述分析,该算法流程具体如下:
1) 初始化水平集函数
,设置部分参数;
2) 开始循环。分别根据式(14)和(23),计算图像的
和
;
3) 根据式(26)计算自适应权重
;
4) 根据式(24)计算
;
5) 根据式(27),更新水平集函数
;
6) 选取高斯滤波对水平集函数
正则化;
7) 判断
是否达到停止条件。若达到,停止演化;否则,继续转到步骤(2)。
4. 实验结果与分析
4.1. 数据集和评估指标
为验证本文所提算法对皮肤镜病变区域提取的可行性,选择来自于ISIC2018数据集图像,所有皮肤镜图像的真实分割结果由专业的皮肤科医生评审并整理,验证本模型对于灰度不均匀和边界模糊形状不规则图像的提取能力以及噪声的鲁棒性。本实验的运行环境为:PC机CPU为Inter(R)Core(TM)i5-7200CPU@3.2GHz,内存为4 GiB,MATLAB版本为R2018a。实验采用IOU (Intersection over Union, IOU) [16] 和Hausdorff距离 [17] (Hausdorff distance, HD)分别对提取的病变结果进行定量评价。
若A和B分别表示算法分割结果和真实分割结果,则
(31)
(32)
其中,
代表的是像素点x和y的欧式距离。
IOU是衡量分割的病变区域与真实的区域的匹配程度;HD为衡量目标边缘与真实病变边缘的偏离程度。IOU越大,HD越小,表示分割性能越好。
4.2. 实验结果分析
为了能看出病变区域轮廓的位置,实验结果中用红色表示最终模型演化得到的病变分割轮廓。为验证本文模型对皮肤病变区域提取的有效性,本文选取文献 [6] 中CV模型、文献 [8] 中GAC模型、文献 [7] 中SLGS模型与本文模型进行对比。图1展示出不同模型对皮肤病变区域提取的结果。图1(a)~(d) 来源于ISIC2018数据集,从上到下依次为原始图像、聚类结果、分割结果、本文模型、CV、GAC、SLGS提取的结果,其中图1(a)和图1(b)为色素痣示例,图1(c)和图1(d)为黑色素瘤示例。
图1(a)所示的皮肤病变区域边界轮廓复杂,CV和GAC作为基础的活动轮廓模型对目标区域提取的能力严重不足,SLGS模型相对于前两种模型效果较好,但在处理边界细节上还需要提高。而本文模型结合局部信息和全局信息共同指导曲线的演化,增强了目标区域的提取能力,使病变边界细节更清晰。
图1(b)所示的皮肤镜图像分割目标为图像中部深色区域,原图皮肤背景与病灶组织的交界区模糊度较小但存在气泡噪声,CV模型对提取病变区域能力严重不足,SLGS模型结合了CV和GAC模型的优点,可以有效处理边界模糊的图像,但是当目标局部强度不均匀时也会出现错误,本文模型的局部信息中的三个特征模块能实现局部特征的提取,同时对灰度不均匀边界都能正常分割。
图1(c)中病灶内部区域灰度分布自上而下由稠密到稀疏,病变形状不规则、病灶边界很模糊且存在大量噪声。CV模型受到皮肤边界其他小区域的影响,将较小感兴趣区域误提取为皮肤病变区域,出现多个小病变块。而SLGS和本文模型引入SPF函数,在一定程度上辨别出二者,减少误分割。
图1(d)图像形状规则但边界组织区域和病变区域对比度较低,GAC和SLGS模型面对灰度值相近的病变区域时,均不能正确提取。本文模型由于受到自适应系数的约束,可以准确的指导演化曲线进行提取。可见无论形状是否规则,本文模型都能够正确提取出病变区域。
Figure 1. Example of dermoscopic image extraction
图1. 皮肤镜图像提取示例
表1列出了4种模型对真实皮肤镜图像病变区域提取的迭代次数和算法运行时间。可以看出,CV模型和GAC模型由于其收敛性较差,算法运行最耗时;SLGS模型与本文模型算法运行速度较快,但因SLGS模型只需要全局信息来指导曲线的演化,局部信息并未参与,对于本文方法,在提取不同种类的图像时都拥有更少的迭代次数和运行时间,优于其他3种类型。
表2定量评价了4种模型对4幅真实皮肤镜图像的提取结果。可以看出,本文模型在提取区域(IOU)和提取边缘(HD)能更好地提取病变区域和皮肤背景。
Table 1. Comparison of iteration times and running time of four models
表1. 4种模型迭代次数和运行时间比较
Table 2. Comparison of extraction accuracy of 4 models
表2. 4种模型提取精度比较
5. 结论
针对医学图像中灰度不均匀、形状不规则的图像,本文提出一种模糊核聚类和多特征融合的病变区域提取模型,分别基于图像的全局信息和局部信息并用自适应权重系数构造符号压力函数,形成多特征信息融合的提取模型,该模型能够充分结合两类方法各自的优势,使水平集演化更高效。实验结果证明,本文所设计的模型能够提高不同类型皮肤镜病变区域的提取性能,且分割精度由于多种活动轮廓模型,具有一定的抗噪性。下一步的研究方向将探讨该模型与深度学习融合,以实现高效率的皮肤镜病变分类。