1. 引言
乳腺癌是全球女性中发病率和死亡率最高的恶性肿瘤之一。据世界卫生组织(WHO)统计,乳腺癌已经成为全球女性癌症的主要杀手,每年导致大量死亡病例。乳腺癌的早期诊断对患者的生存率和治疗效果至关重要。当前,乳腺癌的诊断依赖于医学影像技术,如乳腺X光、超声、MRI等。此外,组织病理学图像分析也是乳腺癌诊断的重要手段之一。通过对乳腺癌切除组织的显微镜图像分析,病理学家可以判断肿瘤的类型、分期和恶性程度。因此,组织病理学图像被认为是最可靠的癌症诊断工具之一。然而,乳腺癌组织病理学图像分析的过程复杂且极度依赖病理学专家的经验。分析不仅需要长时间的工作,而且对病理学家的技术要求极高。随着医学影像学的发展,如何借助计算机技术实现乳腺癌组织病理学图像的自动化分析,已经成为医学图像处理领域的重要研究方向。自动化图像分类能够有效提升诊断的效率与精度,减少人为因素的干扰,尤其对于偏远地区和资源有限的环境,自动化诊断系统显得尤为重要。
随着医学图像处理技术的发展,基于机器学习和深度学习的乳腺癌组织病理学图像分类方法逐渐成为研究的热点,特别是卷积神经网络(CNN)、深度学习和迁移学习等方法在图像分类中的应用取得了显著成果。张会敏在其研究中探讨了基于深度学习的乳腺癌组织病理学图像分类方法,提出了使用卷积神经网络(CNN)和深度神经网络(DNN)相结合的技术架构,并通过改进的网络模型提高了分类的准确性[1]。刘杰则研究了基于量子张量网络的机器学习模型,提出了一种新型的量子机器学习算法,结合量子计算和传统机器学习方法,以进一步提升乳腺癌图像分类的性能[2]。臧敏采用深度学习算法,特别是卷积神经网络(CNN)和自注意力机制,分析了乳腺癌组织病理图像的分类问题,并提出了一种改进的网络架构,增强了对病变区域的检测能力[3]。此外,张晋凯在其研究中通过对比不同深度学习模型,提出了一种结合数据增强和迁移学习的多层次卷积神经网络模型,从而提高了乳腺癌组织病理学图像的分类精度[4]。胡天寒等研究了基于SE-DenseNet的乳腺癌图像分类方法,利用SE模块增强了网络的特征表达能力,通过实验验证了该方法对病理图像的分类效果优于传统的CNN模型[5]。在卷积神经网络(CNN)应用的研究中,张喜科等综述了基于CNN的乳腺癌组织病理学图像分类的研究进展,讨论了卷积神经网络在不同类型病理图像分类中的应用,并介绍了其在乳腺癌诊断中的优势和挑战[6]。汪文涛结合深度学习和迁移学习提出了一种新的乳腺癌图像分类方法,通过迁移学习使得模型能够在少量标注数据的情况下获得更好的分类性能[7]。王筱婷则研究了基于卷积神经网络的乳腺组织病理学图像多分类方法,提出了新的网络结构,能够同时对乳腺癌的不同亚型进行分类[8]。此外,牛学猛在其研究中探索了基于卷积神经网络的乳腺癌图像分类方法,通过数据预处理和增强等技术,提高了CNN模型的泛化能力和分类精度[9]。陈霧则从机器学习的角度,回顾了肿瘤医学图像分类中的技术进展,并探讨了机器学习模型在乳腺癌图像分类中的应用前景[10]。尽管这些深度学习方法在乳腺癌图像分类中取得了显著成果,但也存在一些局限性。例如,卷积神经网络(CNN)在处理小样本数据时容易过拟合,而且其计算复杂度较高,需要较大的计算资源[11]。迁移学习和数据增强等技术虽然在一定程度上缓解了这一问题,但仍未完全解决模型的泛化能力不足和对稀缺数据的依赖问题[12]。此外,深度学习方法通常需要大量标注数据来训练模型,这在临床实践中可能存在标注数据不足的困难[13]。
相比之下,基于小波变换的图像处理方法具有独特的优势。小波变换能够在多个尺度上有效提取图像的纹理特征,这些特征对于乳腺癌的早期诊断具有重要意义。与传统的深度学习方法相比,小波变换能够在较少的计算资源和较少的标注数据下有效提升分类精度[14]。此外,结合支持向量机(SVM)等智能算法,能够进一步优化分类结果,提升模型的鲁棒性和泛化能力。与深度学习方法相比,小波变换能够在图像特征的多尺度提取上展现出较强的优势,尤其是在数据量有限的情况下,能够有效避免过拟合的问题[15]。所以本文提出了一种创新的乳腺癌组织病理学图像分类方法,结合了小波变换和智能算法的优势。通过小波变换对乳腺癌组织病理图像进行多尺度分解,有效提取图像中的纹理特征,这些特征在癌症诊断中具有重要的识别价值。利用SVM模型对提取的多尺度特征进行分类,SVM模型能够自适应地学习和优化特征,进一步提高分类精度。最后与传统的图像处理和分类方法进行对比,结果表明,所提出的方法在乳腺癌组织病理学图像的分类准确率和鲁棒性方面具有明显的优势。
2. 小波变换
小波变换(Wavelet Transform, WT)是一种用于信号分析的数学工具,它能通过多尺度分析对信号进行分解,提取出信号的不同频率成分。在图像处理和信号处理中,小波变换具有局部化、精确度高和多尺度分析的特点,因此广泛应用于图像压缩、去噪、特征提取等领域。
2.1. 小波变换的基本形式
小波变换的基本思想是将信号表示为高频和低频成分的组合。与传统的傅里叶变换不同,傅里叶变换只能提供信号的全局频谱信息,而无法有效揭示信号的局部特性。小波变换则通过使用一组“母小波”函数,以不同的尺度和位置对信号进行局部化分析。这样,既可以获得信号在时间(或空间)上的局部信息,又能提取信号的频域特征。
小波变换的基本过程包括对信号进行平移和缩放操作。设原始信号为
,小波变换的基本形式为:
(1)
其中:
为信号
在尺度a和位置b上的变换系数;
为母小波(Mother Wavelet),是一个具有良好时频局部化特性的函数;a为尺度因子,控制小波的压缩或扩展,反映了信号的频率信息;b为平移因子,表示小波在时间(或空间)上的平移。通过调整a和b,可以获得信号在不同尺度和位置的局部特征。这使得小波变换在处理具有多尺度、复杂结构的信号时,表现出优于传统傅里叶变换的优势。
2.2. 缩放和平移操作
小波变换中的缩放和移动操作是关键。对于信号
,母小波
的缩放和移动变换分别可以表示为:
(2)
其中:a为尺度因子,控制母小波的扩展或压缩;b为平移因子,表示小波在时间(或空间)上的平移;
是尺度因子,用于保证能量的归一化。通过调整尺度因子a和平移因子b,可以生成不同的子波函数,这些子波函数用于对信号进行多尺度分析。缩放操作决定了小波在时域的压缩与扩展,平移操作则控制了小波的位置。
2.3. 小波变换的正交性与重构
小波变换的一个重要特点是其正交性,即不同尺度和位置的小波基之间是正交的。这意味着小波基之间没有冗余,能够有效地表示信号的所有信息。正交小波变换具有以下特性:
(3)
其中
是狄拉克delta函数,表示小波基之间的正交性。这种正交性保证了小波变换系数能够准确表示信号的各个特征,同时避免了信息丢失。
此外,小波变换具有良好的重构性质。通过小波变换获得的系数,可以利用反变换将信号从小波域重构回原始信号。其重构公式为:
(4)
这说明,通过适当地选择小波基函数,信号可以通过变换系数进行完全重构。
3. 支持向量机
支持向量机(Support Vector Machine, SVM)是一种监督学习算法,广泛应用于分类和回归问题。SVM通过构建一个最大化分类间隔的超平面,将数据集中的不同类别进行有效分离,从而实现分类任务。其核心思想是寻找最优的超平面,使得不同类别的样本之间的间隔(Margin)最大化,同时允许一定程度的误分类(Soft Margin)。
3.1. 支持向量机的线性分类
3.1.1. 超平面的定义
在一个二维空间中,超平面是分隔数据的直线;而在高维空间中,超平面是一个
维的平面(其中d是数据的维数)。假设数据点为
,其对应的类别标签为
,则超平面的数学表示为:
(5)
其中:
是法向量,表示超平面的方向;b是偏置项,表示超平面到原点的距离。
3.1.2. 分类决策函数
分类决策的依据是数据点x到超平面的距离:
(6)
当
时,分类为正类(+1);当
时,分类为负类(−1)。
3.1.3. 间隔的定义
支持向量机的目标是找到一个超平面,使得两个类别之间的最小间隔最大化。对于任意数据点
,其到超平面的几何间隔为:
(7)
其中:
是数据点的类别标签;
是法向量的欧几里得范数。最小间隔为所有点的几何间隔中的最小值:
(8)
支持向量机通过最大化最小间隔来实现分类。
3.1.4. 最优超平面的求解
为了找到最优超平面,SVM转化为一个凸优化问题。目标是最大化几何间隔,同时满足所有数据点的分类正确性约束:
(9)
通过引入拉格朗日对偶法,可以将目标函数表示为最小化法向量的二次范数:
(10)
约束条件为:
。
这是一个典型的凸优化问题,可以通过求解得到
和b。
3.2. 软间隔支持向量机
在实际问题中,数据通常不是线性可分的,因此需要允许一定程度的误分类。这种情况下,引入松弛变量
,软间隔支持向量机的目标函数为:
(11)
约束条件为:
。
其中:
表示第i个样本的误分类程度;
是正则化参数,用于权衡间隔的最大化与误分类的容忍度。
3.3. 核函数与非线性分类
3.3.1. 核函数的引入
对于非线性可分数据,SVM通过核函数将数据映射到高维空间,使其在高维空间中线性可分。核函数
定义为隐式的高维特征映射:
(12)
其中
是将数据从低维空间映射到高维空间的映射函数。
常用的核函数如表1所示:
Table 1. Table of commonly used kernels
表1. 常用的核函数表
线性核 |
|
多项式核 |
|
高斯核(RBF核) |
|
Sigmoid核 |
|
3.3.2. 对偶问题与支持向量
通过核函数,SVM的对偶问题可以表示为:
(13)
约束条件为:
。
其中
是拉格朗日乘子,则最终的分类决策函数为:
(14)
4. 基于小波变换的智能图像分类(WT-SVM)
在生物医学图像分类任务中,图像特征的准确提取和分类是核心挑战。为了提高分类的准确性与效率,本文将小波变换和支持向量机(SVM)相结合,形成一种高效的图像分类算法WT-SVM。小波变换用于提取图像的多尺度特征,SVM则利用其强大的分类能力对提取的特征进行分类。算法步骤如下:
1) 数据预处理:首先对输入的乳腺癌组织病理学图像进行数据预处理,主要包括图像归一化和噪声去除两个步骤。归一化的目的是将图像的像素值标准化到统一的范围内,从而减少不同成像条件对分类结果的影响;而噪声去除则通过滤波技术提高图像质量,减少外界干扰。
2) 小波特征提取:在预处理后的图像基础上,采用离散小波变换(DWT)进行多尺度分解。通过选择合适的小波基(如Daubechies或Haar小波)和分解层数,将图像分解为低频子带和高频子带,分别提取整体结构和边缘细节特征。随后,对子带系数进行统计分析,提取均值、能量、标准差等多种特征,形成初始的特征向量。
3) 支持向量机分类器训练:在特征选择完成后,使用标注的训练数据集对SVM分类器进行训练。将特征向量与其对应的类别标签(良性或恶性)输入SVM模型,通过优化超参数(如正则化参数C和核函数参数)构建最优分类超平面。此过程通过最大化分类间隔,确保模型在高维特征空间中的泛化能力。
4) 测试与分类预测:对测试数据集中的图像重复数据预处理、小波特征提取和特征选择的步骤,生成与训练数据相同格式的特征向量。将这些特征向量输入训练好的SVM分类器,得到分类结果(良性或恶性)。
5) 性能评估:根据测试数据的分类结果,计算模型的性能指标,包括准确率、灵敏度、特异性和F1分数等。这些指标用于评估算法的分类效果,同时验证其在乳腺癌组织病理学图像分类任务中的实用性和鲁棒性。具体如图1所示:
Figure 1. Flow chart of intelligent image classification algorithm based on wavelet transform
图1. 基于小波变换的智能图像分类的算法流程图
5. 评价指标
本文采用了准确率(Accuracy)、精确率(Precision)、召回率(Recall)以及F1值作为算法的评价指标,用于衡量本算法在图像分类任务中的性能。这些指标从不同角度评估算法的分类效果,能够全面反映分类器在实际应用中的优劣。以下是对各指标的详细说明:
1) 准确率(Accuracy):准确率是指分类器正确分类的样本数占总样本数的比例,用于衡量分类器的总体性能,计算公式为:
(15)
其中,TN为分类器正确预测为负类的样本数。准确率越高,说明分类器对整体样本的预测能力越强。
2) 精确率(Precision):精确率是指分类为正类的样本中,实际为正类的比例。它用于衡量分类器对正类样本的准确性,计算公式为:
(16)
其中,TP为分类器正确预测为正类的样本数,FP为错误预测为正类的样本数。精确率高表明分类器对正类的判断较为准确,误判较少。
3) 召回率(Recall):召回率是指实际为正类的样本中,被正确分类为正类的比例。它反映了分类器对正类样本的覆盖能力,计算公式为:
(17)
其中,FN为分类器错误预测为负类的正类样本数。高召回率表明分类器能够有效检测出绝大多数的正类样本。
4) F1值:F1值是精确率和召回率的调和平均,用于综合评价分类器的性能,特别是在数据类别不平衡的情况下表现较为突出,计算公式为:
(18)
F1值平衡了精确率和召回率的权重,是一个兼顾两者的评价指标。
6. 乳腺癌组织病理学图像分类
为了验证本文算法在乳腺癌组织病理学图像分类任务中的性能,本文采用了BreakHis数据集进行实验。BreakHis数据集包含了不同分辨率的乳腺癌组织切片图像,涵盖了良性和恶性两种类型。根据数据集中的类型分布,本文针对二分类问题进行了实验,旨在测试提出的融合小波变换与支持向量机(SVM)算法WT-SVM的优越性和鲁棒性。
在小波变换的应用中,选择合适的小波基与分解层数是影响特征提取效果的关键因素之一。小波基的选取直接决定了图像分解后的尺度特征和细节信息的表现,因此在乳腺癌组织病理学图像的分类任务中,选择具有良好平滑性、紧支撑性和频率分布的小波基至关重要。为此,本文针对不同的小波基进行了详细的实验和对比分析,最终选择了Daubechies 4 (Db4)小波基作为最佳选择。实验中,本文对不同小波基进行了分类性能测试,并根据分类准确率(Accuracy)、灵敏度(Sensitivity)、特异度(Specificity)等指标进行了综合评估。各小波基在乳腺癌图像分类中的表现如表2所示,表3是不同分解层数下的实验结果。
Table 2. Classification performance of different wavelet bases
表2. 不同小波基的分类表现
算法 |
准确率 |
精确率 |
召回率 |
Haar小波 |
78.3% |
76.1% |
80.5% |
Db2小波 |
81.5% |
79.7% |
83.2% |
Db4小波 |
89.2% |
87.5% |
91.0% |
Symlet2小波 |
84.7% |
82.3% |
86.1% |
Table 3. Experimental results under different decomposition levels
表3. 不同分解层数下的实验结果
分解层数 |
分类准确率 |
灵敏度 |
特异度 |
计算时间(秒) |
2层 |
83.4 |
81.5 |
85.2 |
15.3 |
4层 |
89.2 |
87.5 |
91.0 |
24.7 |
6层 |
88.1 |
86.0 |
89.5 |
38.1 |
8层 |
87.4 |
85.6 |
89.2 |
53.2 |
从表2的结果来看,Db4小波基的分类准确率、灵敏度和特异度均明显优于其他小波基。因此,Db4小波基被最终选为本文的最佳选择。由表3可得,随着分解层数的增加,分类准确率和灵敏度略有提升,但计算时间和特征冗余也逐渐增加。在2层和4层的比较中,4层分解提供了较高的分类准确率和灵敏度,并且计算开销相对适中,表现出较好的性能。6层和8层分解虽然在准确率和灵敏度上有所提高,但其计算时间大幅增加,且特征冗余也影响了模型的泛化能力。因此,选择4层分解成为最优的方案。
为了进一步验证其效果,本文将该算法WT-SVM与传统的SVM算法进行了对比实验,两种算法均采用高斯核,其实验结果如表4所示:
Table 4. Comparison results of two classification experiments
表4. 二分类实验对比结果
算法 |
准确率 |
精确率 |
召回率 |
F1值 |
SVM |
85.37% |
86.48% |
86.14% |
86.33% |
WT-SVM |
99.18% |
99.21% |
98.99% |
99.01% |
表2中列出了传统SVM算法和本文算法在二分类任务中的主要性能指标,包括准确率、精确率、召回率和F1值。根据实验数据,传统SVM算法的分类性能如下:准确率为85.37%,精确率为86.48%,召回率为86.14%,F1值为86.33%。虽然传统SVM算法表现出了不错的分类能力,但其各项指标均明显低于本文提出的算法。
具体来说,本文算法在二分类实验中表现出了显著的性能提升。首先,准确率方面,本文算法达到了99.18%,较传统SVM算法提高了近14个百分点。这表明,本文算法能够更好地识别乳腺癌组织图像中的良性与恶性样本。其次,精确率为99.21%,召回率为98.99%,F1值为99.01%。这些指标的提升表明,本文算法不仅能精确分类正类(恶性肿瘤),同时也能够有效地识别出大多数的恶性样本,保证了较低的假阳性和假阴性率。
此外,F1值的提升尤为显著,F1值达到99.01%,进一步验证了本文算法在平衡精确率与召回率方面的优越性。F1值较传统SVM算法的86.33%大幅提高,表明本文算法在应对乳腺癌病理图像数据集中的类别不平衡问题时,表现出了更强的综合能力。
综合来看,实验结果充分证明了本文算法在乳腺癌组织病理学图像分类中的卓越性能。相比于传统SVM算法,本文算法能够更准确地识别良性和恶性肿瘤组织,并且在分类精度和鲁棒性方面均表现出了明显的优势。这些结果表明,融合小波变换与支持向量机的算法不仅能够有效提高分类性能,而且具有较强的实际应用价值,尤其适用于医学图像分析领域中的复杂任务。
7. 结论
本文提出了一种结合小波变换与支持向量机(WT-SVM)的乳腺癌组织病理学图像分类算法。该算法通过小波变换提取图像的多尺度特征,捕捉不同频率的局部信息,再利用SVM构建最优超平面进行精确分类。实验结果表明,WT-SVM在分类性能上显著优于传统SVM,能够准确识别乳腺癌组织的良恶性,降低假阳性和假阴性率,表现出良好的鲁棒性和稳定性。此外,WT-SVM对不同类型的乳腺癌图像具有较强的泛化能力,适应不同噪声和分辨率变化。总体而言,WT-SVM在乳腺癌病理图像分类中表现出高准确性和效率,具有广泛的应用前景,尤其在医学影像分析和疾病诊断领域,为自动化诊断系统提供了有效的技术方案。未来工作可进一步优化小波变换参数,探索更多特征提取方法,并结合深度学习等技术,提高分类性能和处理速度,推动其在临床应用中的实际落地。
致 谢
本研究是在崔丽鸿老师的悉心指导下完成的。崔老师在研究过程中给予了我们无私的帮助和指导,从选题、研究方法的确定,到实验设计、数据分析,再到论文的撰写,每一个环节都倾注了她的心血。她严谨的学术态度、丰富的专业知识和敏锐的科研洞察力,为我们指明了研究方向,帮助我们克服了重重困难。
同时,我们还要感谢北京化工大学数理学院和信息科学与技术学院的各位老师和同学,他们在学习和生活中给予了我们很大的支持和帮助。感谢所有支持和帮助我们的家人和朋友,他们的理解和支持是我们不断前进的动力。
最后,我们还要感谢为本研究提供资助的项目,感谢他们的支持使我们的研究得以顺利进行。
基金项目
本研究得到了北京化工大学“大学生创新创业训练计划”项目的资助。该基金为本研究提供了必要的资金支持,确保了实验设备的购置、数据采集和分析等工作的顺利进行。
NOTES
*共同第一作者。