摘要: 卵巢病变的早期诊断对治疗和预后至关重要,但传统诊断方法存在解读差异。本研究提出了一种基于ResNet50深度学习网络的卵巢病变分类模型,结合Grad-CAM技术生成热力图,以增强模型的可解释性。通过对930张超声图像进行五折交叉验证,模型在区分正常、恶性、畸胎瘤、良性肿瘤交界性和巧克力囊肿等病理类型方面表现出较高的准确性(平均AUC为88.16)。热力图可视化显示,模型能够有效识别病变区域,特别是在恶性肿瘤和畸胎瘤的分类中表现出色。研究表明,该模型在卵巢病变的早期筛查和辅助诊断中具有重要应用价值,未来可进一步优化以应对复杂病例。
Abstract: Early diagnosis of ovarian lesions is crucial for treatment and prognosis, but traditional diagnostic methods are subject to interpretation variability. This study proposes an ovarian lesion classification model based on the ResNet50 deep learning network, combined with Grad-CAM technology to generate heatmaps, enhancing the interpretability of the model. Through five-fold cross-validation on 930 ultrasound images, the model demonstrated high accuracy in distinguishing pathological types such as normal, malignant, teratoma, borderline benign tumors, and chocolate cysts (average AUC of 88.16). Heatmap visualization revealed that the model effectively identified lesion areas, particularly excelling in the classification of malignant tumors and teratomas. The study indicates that this model has significant application value in the early screening and auxiliary diagnosis of ovarian lesions, and future work can further optimize the model to address complex cases.
1. 引言
卵巢病变是女性常见的妇科疾病,其早期诊断对治疗和预后至关重要。然而,传统诊断方法存在较大的解读差异,影响了诊断的准确性和效率。近年来,深度学习技术在医学影像分析中的应用逐渐增多,尤其是在病变区域的识别和分类方面表现出显著优势。ResNet50作为一种高效的卷积神经网络,在图像分类任务中表现出色。它通过引入残差连接,解决了深层网络中的梯度消失和退化问题,从而在图像分类、目标检测等任务中取得了更好的性能[1]。此外,Grad-CAM技术通过生成热力图,能够可视化AI模型的决策过程,帮助医生理解病变特征。这种技术不仅提高了模型的可解释性,还为临床诊断提供了新的视角[2]。在此背景下,本研究提出了一种基于ResNet50深度学习网络的卵巢病变分类模型,并结合Grad-CAM技术生成热力图,以增强模型的可解释性。通过对930张超声图像进行五折交叉验证,评估了模型在区分正常、恶性、畸胎瘤、良性肿瘤交界性和巧克力囊肿等病理类型方面的性能,并探讨了其在卵巢病变早期筛查和辅助诊断中的应用价值。
2. 方法
本研究采用了五折交叉验证和Grad-CAM热力图方案,验证了模型在不同阈值下的稳定性和准确度。
3. 结果
3.1. 模型性能
模型在五折交叉验证中表现出较高的准确性,平均AUC为88.16,精确率为84.1,召回率为83.98。ROC曲线和PR曲线显示,模型在不同阈值下的分类性能稳定。
3.1.1. 模型的评价指标
如表1所示。
Table 1. Evaluation indicators of different models
表1. 不同模型的评价指标
Model |
AUC |
Precision |
Recall |
Fold0 |
86.57 |
82.53 |
82.8 |
Fold1 |
91.04 |
87.06 |
87.1 |
Fold2 |
85.37 |
80.21 |
79.57 |
Fold3 |
89.24 |
86.4 |
86.02 |
Fold4 |
88.6 |
84.27 |
84.41 |
Average |
88.16 |
84.1 |
83.98 |
3.1.2. 综合五折模型的平均指标
共四种指标,如图1~4。
Figure 1. ROC curve
图1. ROC曲线
Figure 2. PR curve
图2. PR曲线
Figure 3. Confusion matrix
图3. 混淆矩阵
3.2. Grad-CAM热力图
热力图可视化显示,模型能够有效识别病变区域,特别是在恶性肿瘤和畸胎瘤和巧克力囊肿的分类中表现出较高的准确性。
3.2.1. 恶性卵巢肿瘤
热力图通常显示出局部高激活区域,这些区域对应于肿瘤的核心部分或异常组织。热点集中表明AI模型在这些区域检测到了高度可疑的恶性特征。与良性肿瘤相比,恶性卵巢肿瘤的热点边界通常较为模糊,反映了肿瘤的侵袭性和不规则生长模式。恶性卵巢肿瘤的热力图通常显示出较高的激活值(如深色区域),表明AI模型在这些区域检测到了高度可疑的恶性特征(如细胞异型性、核分裂象等) [3],如图4,图5。
Figure 4. Malignant ovarian tumor (multilocular, papillary)
图4. 恶性卵巢肿瘤(多房,乳头状)
Figure 5. Ovarian malignant tumor (cystic and solid echo, low resistance blood flow)
图5. 卵巢恶性肿瘤(囊实性回声,低阻力血流)
3.2.2. 良恶性交界性肿瘤
热力图通常显示出局部中等激活区域,表明AI模型在这些区域检测到了潜在的异常特征,但激活强度通常低于恶性肿瘤。边界相对清晰:与恶性肿瘤相比,良恶性交界性肿瘤的热点边界通常较为清晰,反映了肿瘤的局限性生长模式,如图6。
Figure 6. Ovarian junctional tumor (multilocular cystic solid mass with papillary protrusion on the inner wall)
图6. 卵巢交界性肿瘤(多房囊实性肿物,内壁见乳头凸起)
3.2.3. 良性肿瘤
良性肿瘤(如巧囊或畸胎瘤)的热力图通常显示出边界清晰的热点和均匀的热力分布,而恶性卵巢肿瘤的热力图则表现出边界模糊、不均匀的热力分布和高激活值。
巧克力囊肿巧囊的热力图通常显示出局部的高激活区域,这些热点可能对应于囊肿的壁或内部液体成分[4],如图7。畸胎瘤的热点反映了畸胎瘤内部的多成分结构(如脂肪、毛发、牙齿等) [4],如图8。
Figure 7. Ovarian chocolate cyst (thick wall, glassy echo)
图7. 卵巢巧克力囊肿(壁厚,毛玻璃样回声)
Figure 8. Ovarian teratoma (visible dough sign, bone or tooth)
图8. 卵巢畸胎瘤(可见面团征,骨骼或牙齿)
3.2.4. 正常卵巢
正常卵巢组织的热力图通常显示出低激活值和均匀的背景分布[5],如图9。
Figure 9. Normal ovarian tissue (echo of several follicles)
图9. 正常卵巢组织(数个卵泡回声)
讨论
1) 模型性能分析:ResNet50在卵巢病变分类中表现出较高的准确性,特别是在恶性肿瘤和畸胎瘤的分类中。然而,在良性肿瘤交界性和巧克力囊肿的分类中,模型的性能略有下降,可能与这些病变的复杂性和多样性有关。
2) 热力图分析:热力图显示,模型在诊断过程中重点关注了病变的核心区域及其周边组织密度和信号分布,显示了特别是在恶性及良性肿瘤和准确性。
AI模型在卵巢病变的早期筛查和辅助诊断中具有重要应用价值。热力图不仅能够帮助医生理解AI模型的决策过程,还能提供额外的诊断信息,从而提高诊断的准确性和可靠性。然而,复杂病例仍需结合临床医生的经验和病理学检查。
4. 结论
基于ResNet50的卵巢病变分类模型在区分不同病理类型方面表现出较高的准确性,特别是在恶性肿瘤和畸胎瘤的分类中。张等系统回顾了深度学习在卵巢癌诊断中的应用,指出ResNet50等深度学习模型在卵巢病变分类中表现出较高的准确性。文章还提到,结合热力图分析可以进一步提高模型的诊断性能[6]。Grad-CAM生成的热力图进一步揭示了模型在诊断过程中关注的区域,为临床医生提供了辅助诊断的依据。未来研究应进一步优化模型,探索其在复杂病例中的应用,以提高诊断的精准度和临床应用价值[5]。Esteva等人讨论了深度学习在医学影像分类中的挑战和机遇,强调了AI技术在辅助医生进行复杂病例诊断中的重要性。文章还提到,Grad-CAM等可视化技术有助于提高模型的可解释性[7]。Selvaraju详细介绍了Grad-CAM技术的原理和应用,展示了其在医学影像分析中的潜力。文章指出,Grad-CAM能够帮助医生理解AI模型的决策过程,从而提高诊断的透明度和准确性[2]。陈等人还探讨了深度学习在医学影像分析中的应用,特别是在病变检测和分类方面的进展。文章指出,深度学习技术在提高诊断准确性和效率方面具有显著潜力[8]。
综上,恶性卵巢肿瘤的热力图可以帮助医生快速识别肿瘤的核心区域和浸润范围,为诊断和治疗提供重要参考。此外,热力图可以显示肿瘤的边界和周围组织的激活情况,帮助医生制定更精确的手术计划。通过比较治疗前后的热力图,可以评估治疗效果(如肿瘤缩小或激活值降低)。
基金项目
本章节为作者提供“深圳市南山区科技局项目人工智能深度学习模型对卵巢肿瘤的预测分析NS2024069”的示例。
NOTES
*通讯作者。