1. 引言
目前在发达国家中老年性黄斑变性(AMD)是导致视力丧失的主要原因之一。此外,由于人口老龄化,其患病率也在不断增加,预计到2040年,全球患有AMD的人数将增长到2.88亿[1]。目前,AMD还无法治愈,只能通过尽早地发现采取治疗以缓减其进展。因此,对于早期AMD的检测至关重要,过去的十年中,对AMD诊断以及治疗方法的探索大大增加[2]。但由于AMD尚未明确的发病机理,这项研究仍然极具挑战。
眼睛作为视觉系统的核心器官,承担着光传导的关键职能。其工作机制在于,首先精准地捕获外界光线,随后将其转换为细胞能够识别和处理的信号,最终通过视神经把信号高效地传输至大脑,从而使我们能够感知周围的世界,实现视觉功能[3]。眼底视网膜作为眼睛重要的一部分,它是一种分层结构,每一层都有自己的特点,AMD会影响视网膜的某些层,致使其结构发生变化,这也为AMD的早期诊断提供了可以探索的方向。在过去的十几年中,眼部成像技术极大地方便了眼部疾病患者的诊断,其中光学相干断层扫描(OCT)发展非常迅速,它是一种非接触、无创性的生物医学成像技术,广泛用于眼科疾病的诊断和治疗。
OCT图像能够提供视网膜的层次结构,可以很好地观察到视网膜各层可能含有的病变特征,本文的实验使用的便是早期AMD患者和正常对照组的视网膜OCT图像。临床上,视网膜OCT图像已经被证明对AMD的诊断和治疗具有极大的价值,它可以提供黄斑的详细活体图像,分辨率为5~7微米[4]。早期AMD的特征是存在软性视网膜黄斑硬化症,视网膜色素上皮(RPE)层和光感受器发生变化[1]。因此,对于早期AMD视网膜OCT图像纹理标志物的探索,可以重点关注视网膜的这些区域。此外,AMD同样会影响视网膜的外核层(ONL),因为ONL中含有较多的光感受器细胞,ONL层的萎缩和受损会干扰视觉信号从光感受器向后续神经元的传递,进而影响整个视觉通路的功能[2]。
2. 方法
2.1. 数据来源
本实验使用公开数据集[5],该数据集包含数千张经过验证的视网膜OCT图像,这些图像在文章[6]中进行了描述和分析。本实验选取了数据集中正常对照组(NC)和早期AMD患者的视网膜OCT图像,并且筛选出其中完整且清晰的图像用于后续实验。
2.2. 数据预处理
对筛选出的图像用基于U-net的网络进行视网膜分割(如图1所示),共分为9层——视网膜神经纤维层(RNFL)、神经节细胞–内丛状层(GCIPL)、内核层(INL)、外丛状层(OPL)、外核层(ONL)、肌样体区(MEZ)、光感受器外节(OS)、色素上皮细胞层(RPE)、脉络膜(Choroid)。
Figure 1. Schematic diagram of retinal layers
图1. 视网膜分层示意图
2.3. 纹理特征计算
对于分割出的视网膜各层,利用Python的Mathotas包,基于灰度共生矩阵计算了Haralick特征的前13个纹理特征值,具体纹理特征如表1所示,其中公式具体说明参考[7]。
Table 1. Texture features and their formulas
表1. 纹理特征及其公式
纹理特征 |
公式 |
Angular Second Moment (ASM) |

|
Contrast |

|
Correlation |

|
Sum of Squares: Variance |

|
Inverse Difference Moment |

|
Sum Average |

|
Sum Variance |

|
Sum Entropy |

|
Entropy |

|
Difference Variance |

|
Difference Entropy |

|
Info. Measure of Correlation 1 (IMOC1) |
|
Info. Measure of Correlation 2 (IMOC2) |
|
2.4. 统计分析和分类模型
对视网膜各层提取的纹理特征,使用Kolmogorov-Smirnov检验来确定数据的正态性。当样本数据为正态分布时,采用学生t检验来评估每个纹理特征在两组之间的差异;否则采用Mann-Whitney U检验,p < 0.05认为差异具有统计学意义。检验结果p值显著的视网膜层及其纹理用于模型的分类。我们评估了4种常见的机器学习算法的性能,包括极端梯度增强(XGBoost)、光梯度增强机(LightGBM)、支持向量机(SVM)和逻辑回归(Logistic Regression)。所有的统计分析和机器学习模型构建均使用Python (3.8)完成。
3. 实验结果
3.1. 统计分析结果
视网膜的光感受器区域主要包括ONL、MEZ和OS层,RPE是视网膜色素上皮细胞层这些区域皆是AMD影响主要累及的部位。图2显示了这些层的纹理特征在AMD组与NC组之间的差异对比情况,且所有纹理特征均已进行标准化处理,以确保数据的可比性和一致性。在图2中,Group 0表示NC组,Group 1表示AMD组。其中,“*”标注出统计检验结果中p值小于0.05的情况,而“***”表示p值小于0.001的显著差异。
具体来看,ONL层(如图2(a)所示),作为光感受器细胞分布较多区域,其纹理变化较为显著。除了Correlation这一纹理特征外,其余纹理特征均呈现出显著差异,表明AMD对ONL层的纹理产生了较大的影响。MEZ层和RPE层的情况与ONL层较为相似,同样在绝大多数纹理特征上与NC组存在一定的显著差异,这进一步说明AMD对这些视网膜区域的影响具有一定的共性。OS层的纹理特征差异显著性相对较小。
3.2. 模型分类结果
ONL、MEZ、OS和RPE层纹理特征的分类结果如图3所示,其中图3(a)是LightGBM模型的分类结果,四条曲线(分别对应MEZ、ONL、OS、RPE层)均位于对角线上方,表明LightGBM模型在各层上的分类效果均优于随机猜测。其中,MEZ层的曲线最为靠近左上角,且AUC值高达0.952,显示出该模型在MEZ层上具有出色的分类性能,能够准确地区分AMD与CN样本。ONL层的AUC值为0.945,分类效果也较为优异,仅次于MEZ层。RPE层的AUC值0.939,表明在该层上模型也能提供较好的分类能力。然而,OS层的AUC值仅为0.588,接近0.5。在低假阳性率(False Positive Rate, FPR)区域,各曲线的真阳性率(True Positive Rate, TPR)上升较快,尤其是ONL,MEZ和RPE层,这意味着模型在这些层上能够以较低的误报率获得较高的正例识别率,对于临床诊断具有重要意义,即可以在较少误诊正常样
Figure 2. Box plots of texture features of ONL, MEZ, OS and RPE layers
图2. ONL,MEZ,OS和RPE层纹理特征箱线图
Figure 3. ROC curves
图3. ROC曲线
本为AMD的情况下,尽可能多地检测出真正的AMD患者。
图3(b)是XGBoost的分类结果,与LightGBM模型类似,XGBoost模型的四条曲线也均在对角线之上,表明其具有一定的分类能力。MEZ层的AUC值为0.949,略低于LightGBM模型在该层的表现,但仍然显示出良好的分类性能。ONL层的AUC值为0.944,与LightGBM模型在ONL层的结果相近。RPE层的AUC值为0.947,相较于LightGBM模型在RPE层有所提升,说明XGBoost模型在该层上可能具有更好的适应性。OS层的AUC值为0.595,虽然比LightGBM模型在OS层的结果略高,但仍然处于较低水平,提示在OS层上两种基于树的模型(LightGBM和XGBoost)都面临一定的挑战。
图3(c)是逻辑回归模型的分类结果,与前两种基于树的模型相比,逻辑回归模型的四条曲线整体位置较低,AUC值也相对较小。MEZ层的AUC值为0.670,ONL层为0.717,RPE层为0.773,OS层为0.560。这表明逻辑回归模型在各层上的分类性能均不如LightGBM和XGBoost模型,尤其是在OS层,其AUC值甚至低于0.6,说明该模型在区分AMD与CN时,对于OS层的特征利用不够充分,或者OS层的特征与逻辑回归模型的线性假设不太匹配。曲线上升较为平缓,尤其是在低FPR区域,TPR的上升速度较慢,这意味着使用逻辑回归模型时,需要更高的FPR才能获得较高的TPR,即误诊正常样本为AMD的概率相对较高,才能检测出更多的AMD患者,这在临床应用中可能会导致更多的假阳性结果,增加患者的不必要检查和心理负担。
图3(d)是支持向量机(SVM)的分类结果,SVM模型的曲线特征与逻辑回归模型较为相似,四条曲线的AUC值分别为:MEZ层0.677,ONL层0.712,RPE层0.749,OS层0.549。同样,SVM模型在各层上的分类性能也相对较弱,尤其是在OS层,AUC值最低,仅为0.549。
4. 讨论
根据以上统计分析和模型分类的结果,综合来看,LightGBM和XGBoost模型在视网膜不同层上区分AMD与CN的性能优于逻辑回归和SVM模型,尤其是在MEZ和ONL层,表现出较高的AUC值和良好的曲线趋势,能够以较低的误报率获得较高的正例识别率,具有较好的临床应用潜力。然而,在OS层上,所有模型的表现都相对较差,AUC值较低,这一分类结果也与统计检验的结果相匹配,可能表明OS层的纹理变化并不明显。
早期的AMD在视网膜形态还没有明显变化时,就对视网膜RPE层和光感受器区域产生了潜移默化的影响,脂质聚集物、有机废物和β-淀粉样肽(drusens)开始出现并逐渐积累,这些drusens的积累会导致Bruch膜增厚,进而影响RPE细胞的功能,可能导致其死亡[8]。随着年龄增长,Bruch膜会发生生化和解剖学变化,导致通过Bruch膜的营养物质流动减少,这进一步加剧了RPE细胞的功能障碍,使得RPE单层出现色素减退区域,并与轻度至中度视网膜变性和视力丧失相关[9]。RPE细胞在正常情况下负责调节视网膜下的液体平衡,但在AMD中,这一功能受到损害。drusens的存在会改变RPE细胞的液体流出,导致液体在视网膜下积聚[10]。这些早期的变化可能不会带来视网膜形态上的明显变化,但会对RPE层的纹理产生影响。此外,由于RPE细胞的功能障碍和死亡,光感受器细胞无法得到正常的支持和营养供应,从而导致光感受器变性和死亡[8] [9],ONL、MEZ层都是光感受器区域,可能导致了这两层的纹理变化。
5. 总结
本研究围绕基于机器学习的视网膜纹理标志物在区分早期年龄相关性黄斑变性(AMD)和正常对照组方面展开了较为深入的探究,取得了一些比较有意义的发现,可能有助于今后临床早期AMD的诊断。在研究方法上,采用公开数据集的视网膜OCT图像,经过严格筛选确保数据质量后,利用先进的基于U-net的网络进行精准的视网膜分层,成功划分出包括视网膜神经纤维层(RNFL)、神经节细胞–内丛状层(GCIPL)等在内的9层结构。随后,基于灰度共生矩阵运用Python的Mathotas包计算各层的前13个Haralick纹理特征值,并通过科学的统计检验方法(Kolmogoro-Smirnov检验、学生t检验或Mann-Whitney U检验)筛选出具有显著差异的纹理特征,为后续模型构建提供了关键的特征数据。
实验结果呈现出明显的规律性和差异性。统计分析表明,在AMD与正常对照组之间,视网膜的ONL、MEZ和RPE层的纹理特征存在显著差异,其中ONL层除Correlation外的大部分纹理特征均表现出高度显著差异,充分显示出AMD对该层纹理的深刻影响;MEZ层和RPE层也呈现出类似的显著差异趋势,进一步验证了AMD对这些区域的共性影响。而OS层的纹理特征差异显著性相对较弱,暗示其在AMD早期阶段的变化相对不明显或具有独特的变化模式。
在模型分类性能方面,LightGBM和XGBoost模型展现出卓越的优势。它们在各层的分类效果均显著优于随机猜测,其中MEZ层的AUC值分别高达0.952 (LightGBM)和0.949 (XGBoost),在低假阳性率区域能够快速提升真阳性率,表明这两个模型在该层具有出色的区分能力和临床应用潜力;ONL层的AUC值也分别达到0.945 (LightGBM)和0.944 (XGBoost),表现同样优异;RPE层的AUC值在两个模型中也处于较高水平。相比之下,逻辑回归和SVM模型的分类性能较弱,尤其是在OS层,AUC值甚至低于0.6,曲线上升平缓,在临床应用中易产生较高的假阳性率,增加患者负担。
从AMD的病理生理角度分析,早期AMD虽未引起视网膜形态的显著改变,但已对RPE层和光感受器区域产生了实质性的影响。drusens的逐渐积累致使Bruch膜增厚,严重干扰了RPE细胞的正常功能,甚至导致其死亡,进而破坏了视网膜下的液体平衡,引发液体积聚,最终导致光感受器变性和死亡,这些病理变化在一定程度上反映为视网膜纹理特征的改变,为本研究的方法提供了合理的生物学解释。
综上所述,本研究通过对视网膜纹理特征的深入分析和模型性能的评估,为早期AMD的诊断提供了有价值的参考依据和潜在的技术支持。然而,研究仍存在一定的局限性,如OS层虽然同样属于光感受器区域,但其纹理特征并未体现出明显变化,这一原因尚未得到解释,未来研究可考虑扩大样本量、优化特征提取方法和改进模型算法,以提高早期AMD诊断的准确性和可靠性,为AMD患者的早期干预和治疗创造更有利的条件。