1. 引言
抑郁症作为一种高发病率的心理疾病,会对患者的生活、工作、人际关系造成严重的负面影响,这就使得抑郁症的精确诊断和及时治疗非常必要。抑郁症患者有一系列特异性的表现,这些特点虽然反映在患者的行为上,但其根源仍要追溯到大脑的变化。人类大脑拥有非常复杂的结构,它作为人类的行为控制中枢,通过脑区之间的共同协作来控制人的全部活动。不同脑区可能负责不同的工作,但只有脑区间的功能整合才能使人类产生完善的行为,即各脑区间呈现网络结构。研究表明,抑郁症患者与正常人之间存在大脑网络特性的差异 [1] ,这些差异为抑郁症的诊断筛查提供了的数据支持,这就使得构建和分析大脑网络成为该领域的研究重点。现有技术中,功能性核磁共振成像能够非侵入性的反应大脑不同区域的活动水平变化,为脑网络构建提供数据支持。Biswald等人 [2] 通过分析静息状态下的fMRI数据,揭示了大脑中多个区域间的功能连接。此外,Greicius等人 [3] 的研究通过fMRI发现了默认模式网络(DMN),这是在大脑休息时活跃的一组区域,对理解大脑如何在不进行特定任务时组织活动至关重要。Fox和Raichle [4] 的综述进一步阐明了大脑活动的自发波动及其与功能网络的关系,强调了fMRI在揭示大脑内部操作的潜力。这些研究不仅证实了fMRI在大脑活动水平变化监测中的效能,而且为构建和理解复杂的脑网络提供了强有力的数据支持。
近些年快速发展的图神经网络技术成为备受关注的脑图分析方法。图神经网络是专门设计用于处理图这一非欧几里得数据的深度学习模型,比传统机器学习有更强的表征能力,比全连接网络、卷积神经网络有更强的特异性。常用于对fMRI脑网络数据进行分类的GNN模型有GCN、GraphSage和GAT,这些模型都基于消息传递框架,通过聚合邻居节点的信号来更新节点信息,在不破坏图的拓扑结构的情况下,将神经网络的关注范围从节点扩大到全图。许多研究表明,图神经网络非常适合脑图相关的分类任务 [5] [6] [7] 。
虽然图神经网络在fMRI数据分类问题中表现优异,但现有研究仍然存在一些问题。第一,这些研究使用的大脑图是两两图,即图中的一条边只能连接两个节点,代表两个脑区之间存在功能连接,研究假设信息交互只在一对脑区中发生。而在现实状况下,人类的某一个活动要依靠多个脑区的共同协作才能完成,信息交互同时发生在多个脑区间,两两图很难表征这些复杂的交互信息,导致有效特征的丢失 [8] 。第二,类似GCN、GAT这类图神经网络的训练过程中将图视为静态不变的,节点特征、节点间的交互不随神经网络数据的递进而变化,但事实上,随着上一层图神经网络对节点数据的聚合更新,图的整体结构包括节点间的关联度已经发生变化,如果下一层图神经网络仍然使用该图结构进行训练,将降低模型对图数据的适应性 [9] 。
为了解决上述问题,本研究使用超图建模人类大脑。超图是更一般化的图结构,可描述群体效应,而不像两两图那样仅描述成对节点间的关系,超图可以描述一个节点集的属性。超图的每条边可以连接任意数量的节点,模拟多个脑区之间的信息交互。Ma等人 [10] 使用超图来模拟大脑皮层的功能连接,结果表明超图模型能够有效地表示脑区间复杂的多边互动关系,这支持了超图作为分析大脑功能网络的有力工具的观点。Giusti等人 [11] 在其研究中展示了怎样使用代数拓扑工具来理解大脑数据中的高阶结构,他们利用了超图的概念来表征多个神经元之间的相互作用,这种方法有助于揭示大脑功能网络中的多节点交互模式。超图能够反映大脑脑区以及大脑局部网络之间的高阶信号交互,相比于两两图,更适合脑网络这种复杂的结构。近期的研究表明,在进行fMRI数据分析时,结合从超图中提取的高阶信息可以增强深度学习分类器的性能 [12] [13] 。本研究采用超图神经网络(Hypergraph Neural Network, HGNN)来提取大脑超图中对抑郁诊断有用的特征。为了增强超图神经网络对动态大脑超图的适应性,我们在每个超图神经网络层后用注意力机制重新计算超图结构。本研究做出了以下贡献:
1) 研究提出了适应性超图神经网络(AHGNN)进行抑郁症诊断。由于两两图只能有限地模拟大脑的工作模式,导致抑郁相关信息的丢失,因此我们采用了一种更精细的脑建模方法,保留了数据中的高阶交互特征。
2) 研究采用了一种可学习的策略来适应性地在模型训练过程中更新大脑超图结构,增强了模型的鲁棒性和训练效率。
2. 研究方法
2.1. 问题定义
模型训练在每个个体静息态fMRI数据中计算得到的大脑超图上展开。本研究将超图定义为
,其中
表示包含n个脑区的集合,
表示包含m个超边的集合,
是关联矩阵,表示超图的结构特征。我们用
表示该超图的特征矩阵。研究使用的模型框架如图1。
Figure 1. The overview of proposed framework
图1. 研究使用的模型框架
2.2. 自适应超图构建
以每个脑区为超边中心,使用k近邻(k-nearest neighbors, k-NN)算法找出与每个超边中心相似的节点,构成初始超边。图神经网络的每一层都通过聚合邻居节点信息来更新节点特征。与以往使用固定图结构的研究不同,我们会在每次节点特征更新后,通过自适应超图构建模块(AHC)重新计算节点之间的关系。这增强了后续的图神经网络层对更新数据的适应性。对于给定节点
,通过注意力机制计算其与现有超边
的相关性:
(1)
(2)
其中
是注意力模块的可学习矩阵。使用节点
与超边
连接的节点的平均相似度来度量
属于
的可能性。如果平均相似度高于某个特定数值,则建立节点
与超边
之间的联系,形成新的超边。经过自适应学习,将得到更新后的超图结构
,其更适应后续的图神经网络训练。
2.3. 超图神经网络
将fMRI数据转换为超图结构后,利用超图卷积网络 [14] 来分析数据的复杂空间信息,以学习更高级和更具表达力的节点特征表示,并捕捉脑区之间复杂的功能连接关系。本文中的超图卷积定义为:
(3)
其中
是可学习的超边权重矩阵,该矩阵初始化为单位矩阵,表示每个超边具有相同的初始权重。
是第l层超图卷积网络的可学习变换矩阵。
和
分别表示更新前和更新后的节点特征。
表示非线性激活函数。
和
表示用于归一化的度矩阵。对于节点
和超边
,它们的度被定义为:
(4)
其中
是超边e的权重,
是关联矩阵H中的对应的元素。超图卷积网络充分利用了大脑超图中的结构信息,从而更好地捕获脑区之间的关系。
2.4. 读出函数和损失函数
随后,我们将提取大脑超图的全局特征,把数据压缩到一个向量中,以方便下游的图级分类任务能顺利开展。本研究通过计算所有节点的平均信号来聚合空域信息:
(5)
表示最终的大脑超图信号向量。
本研究使用二元交叉熵损失来评估预测值和真实值之间的差异值,其定义为:
(6)
总的来说,本研究中提出的架构是超图卷积层和自适应超图构建模块的组合。模型见图1。使用大脑超图作为模型输入,整个框架旨在捕获嵌入在大脑超图中的复杂结构信息和数据中存在的时序变化特征。读出函数输出的汇总向量聚合了可用于抑郁症诊断的所有信息,之后利用MLP生成最终预测。
3. 实验及结果
3.1. 数据集
本研究在抑郁症脑影像大数据联盟(REST-meta-MDD)数据集上展开,该数据集由17个国内大学和医院的25个抑郁研究组提供 [15] 。数据集包含2428名被试,其中有1300抑郁症患者,1128名健康对照被试。被试年龄在12~82岁之间,且跨越了不同的教育水平。使用标准化的静息态fMRI数据处理(DPARSF)方法对来自不同站点的数据进行统一的预处理,以最小化预处理方法的异质性,降低数据噪声。最后将fRMI数据配准到CC200大脑模板,获得不同脑区的序列信号。
3.2. 实验设置
我们利用了3个具有跳跃连接、批归一化和边嵌入的HGNN层。实验使用Nvidia Tesla V100 GPU。模型在隐藏层中采用ReLU激活函数和初始学习率为0.001的Adam优化器。我们使用warm-up策略调整学习率,前20轮训练逐渐增加学习率,之后再逐渐将其减小。模型的批量大小为32个样本,模型训练持续200个批次。输入特征的维度为200 × 202。我们使用10折交叉验证进行模型的训练和评估,按照9:1的比例划分训练集和测试集,重复训练10次以确保实验结果的可靠性。
为了验证本研究提出的模型在抑郁诊断上的有效性,我们进行了一系列的基准测试,将以往研究中使用的经典机器学习模型作为基准模型。我们将随机树森林(RF)、支持向量机(SVM)、BrainNetCNN [16] 、图注意网络(GAT)与研究提出的适应性超图神经网络进行了比较。我们使用准确率、特异性、灵敏度、F1分数和AUC值这五种在分类任务中常用的性能指标对模型进行了评估。
3.3. 结果
Figure 2. The impact of adaptive hypergraph construction under different thresholds on model accuracy
图2. 不同超图构建阈限下的模型准确率
当使用注意力机制重新构建超图时,不同的阈限会导致每条超边所涵盖的节点数量的不同,进而影响模型的整体性能,所以本研究先考察了不同阈限值下的模型准确率,结果见图2,当阈限值设置为0.5时,模型表现最佳。随后将本研究的模型与其他四种基线方法的性能进行比较,结果如表1所示。具体来说,传统机器学习方法RF和SVM的准确率分别为62.18%和65.87%。基于图的GAT算法表现优于传统机器学习方法,其准确率达到65.33%。专门设计用于神经影像数据分类的BrainNetCNN展示了有竞争力的结果,准确率为63.96%。本研究提出的模型优于所有其他方法,实现了最高的71.41%准确率、72.12%的特异性、69.54%的敏感度、0.73的F1得分和0.78的AUC值。这些结果突出了图神经网络在捕获fMRI数据中的复杂关系以进行抑郁症分类中的有效性。在下一节中,我们会更深入地解释我们的结果及其对抑郁症诊断的意义。
Table 1. Classification performance of different methods
表1. 不同算法的性能比较
3.4. 消融实验
随后我们系统地进行了消融实验来分析HGNN和AHC对所提出模型的性能贡献。消融实验中,GCN (图卷积网络)被用作基线模型。表2中的实验结果展示了每个模块的重要性。初始模型实现了66.02%的准确率。当将HGNN集成到模型中时,我们观察到性能的显著提高,准确率上升至68.25%。这表明基于超图的脑网络建模方法对脑区复杂关系表征的重要性。 AHC模块的加入进一步提高了模型的性能,将准确率提高到71.41%。AHC适应性构建超图的能力有助于捕获数据中的复杂关系,特别是将敏感度提高到67.86%,这表明更好地识别了抑郁症患者,这是医学诊断所需的。
Table 2. The effect of proposed components on classification task
表2. 消融实验结果
4. 讨论
我们提出的适应性超图神经网络使用HGNN层捕获大脑超图中的高阶交互信息,使用AHC模块让大脑超图在训练过程中保持合理的结构。研究中使用了使用跳跃连接和批归一化等技术来促进模型训练期间的消息传递。实验结果表明,与经典的机器学习和图神经网络方法相比,我们的模型具有更好的性能。如表1所示,适应性超图神经网络在REST-meta-MDD数据集上实现了71.41%的平均准确率,相交于其他模型提高了4%至9%。
消融实验证明了模型中各组件的有效性。当我们用GCN层替换HGNN层时,忽略脑区之间的高阶相关性,导致模型性能显著下降。这一结果表明,脑中的复杂结构邻近关系对抑郁症诊断至关重要。该发现广泛支持了该领域其他研究工作。由于大脑皮层具有典型的网络结构,疾病预测不仅受成对相邻节点的限制,还受节点间复合邻近关系的影响。通过利用全局和局部图信息,高阶脑区交互信息有助于推断大脑的工作模式。
另一个引人注目的发现是AHC模块可以增强所提出模型的性能。因为HGNN层将通过更新节点特征嵌入来改变超图的结构,所以初始超图不适用于除第一层之外的其他层为了获得足够的鲁棒性,前人使用k-NN与k均值聚类结合来更新单次推理过程中的超图结构,这是一种计算成本高昂且依赖额外优化的方法 [17] ,会降低模型的训练效率。本研究利用学习策略为变化的大脑网络找到最合理的结构,可在较低的运算成本下完成目的。
5. 结论
在本文中,我们提出用适应性超图神经网络进行抑郁症fMRI数据的识别诊断。该模型以脑区间的功能连接为输入,并从中提取空间信息。研究考虑了抑郁症患者脑区间的高阶交互信息及其动态变化。我们将适应性超图神经网络应用于REST-meta-MDD数据集。实验结果表明,与所有基线方法相比,本研究所提出的模型性能更好,并获得了最先进的分类准确度。消融实验证明了模型中各组件的有效性。
本研究的最大的局限在于,没有考虑抑郁症的严重程度、患者的年龄和扫描期间的心理状态。每个个体的独特特征可能会影响抑郁症的发展变化,纳入这些额外的被试信息可能会提高模型的分类精度和泛化性能。