1. 引言
在科学与工程领域,从流体运动、热传导到输运与材料建模,广泛的前向问题均可表述为偏微分方程(PDE) [1]。其目标是:在给定初始或边界条件、系数或源项的情况下,计算满足连续域上控制定律的解场[2]。尽管成熟的数值求解器能提供可靠解,但现代工作流程往往需要在参数扫描、优化循环或实时决策流程中重复进行PDE求解,此时计算负担便成为主要瓶颈[3] [4]。
神经算子近年来已发展为多查询场景下一种数据驱动的替代方案。与传统局限于固定离散化网格的代理模型不同,神经算子旨在学习函数空间之间的映射关系,并被证明在广泛条件下可作为通用算子逼近器[5] [6]。经过训练后,可通过对新的输入进行快速预测来分摊昂贵模拟的计算成本,从而为参数化偏微分方程族实现可扩展的代理建模。在代表性架构中,傅里叶神经算子(FNO) [7]通过在傅里叶域学习模态混合,实现了高效的全局卷积操作,在基于网格的偏微分方程基准测试中表现出优异的性能。其扩展架构如因子化傅里叶神经算子(FFNO) [8],通过跨空间维度分解谱混合操作,进一步提升了高维场景的可扩展性[9]。与此同时,研究者也探索了拉普拉斯神经算子(LNO) [10],通过替代性的谱参数化方式更好地适应瞬态响应,LNO即为该方向的典型代表。尽管取得这些进展,在复杂物理场景中,特别是当长期动力学行为与精细结构特征均至关重要时,实现稳健的算子学习仍是一个待解决的开放挑战[1] [11]。
一个核心难点在于,许多现实世界PDE的解无法用单一、稳态的谱特征充分描述。其主导模态可能随时间演变,且微小的建模误差在长时间推演预测过程中会不断累积,特别是在对流、湍流或激波等复杂流态中[12]。基于傅里叶的算子继承了固定傅里叶基的便利性,然而当解的谱特征呈现时变特性时,依赖单一固定的学习谱滤波器会限制其适应性,并可能导致长期预测的稳定性下降。拉普拉斯域参数化提供了一种互补视角,能更自然地表示瞬态动力学行为,但要精确捕捉快速振荡特征或长程相互作用,往往需要更丰富的展开项,例如更多极点和基项,这会增加计算成本,并引发表达能力与效率之间的权衡[13] [14]。上述观察揭示了现有方法普遍存在的动态表示瓶颈,在长时间跨度上,现有算子往往难以保持对演化模态的精确且稳定的表示。
另一个问题涉及信息在算子网络中的传递方式。许多神经算子通过单一流对特征进行变换,其谱内容在线性映射和非线性激活的反复混合中传递。由于缺乏显式的频率感知分离或带限约束,分辨率变化和非线性变换可能引发类似混叠的谱折叠现象,并导致高频分量逐渐衰减[15]。然而在物理系统中,高频结构,如尖锐界面、薄边界层和涡核,具有至关重要的诊断与预测价值。当这些分量在深层特征传播过程中被削弱时,生成的场可能变得过度平滑,并丢失关键的小尺度细节保真度[16]。这揭示了现有设计存在信息通路瓶颈:当前架构未能充分保护高频、物理敏感信息在深度传播过程中的完整性,从而在物理细节最关键之处损害了准确性。
受上述两大瓶颈的驱动,本文提出了通道分解神经网络算子框架(Channel-Decomposed Neural Operator, CDNO),同时瞄准动态模态建模与频率保持特征传播。为应对动态表示瓶颈,CDNO采用拉普拉斯域相关的极点留数表示法。通过可学习的极点与留数对主导系统响应进行参数化[10] [17],该模型能够显式地捕获演化的动态模态及其时域贡献,从而提升长期预测的稳定性,并支持对瞬态行为的高效建模。此外受频率感知算子学习的启发,本文设计的通道分解抗混叠架构解决了信息通路瓶颈[18] [19]。CDNO并非在单一流中混合所有频谱内容,而是将特征通道分解为互补的频率分量,通过频率感知滤波器进行并行处理,并进行受控融合,以减轻谱折叠效应并在各层间保持精细尺度信号。重要的是,这两个部分被有机地整合在一个统一的算子框架内,使得CDNO能够以更贴合瞬态系统行为的表示方式来学习动力学,同时在深度传播过程中保持谱的完整性。
本研究的贡献可概括如下:
1) 统一的动态谱算子框架。本文提出了将拉普拉斯域动态建模与频率感知通道分解集成于单一架构的神经算子框架,同时处理长期模态演化和精细尺度的谱保真度。
2) 极点留数动态参数化方法。开发了拉普拉斯域极点留数表示法,通过可学习的极点和留数显式建模主导动态模态,从而提升瞬态及长期预测的稳定性。
3) 通道分解抗混叠传播机制。设计了一种具有受控融合的多分支频率感知通路,以缓解频谱折叠现象并在深度网络中保持精细尺度分量。
4) 高频保真度诊断体系。提出了系统的分布内、外评估方法,用于量化神经算子的高频衰减程度,并据此分析分布偏移下模型的鲁棒性。
2. 相关工作
2.1. 神经算子
神经算子旨在直接学习函数空间之间的偏微分方程解映射,从而实现对不同输入和参数的摊销式推理。Lu et al. [16]提出的DeepONet模型引入了分支–主干架构,通过将输入函数编码(分支)与坐标相关的基函数(主干)相结合来表示算子,为数据驱动的算子逼近奠定了早期理论基础。在此基础上,谱神经算子因其在规则网格上的高效性,已成为主流方法之一。Li et al. [7]提出的FNO通过将傅里叶模态与可学习的谱权重混合来执行全局卷积,能有效建模长程空间依赖性。为提升高维场景的可扩展性,Tran et al. [8]提出的F-FNO将多维谱混合分解为一系列低成本变换序列,在保持全局感受野的同时显著降低了内存与计算开销。
除傅里叶基函数外,多种架构致力于提升对求解域、几何形状及局部结构的适应性。Cao et al. [10]提出的LNO通过拉普拉斯特征函数构建几何自适应基函数,为融合不规则区域及边界效应提供了理论依据。基于小波的算子(如Tripura和Chakraborty [20]提出的WNO)引入多分辨率分析以增强空域与频域的局部化能力,从而提升了奇异性与多尺度特征的表征效果。与此同时,卷积神经算子(如Raonic et al. [21]提出的CNO)将卷积处理扩展至函数空间,为局部邻域相互作用提供了计算高效且具有强归纳偏好的替代方案。尽管取得了这些进展,现有算子仍面临一个反复出现的矛盾:谱方法虽能高效处理全局相互作用,但在非稳态动力学下易产生过度平滑或适应性受限的问题;而几何自适应或局部化设计虽提升了灵活性,却往往需要在保持长程与高频保真度之间进行精细权衡。
2.2. 极点留数表示法
极点留数表示法[10]是拉普拉斯域表征系统动态响应的经典方法。其核心思想是将系统的传递函数表示为复指数项的线性组合,每项由复平面上的极点(决定模态的衰减率与振荡频率)及其对应的留数(决定模态的振幅与相位)进行参数化。该方法通过可学习的复数极点和留数,将系统响应显式分解为若干主导模态的叠加,从而自然描述衰减、振荡及稳态行为等物理过程。相较于依赖全局谐波基的傅里叶变换,极点留数表示法具备更优的瞬态捕捉能力与长期稳定性,它无需周期性假设,仅需少数主导极点即可高效表征系统动力学特性。然而,为精确建模具有丰富高频分量或复杂衰减特性的响应,往往需要更多极点项,导致模型复杂度与计算效率之间的权衡。在科学机器学习领域,该表示法已被整合至LNO等架构中,以增强瞬态物理场的建模精度与长期预测稳定性。研究表明,将可学习的极点留数参数化与深度神经网络结合,能够自适应提取动态模式,为解决非平稳、多时间尺度的物理模拟问题提供了新的表征途径。
3. 通道分解神经算子(CDNO)
3.1. 理论基础
问题设定:本研究聚焦于基于神经算子求解偏微分方程。考虑一个有界开集
,以及在其上定义的两个可分离巴拿赫空间:输入函数空间
和解函数空间
。设
表示由该偏微分方程所确定的解算子。
给定一个从输入函数空间
上的概率测度
中采样得到的独立同分布观测数据集
,其中
。神经算子的目标是构建一个参数化的映射
以逼近真实的解算子
。该学习过程可归结为以下经验损失最小化问题:
(1)
其中
是衡量函数间差异的损失泛函。
极点留数(PR)方法:线性时不变系统的动态特性,可由其传递函数在复平面上的极点与留数完全表征。这一强大的数学工具为分析系统的瞬态响应与稳态响应提供了统一框架,而拉普拉斯变换正是应用该工具的核心。
定义3.1 (拉普拉斯变换):对于函数
,其拉普拉斯变换
定义为:
(2)
其中
为复频率变量。拉普拉斯变换的一个关键特性在于其能将空间域中的微分运算转化为复频域中的代数运算。具体而言,对于函数
及其一阶、二阶导数,存在以下关系:
(3)
(4)
这些性质表明,拉普拉斯变换本质上已包含了系统的初始条件,因此其天然适用于刻画由初始状态激发的动态演化过程——即系统的瞬态响应。
Figure 1. Preview of the CDNO architecture. The core of the CDNO architecture lies in integrating Fourier and Laplace transforms through its channel decomposition structure
图1. CDNO架构预览。CDNO架构的核心在于通过其通道分解结构,实现了傅里叶变换与拉普拉斯变换的融合
在复频域中,系统的传递函数
可表示为有理分式形式。通过部分分式分解,可将其展开为一系列一阶项的叠加:
. (5)
其中
为极点,
为对应的留数。本文将积分核的建模从传统的傅里叶域拓展至拉普拉斯域,从而使神经算子具备显式学习与表征物理系统动态模态的能力。
3.2. 通道分解神经算子(CDNO)
框架概览:通道分解神经算子(CDNO)框架遵循神经算子的主流设计范式,其结构如图1所示。所提通道分解神经算子
同样采用编码器–解码器架构,并由多个堆叠的非线性积分算子层构成。基于此,CDNO算子
定义如下:
(6)
其中
为提升投影算子,将输入函数从低维空间映射到高维空间;
表示
个非线性积分算子层;
为输出投影算子,将函数从高维特征空间映射回解空间。此处
表示模型中所有可学习参数。
非线性算子层
:在CDNO中,核算子的定义如下:
(7)
其中
是激活函数,
是第
层的特征函数,
是一个线性变换,而
是由CDNO参数化的积分核,其具体设计将在下文详细阐述。
通道分解与积分核参数化:CDNO的核心创新在于其可学习的通道分解机制,该机制将输入特征按比例分解至三条互补的并行路径。总体而言,对于输入特征
,们沿通道维度将其分解为三个互斥且互补的子集:
。相应的积分和参数化为三个子核的协同作用,其形式如下:
(8)
其中,FNO子核
在傅里叶域捕获全局稳态特征,FrFT子核
在统一的时频域处理非平稳信号,其中
表示阶数为
的分数阶傅里叶变换,
为可学习参数。
PR子核则用于在拉普拉斯域表征系统的瞬态响应与动态模态。其子核公式如下:
, (9)
(10)
其中
为拉普拉斯域中的复变量,
与
分别为可学习的极点与留数。极点
的实部和虚部分别控制对应模态的衰减率与振荡频率,共同刻画系统的瞬态响应。
是位于虚轴上的极点,
为对应的可学习留数。此项等价于傅里叶级数展开,旨在捕获解场中的多尺度稳态或周期分量,从而保持高频保真度。该子核的输出可解释为模态的叠加:
. (11)
此处,极点的实部与虚部分别决定了各模态的衰减率与振荡频率。该子核使CDNO能够直接表征系统的固有动态模态。
通用逼近定理:本文聚焦于二维情形,将定义域设定为二维环面
。输入函数空间与输出函数空间分别为Sobolev空间
与
。假设真实解算子
为一连续映射。那么,对于任意
,CDNO存在一个
,使得下式成立:
(12)
该定理表明CDNO具备逼近任意连续算子的能力,为其作为通用函数逼近器的角色提供了理论保证。
4. 数值实验
本节通过在多样化的偏微分方程基准测试集上,将CDNO与代表性的神经算子基线模型进行全面对比实证评估。此外,还设置了经典的规则网格场景以及涉及不规则几何或非欧几里得离散化的更具挑战性的案例,旨在评估模型在不同物理机制下的准确性、鲁棒性与泛化能力。
4.1. 实验设置
基准数据集:在广泛使用的规则网格基准上进行评估。如图2所示,包括达西流、伯格斯方程和纳维–斯托克斯方程[7] [22]。为进一步测试几何与离散化鲁棒性,并将评估扩展至不规则几何场景,涵盖结构网格上的翼型与管道流动,以及点云形式表示的弹性力学问题[23]。
Figure 2. Overview of the operator learning task applied to different partial differential equations (PDEs). The top section showcases three specific PDE examples: Darcy flow, airfoil, and Burgers’ equation. The bottom section presents three additional PDE examples: Navier-Stokes equations, elasticity, and pipe flow
图2. 算子学习任务在不同偏微分方程中的应用概览。上半部分展示了三个具体的PDE实例:达西流、翼型绕流和伯格斯方程。下半部分呈现了另外三个PDE实例:纳维–斯托克斯方程、弹性力学和管道流
Table 1. Main results on all benchmark datasets compared with 9 baseline methods: evaluated using the mean relative
error , where lower values indicate better performance; “Improvement Percentage” refers to the error reduction relative to the second-best model in each benchmark; “-” indicates inability to handle the benchmark; color coding represents baseline ranking (blue: best, green: second-best, orange: third-best)
表1. 在所有基准数据集上与9种基线方法对比的主要结果:采用平均相对
误差进行评估(数值越低表示性能越好);“改进百分比”指相对于各基准测试中次优模型的误差降低幅度;“-”表示无法处理该基准任务;颜色标注代表基线模型排名(蓝色:最优,绿色:次优,橙色:第三优)
Model |
Elasticity-G |
Navier-Stokes |
Burgers |
Airfoil |
Darcy |
Pipe |
U-NET [2015] |
0.0535 |
0.1782 |
0.0142 |
0.0087 |
0.0080 |
0.0068 |
RESNET [2016] |
0.0877 |
0.2765 |
0.0214 |
0.0391 |
0.0541 |
0.0111 |
LNO [2023] |
0.0600 |
0.3076 |
0.0241 |
0.0190 |
0.0267 |
0.0138 |
FNO [2020] |
0.0484 |
0.0974 |
0.0093 |
0.0164 |
0.0088 |
0.0066 |
F-FNO [2021] |
0.0475 |
0.1402 |
0.0123 |
0.0083 |
0.0071 |
0.0070 |
WNO [2022] |
0.0697 |
0.2015 |
0.0144 |
0.0175 |
0.0201 |
0.0088 |
KNO [2023] |
- |
0.2021 |
- |
- |
- |
- |
UNO [2022] |
0.0469 |
0.1511 |
0.0273 |
0.0068 |
0.0121 |
0.0104 |
CNO [2023] |
0.0482 |
0.1479 |
0.0282 |
0.0116 |
0.0061 |
0.0062 |
CDNO (Ours) |
0.0452 |
0.0772 |
0.0056 |
0.0072 |
0.0051 |
0.0052 |
INCREMENT% |
3.6% |
20.7% |
39.7% |
−5.8% |
16.3% |
16.1% |
基线模型:在六项基准测试中将CDNO与九种代表性模型进行比较,包括通用视觉网络:U-Net [24]、ResNet [25],专用神经算子:FNO [7]、LNO [10]、F-FNO [8]、WNO [20]、KNO [26]、UNO [27]和CNO [21]。对于使用点云输入的弹性力学基准,所有模型均采用相同的基于坐标的预处理策略,以确保对不规则几何体的标准化处理[18]。
评估指标:采用平均相对误差
作为主要评估指标:
(13)
该指标通过真实解场的幅值对预测误差进行归一化,从而便于在不同物理尺度与解振幅的数据集之间进行公平比较[23]。
实现细节:所有模型均采用Adam优化器进行1000轮训练,以最小化平均相对
误差。实验在Linux系统上进行,硬件配置包括AMD EPYC 7763 64核处理器与 NVIDIA RTX 4090 GPU (24 GB VRAM)。
4.2. 定量分析
Figure 3. Visualizes the prediction results and associated errors of seven neural operator models on the Navier-Stokes equations
图3. 七种神经算子模型在纳维–斯托克斯方程上的预测结果及对应误差可视化
Figure 4. The upper panel showcases Navier-Stokes flow (Left) and Darcy flow (Right). The middle panel showcases Burgers’ equation (Right) and elasticity (Left). The bottom panel showcases pipe flow (Left) and airfoil (Right). For comparison of predicted outputs, we plot the heatmap of the difference between ground truth and prediction
图4. 上栏展示了纳维–斯托克斯流动(左)与达西流(右);中栏展示了伯格斯方程(右)与弹性力学(左);下栏展示了管道流(左)与翼型绕流(右)。为对比预测输出,我们绘制了真实解与预测值之间差异的热力图
表1展示了在涵盖规则网格与不规则离散化的六项PDE基准测试中的定量比较结果。总体而言,CDNO在五项任务上取得了最佳性能,相对于最强基线平均提升了15.1%,且最大增益集中在凸显算子学习互补挑战的代表性压力测试中。Burgers方程包含对谱平滑与数值耗散尤为敏感的陡峭梯度和快速演化结构,CDNO将误差从基线最佳模型FNO的0.0093降低至0.0056,相对提升达39.7%。Navier-Stokes方程因长程相互作用和随时间演化的精细涡旋结构而更具挑战性,CDNO将误差从基线最佳模型FNO的0.0974改善至0.0772,提升20.7%。在点云弹性力学任务中,输入为非欧几里得数据且采样随实例变化,CDNO取得了0.0452的误差,较最佳基线UNO的0.0469小幅提升3.6%,表明所提设计在规则网格外仍具竞争力。除上述压力测试场景外,CDNO在相对平滑或几何主导的问题上也取得了稳定优势:在Darcy任务上达到0.0051,最佳基线CNO为0.0061,提升16.3%,在Pipe任务上达到0.0052,最佳基线CNO为0.0062,提升16.1%。唯一例外是Airfoil任务,CDNO的0.0072略逊于最佳基线UNO的0.0068,下降5.8%,这表明几何主导的案例可能更倾向于不同的归纳偏置。
4.3. 定性分析
纳维–斯托克斯对比:图3展示了七种神经算子的预测结果与对应误差图。CDNO显示出整体最清晰的误差分布,其误差强度更弱,且在空间上比其他方法更少呈现结构化的分布模式。相比之下,多个基线模型表现出高度组织化的条纹状误差模式,表明其在捕捉流动结构时存在系统性偏差,而非纯粹的随机残差噪声。从视觉上看,CDNO的预测与真实场形态更为接近,而LNO、WNO等模型则显示出更大振幅的残差及更明显的空间伪影。
跨基准对比:图4进一步比较了FNO、F-FNO和CDNO在六项基准测试中的表现,更全面地展示了CDNO在哪些方面提升了场的保真度。在伯格斯方程上,CDNO更准确地保留了陡峭过渡区,并减少了高梯度区域周围的带状残差,这与该基准测试中其显著的定量提升结果一致。在解相对平滑的达西流任务中,所有方法生成的场在视觉上均较为合理,而CDNO通常表现出更弱且空间更集中的残差,表明其在整个求解域上具有更一致的改进。在点云弹性力学任务中,CDNO与真实解保持更一致的结果,误差图中与几何相关的失配更少,这与它在非欧几里得离散化下的竞争力表现相符。对于几何影响显著的流动任务,CDNO在管道流任务中减少了某些与边界相关的伪影,而在翼型绕流任务中视觉差异较为细微,这与定量观察结果一致,即翼型绕流是CDNO唯一未取得最佳性能的基准测试。
综上所述,这些定性结果与表1形成互补,表明CDNO的增益在易出现过度平滑或多尺度动力学的场景中最为明显,同时在不规则离散化问题上仍保持竞争力。
4.4. 消融研究与补充结果
为了系统评估CDNO中各个模块的贡献,本节进行了全面的消融研究。如表2所示,移除任何核心组件都会导致模型性能显著下降,验证了该架构设计的必要性。值得注意的是,移除任一模块均会导致性能大幅下滑,这充分证明了通道分解架构内部各模块之间具有紧密耦合性与功能互补性。
不同通道分配比例:为深入探究CDNO中通道分解抗混叠机制的性能,在达西流、伯格斯方程和纳维–斯托克斯方程上系统评估了不同通道分配比例。如表3所示,当通道比例为2:3:3时,模型获得最佳综合性能。然而,不同的通道配置在不同数据集上引发显著性能差异。例如,1:3:4的比例在达西流任务上表现优异,但在纳维–斯托克斯方程上却明显逊于其他配置。值得注意的是,同一数据集中由通道比例变化引起的性能差异最高可达18%,这一现象充分揭示了通道分解抗混叠结构具有显著的优化潜力与任务自适应能力。
数据效率:实验结果表明,CDNO展现出卓越的数据利用效率。如图5所示,CDNO仅使用80%的训练数据,即可达到与次优模型CNO相当的性能。如表4显示,当训练数据比例超过20%时,CDNO始终优于所有其他对比模型。尤为值得注意的是,在相同数据条件下,CDNO的绝对性能显著超越传统FNO架构。这一发现进一步印证了CDNO作为算子学习领域中高效且鲁棒的解决方案所具有的突出价值。
噪声鲁棒性:本研究通过在训练数据中引入不同强度的高斯噪声,系统评估了噪声对算子性能的影
响。具体而言,在输入数据中添加参数化为
的高斯噪声,其中
表示数据集的总体方差,
为指定的噪声强度。实验结果(图5右半部分)表明,即使在训练集中加入0.5%强度的噪声,CDNO的性能仍优于在无噪声条件下训练的CNO算子(见表5)。这一发现充分证实了CDNO对噪声数据具有卓越的鲁棒性。
Table 2. Comprehensive ablation study of CDNO: Investigating the impact of individual components on Navier-Stokes and Darcy flow benchmarks (“w/o” indicates performance without the corresponding component)
表2. CDNO综合性消融实验:探究各独立组件在纳维–斯托克斯与达西流基准测试中的影响(“w/o”表示移除对应组件后的性能表现)
Design |
Navier-Stokes |
Darcy |
w/o mix |
0.0988 |
0.0071 |
w/o FNO |
0.2082 |
0.0292 |
w/o FrFT |
0.1082 |
0.0076 |
w/o PR |
0.1032 |
0.0079 |
CDNO |
0.0772 |
0.0051 |
Table 3. Channel decomposition-mixing architecture: investigating the impact of different channel ratios on Navier-Stokes, Burgers, and Darcy flow benchmarks
表3. 通道分解–融合架构:探究不同通道分配比例对纳维–斯托克斯方程、伯格斯方程及达西流基准测试的影响
PR:FNO:FrFT |
1:3:4 |
2:3:3 |
1:4:3 |
1:1:2 |
Darcy |
0.0056 |
0.0051 |
0.0057 |
0.0058 |
Burger |
0.0058 |
0.0056 |
0.0061 |
0.0065 |
Navier-Stokes |
0.0950 |
0.0772 |
0.0874 |
0.0921 |
Figure 5. Comprehensive ablation study of CDNO: (a) Impact of channel decomposition ratios on Navier-Stokes benchmark performance; (b) Comparative performance on Darcy flow with varying decomposition strategies; (c) Noise robustness analysis across varying decomposition strategies
图5. CDNO的综合性消融实验分析:(a) 通道分解比例对纳维–斯托克斯基准性能的影响;(b) 不同分解策略下达西流任务的性能对比;(c) 不同分解策略下的噪声鲁棒性分析
Table 4. Performance comparison of neural operators on the Darcy benchmark under different training data ratios. “/” indicates poor performance in
error, and bold values represent the optimal performance
表4. 不同训练数据比例下达西流基准测试的神经算子性能对比。其中“/”表示
误差性能较差,加粗数值代表最优性能
Ratio |
UNET |
FNO |
UNO |
F-FNO |
LNO |
CNO |
CDNO |
0.2 |
/ |
0.2678 |
0.2734 |
0.2573 |
0.0718 |
0.0159 |
0.0173 |
0.4 |
/ |
0.0176 |
0.0183 |
0.0153 |
0.0415 |
0.0097 |
0.0088 |
0.6 |
0.1234 |
0.0146 |
0.0153 |
0.0142 |
0.0332 |
0.0076 |
0.0068 |
0.8 |
0.0107 |
0.0122 |
0.0134 |
0.0095 |
0.0293 |
0.0068 |
0.0063 |
1.0 |
0.0080 |
0.0088 |
0.0121 |
0.0071 |
0.0267 |
0.0061 |
0.0051 |
Table 5. Performance comparison of neural operators on the Darcy flow problem under different training set noise levels. “/” indicates that the
error performance does not meet the standard, and bold values mark the optimal results
表5. 不同训练集噪声水平下达西流问题的神经算子性能对比。其中“/”表示
误差性能未达标,加粗数值标注最优结果
Noise% |
UNET |
FNO |
UNO |
F-FNO |
LNO |
CNO |
CDNO |
0 |
0.0080 |
0.0088 |
0.0121 |
0.0071 |
0.0267 |
0.0061 |
0.0051 |
0.001 |
0.0094 |
0.0097 |
0.0115 |
0.0089 |
0.0269 |
0.0065 |
0.0054 |
0.01 |
0.0105 |
0.0114 |
0.0124 |
0.0095 |
0.0275 |
0.0067 |
0.0055 |
0.1 |
0.0113 |
0.0124 |
0.0126 |
0.0106 |
0.0281 |
0.0072 |
0.0055 |
0.5 |
/ |
0.0139 |
0.0138 |
0.0125 |
0.0285 |
0.0077 |
0.0057 |
Table 6. Performance comparison of neural operators on the out-of-distribution Navier-Stokes benchmark. The model is trained on data with viscosity coefficient
and tested under
. For the low-frequency (snapshot 1~10) and high-frequency (snapshot 11~20), the prediction error is provided separately, with the second row showing the percentage increase in error relative to the baseline (
)
表6. 分布外纳维–斯托克斯基准测试的神经算子性能对比。模型在粘度系数
的数据上训练,并在
条件下测试。针对低频(快照1~10)与高频(快照11~20)模态分别给出预测误差,其中第二行显示相对于基准条件(
)的误差增长百分比
NS viscosity coefficient |
FNO |
UNO |
F-FNO |
LNO |
CNO |
WNO |
CDNO (Ours) |
|
0.0974 |
0.1511 |
0.1402 |
0.3076 |
0.1479 |
0.2015 |
0.0772 |
Low Frequency |
0.1827 |
0.2188 |
0.2038 |
0.3870 |
0.1909 |
0.2989 |
0.1706 |
+87.5% |
+44.8% |
+45.4% |
+25.8% |
+29.1% |
+48.3% |
+120.8% |
High Frequency |
0.782 |
0.5510 |
0.7489 |
0.5699 |
0.5401 |
0.5540 |
0.6751 |
+702% |
+265% |
+434% |
+85% |
+265% |
+175% |
+774% |
分布外泛化能力[28]:如表1所示,在纳维–斯托克斯数据集上的评估表明,CDNO在分布内设置(粘度
)下取得了0.0772的相对
误差,显著优于所有基线模型,展现出优异的拟合能力。
为评估模型的分布外泛化性能,在分布外条件(粘度
)下对训练好的模型进行测试。如表6所示,CDNO在低频模态(快照1~10)上表现出卓越的泛化能力,其
误差为0.1706,显著优于所对比的基线模型。然而,在高频模态(快照11~20)上,CDNO出现了灾难性的误差崩溃,其
误差高达0.6751,相较于其在原始数据集上的误差急剧增加了774%。更具科学意义的是,观察到所有模型在高频模态(快照11~20)上均出现系统性失效,误差普遍高达0.55。这一现象揭示了当前神经算子在处理分布外高频动力学时存在一个普遍瓶颈。
训练稳定性:如图6所示,CDNO在训练过程中展现出显著的稳定性,其损失曲线的振荡幅度明显低于FNO和F-FNO等基线模型。CDNO在训练早期(约200轮)即已达到FNO的最佳性能,随着训练继续进行,其性能进一步提升并显著超越所有基线方法。这一结果表明,CDNO不仅在短期内更高效,从长远来看也更具潜力,是一种更优且更灵活的解决方案。
Figure 6. Learning curves for Darcy flow (left), Burgers’ equation (middle), and Navier-Stokes equations (right), where the horizontal axis denotes training epochs and the vertical axis represents the
error
图6. 达西流(左)、伯格斯方程(中)和纳维–斯托克斯方程(右)的学习曲线,其中横轴为训练轮次,纵轴为
误差
实验结果表明,本文提出的通道分解混合架构在求解涉及激波、湍流等强非线性物理场的偏微分方程时,展现出显著的性能优势。在六项基准测试中,CDNO相比当前最佳神经算子平均提升了15.1%的性能,其中在包含丰富高频瞬态特征的伯格斯方程上提升高达39.7%,在极具挑战性的纳维–斯托克斯方程上也有20.7%的显著提升。同时,系统性评估也揭示了一个根本性瓶颈:当面对对物理参数敏感的高频测试模态时,包括CDNO在内的所有模型均出现泛化性能的显著下降。
5. 结语
5.1. 结论
本文提出了通道分解神经算子(CDNO),这是一种通过创新的通道分解机制将显式动态建模与频率感知处理相统一的全新框架。理论分析证实了其具有通用逼近能力,而广泛的实验表明,CDNO在六项偏微分方程求解基准测试中均达到了最先进的性能,并在富含高频瞬态特征的伯格斯方程上取得了突破性提升。这验证了其在协同解决现有神经算子在动态表示与信息保真度方面的核心瓶颈上的有效性。
更重要的是,系统的分布式分析揭示并证实了一个普遍存在的高频崩溃现象:包括CDNO在内的所有先进算子,在面对物理敏感的高频模态时,其泛化性能都会出现灾难性下降。这一发现表明,该领域的根本挑战现已超越了单纯的架构优化,触及了纯数据驱动范式在捕捉偏微分方程底层物理机制方面的固有局限。
5.2. 展望
当前工作的主要局限在于,CDNO对高频物理模态的建模仍依赖于数据分布,在应对由显著不同机制主导的极端情况时,缺乏物理一致性的根本保证。未来的研究必须超越纯粹的数据驱动范式,探索将物理原理与数据智能相结合的新路径。