1. 引言
偏微分方程(PDEs)是描述自然科学与工程领域中多种物理现象的基本数学工具。为求得其数值解,人们发展了多种基于网格的数值方法,如有限差分法(FDM) [1]、有限元法(FEM) [2]、以及有限体积法(FVM) [3],在多数规则域问题中表现良好,但其精度与稳定性高度依赖于网格质量。当面对复杂几何域、移动边界或高维问题时,网格生成与适配过程往往代价高昂且难以实现[4]。
为克服网格依赖的限制,研究者提出了一系列无网格方法[5],其中,Kansa等[6] [7]提出了基于径向基函数的求解PDEs方法。该方法通过在全域上构造径向基展开,可获得高精度解,但其系数矩阵为稠密形式,严重制约了大规模应用。为了减轻RBF方法的计算负担,研究者提出了多种稀疏化策略,如使用紧支撑径向基函数[8] [9]以及局部径向基函数配点方法(LRBFCM) [10] [11]。LRBFCM通过限制每个节点的局部邻域,从而将复杂度有效降低,同时保持较高的计算精度。
然而,LRBFCM在降低复杂度的同时对于参数选择更加敏感。其数值精度和稳定性直接受形状参数
影响。形状参数
控制径向基函数的平坦度与局部特性,不同取值会直接影响插值矩阵的条件数与逼近误差。针对RBF的形状参数的优化,已有研究提出了一系列改进策略。Rippa [12]最早提出基于留一交叉验证(LOOCV)的形状参数选择算法,在保证精度的同时减小条件数;Li等[13]进一步针对LRBFCM提出了自适应形状参数选择方法,在求解PDEs时显著提升了稳定性。Bai等[14]提出的物理约束径向基网络(PIRBN)也验证了通过浅层网络结构学习局部参数的可行性与优势。这些研究共同表明:形状参数的自适应调节在提高LRBFCM数值稳定性方面具有显著潜力。
另一方面,随着物理信息神经网络(PINNs) [15]等物理约束学习方法的兴起,将深度学习与传统数值方法相结合,为自动化参数优化提供了新的途径。近年来,研究者尝试通过端到端可微分的框架实现PDEs求解与参数学习的统一优化。例如,Wang等[16]提出了基于PINN的自适应基本解法,用以自动优化源点位置;Han等[17]进一步利用神经网络驱动的自适应参数选择策略,在局部基本解法中实现了对半径参数的自动调节。这些成果充分展示了机器学习在传统数值计算中引入“可学习参数优化”的潜力。
在此背景下,本文聚焦于局部径向基函数配点法中形状参数的自适应优化问题,提出了一种基于数据驱动的形状参数统一优化策略。该方法在离线阶段利用生成的PDEs样本数据训练神经网络模型,从而建立源项、边界条件与最优形状参数之间的映射关系;在在线阶段,模型能够针对任意给定的源项与边界条件快速预测出最优或近似最优的形状参数,避免了传统方法中繁琐的遍历搜索与重复优化过程。通过对Poisson方程和稳态对流扩散方程的数值实验验证表明,该方法在不同算子与边界条件下均能保持较高的精度与良好的稳定性,不仅显著提高了形状参数选取的自动化程度,也进一步增强了LRBFCM在不同类型PDEs问题中的适应性与鲁棒性。
本文的结构安排如下:第2节介绍径向基函数配点法的基本理论及其局部化形式;第3节给出数据驱动形状参数优化框架的模型构建与算法流程;第4节通过数值算例验证所提方法在不同问题下的性能表现;最后一节总结本文工作并讨论未来的研究方向。
2. 局部径向基函数配点法
根据配置策略的不同,径向基函数方法可分为全局近似和局部近似两类。全局方法也即Kansa方法采用所有中心点构建近似解,形成满矩阵系统,具有高阶精度但可能出现严重病态问题;局部方法则仅利用径向基函数在局部域上近似,形成稀疏矩阵系统,计算效率高,适用于大规模工程问题。在实际应用中,基函数类型与形状参数的选取需结合具体问题的物理特性与数值需求进行综合考虑。
考虑定义在区域
上的边值问题:
(1)
(2)
其中
为定义在区域内部的微分算子,
为作用于边界
上的边界算子,
为待求场变量,
和
分别表示域内源项与边界条件函数。
对于定义域
内的每个配点
,定义一个对应的局部子域
以及其关联的节点集:
(3)
其中
表示中心点,
为其最近的
个邻居节点。局部节点总数为
,参数
的选取通常保证
,以实现较高的计算效率。
在每个局部子域
内,近似函数
被表示为径向基函数的线性组合:
(4)
其中
为待求的局部展开系数,
为选定的径向基函数。将配点条件施加至
内所有节点,可得局部插值系统:
(5)
其中,
为局部系数向量,
为节点函数值向量,矩阵
为局部插值矩阵,其元素定义为
(6)
通过求解该系统,可得局部展开系数:
(7)
对于内部节点
,在局部近似函数上施加微分算子
有:
(8)
而对于边界节点
,施加边界算子
,得到
(9)
将式(8),(9)分别写为向量形式:
(10)
其中
与
为
的行向量,定义为
(11)
(12)
将局部系数表达式
代入式(11),(12)可得
(13)
为统一内部与边界节点的表达形式,定义组合算子向量:
(14)
于是,局部配点条件可统一表示为:
(15)
其中,
对应内部节点,
对应边界节点。通过将局部方程的贡献映射至全局节点编号系统,可组装得到全局稀疏线性系统:
(16)
其中,
为全局系数矩阵,
为全局右端向量,
为全局未知向量。矩阵
的第
行由局部算子向量
填充,其非零元仅对应于局部节点索引集
。
因此,所得全局系数矩阵呈稀疏结构,每一行仅含
个非零元素。这种稀疏性不仅大幅减少了存储开销,也显著降低了计算复杂度。该稀疏系统可通过迭代法或稀疏直接法进行高效求解,从而使LRBFCM在大规模数值模拟中表现出优良的计算性能和稳定性。
3. 网络架构
本文提出了一种结合数据驱动与局部径向基函数配点法的自适应形状参数学习框架,其整体结构如图1所示。该框架由两部分组成:形状参数学习网络的训练阶段与微调与求解阶段。第一阶段通过构造数据集并训练神经网络,实现形状参数的自动学习;第二阶段则基于训练得到的形状参数,结合LRBFCM算法求解目标问题,并在必要时可以进行联合优化以微调形状参数。
Figure 1. Network structure
图1. 网络结构图
3.1. 数据驱动的形状参数学习网络
神经网络用于学习从PDEs输入到最优形状参数的映射关系。对任意给定微分算子的PDEs式(2) (3),构造输入向量:
(17)
并定义形状参数预测网络
(18)
其中
为网络参数。本文该网络采用多层全连接结构,包含非线性激活函数以增强特征表达能力,实现从PDEs源项与边界条件到最优形状参数的非线性映射。
为了训练形状参数学习网络
,需构造包含丰富样本的训练数据集。本文构造参数化函数族
(19)
其中
为可控参数向量。通过随机采样
,生成不同解析解
。对每个样本函数,利用自动微分得到右端项与边界条件,从而获得输入输出对
。在线性系统
中,直接求解最优
计算代价高昂。
为避免显式求解大型稀疏系统,本文定义残差损失函数:
(20)
来衡量形状参数的优劣。最优形状参数由以下优化问题确定:
(21)
该优化可通过黄金分割法无导数搜索策略实现,避免了直接求解大规模稀疏线性系统的高成本与逐个遍历
。
最终,数据集可表示为
(22)
网络训练的目标函数为:
(23)
训练完成后,网络即可实现对同一微分算子下不同右端源项与边界条件的形状参数估计。
3.2. 求解与可微框架下的微调
直接求解模式下,对于给定的PDEs实例,利用训练好的网络预测形状参数
,
(24)
并将式代入LRBFCM算法框架中,构造稀疏线性系统:
(25)
并使用稀疏直接或迭代求解器获得数值解
。
在部分情况下,网络预测的
可能偏离最优值。为解决这些问题,本文提出了一种可微LRBFCM微调策略,该优化问题的形状参数
可在可微分计算图中通过反向传播实现,将
与
共同视为可优化参数,构建联合优化问题:
(26)
其中总损失定义为:
(27)
结构残差损失为:
(28)
Dirichlet边界条件的偏差惩罚项为:
(29)
本文的实验部分未进行微调训练,微调策略仅作为一种可选的进一步优化手段,用于当网络预测性能退化或PDEs问题发生较大变化时的自适应修正。
4. 数值结果
本章通过两个方程下的一系列基准测试算例,对所提出的数据驱动的局部径向基函数配点法形状参数统一优化策略的性能进行数值验证。数值解的精度采用逐点最大误差与相对
误差进行评价,定义如下:
(30)
(31)
其中,
表示在计算区域内均匀采样的一组评估点,
为数值解,
为解析解。为了对比的
公平性,网络均采用Adam优化器自适应调整网络参数,且统一将学习率初始化为10−3,迭代次数10,000次。此外,两个网络采用相同的宽度和深度,并对内部的超参数都进行随机正态分布初始化。为了评估形状参数优化的效果,本文在训练过程中保存损失函数值最小的10个模型作为候选,并对其进行独立测试。随后,将这些模型预测得到的形状参数结果与通过遍历法获得的最优形状参数进行对比。具体地,遍历形状参数
,在该区间内均匀取100个样本点,通过计算每个
下的相对
误差以确定全局最优的形状参数记为
。本方法基于PyTorch库实现。
4.1. Poisson方程
在不规则区域
中考虑Dirichlet边值问题
(32)
其中区域
,见图2,由极坐标下的参数曲线定义:
(33)
对于该方程,参考Li等[13]针对该Poisson方程的测试函数,选择9个基准测试函数作为Poisson方程的解函数,见表1。评估测试中,构造数据集样本个数
,配置点在内部取
均匀网格点作为内部配置点,取500个边界点,局部支撑域大小
,采用多二次径向基函数。
Figure 2. Collection points in the problem domain, including internal points (blue) and boundary points (red)
图2. 问题域上的配置点:内部点(蓝色)与边界点(红色)
Table 1. Benchmark problems for the Poisson equation
表1. Poisson方程基准测试问题
|
函数式 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
为了评估本文提出的形状参数统一优化策略的有效性,针对该方法优化得到的形状参数
与遍历形状参数同精确解比较得到最好的形状参数
,图3展示了
四个基准测试问题的结果,每个子图分别对应一个不同源项与边界条件设定的测试问题。从误差曲线可以看到,当
过小或过大时,插值矩阵分别趋于病态或过于平滑,导致误差显著增加,而在适中范围内可获得最优精度。
Figure 3. The relative
error curves with respect to the shape parameter
图3. 形状参数
的相对
误差曲线图
从结果可以看出,在这四个基准测试问题中,模型预测的
均与
非常接近,且均位于误差曲线最低点附近。这表明本文提出的方法能够有效学习拉普拉斯算子的最优形状参数分布,实现对不同源项与边界条件下问题的快速适配,而无需进行传统的逐一参数调优。需要特别说明是是,图3(c)中虽然模型预测的形状参数
与全局最优参数
几乎一致,但在该参数附近存在明显的数值不稳定区域:当
出现极小扰动时,求解误差增大。其根本原因在于,局部径向基函数离散系统的稀疏矩阵
在该区间呈现高度病态性,导致矩阵条件数急剧上升,从而使数值求解器在迭代过程中对舍入误差和扰动极为敏感,造成解的精度退化。整体而言,图3中的结果验证了数据驱动形状参数预测框架在Poisson方程中的准确性与泛化能力。本文进一步给出了四个基准问题在该方法框架下的数值解及对应的误差云图,见图4。图中每一行分别对应基准测试函数
,其中左列为本文方法得到的数值解分布,右列为相对于解析解的绝对误差分布。从图中可以看出,数值解能够准确反映解的主要变化特征;误差分布仅在局部边界区域存在轻微峰值。
为进一步评估预测参数与最优参数在数值精度上的一致性,本文提出的方法在不同基准测试函数
下的形状参数优化结果及其相对
误差对比,见表2。从表中可以看出,模型预测得到的
与遍历搜索的
在数值上基本一致,且两者对应的相对
误差基本在同一精度。其中,针对基准问题
等,模型预测形状参数的标准差较小,说明训练得到的网络在这些算例上具有较高的稳定性与泛化能力;而对于如
与
等部分算例,虽存在轻微波动,但整体误差依然保持在较低水平。
Figure 4. Numerical solutions (left) and pointwise absolute error distribution (right)
图4. 数值解(左)与逐点绝对误差分布(右)图
Table 2. Optimization results of shape parameters under different benchmark test functions
and their relative
error comparison
表2. 不同基准测试函数
下的形状参数优化结果及其相对
误差对比
|
|
|
|
|
|
2.0282 |
|
|
|
|
1.4227 |
|
|
|
|
1.0191 |
|
|
|
|
1.8264 |
|
|
|
|
1.4227 |
|
|
|
|
1.3218 |
|
|
|
|
1.4227 |
|
|
|
|
1.0191 |
|
|
|
|
1.2209 |
|
|
|
为评估本文提出方法的计算效率,需与传统优化形状参数的方法对比,目前主流的方法是基于交叉验证的统计方法,其基本思想是从数据集中删除一个数据点,然后重新计算模型权重,以此估计模型计算结果的质量。Rippa等人[12]提出了一种基于留一交叉验证的快速误差估计方法,该快速交叉验证方法需要基函数的权重以及逆矩阵的对角元素,但LRBFCM的局部化处理过程,使得LOOCV快速计算方法难以直接实现。若直接采用交叉验证方法,则需要进行原始的循环计算,这无疑会带来巨大的计算负担。因此本文采用Li等[13]提出的OC-LRBF方法进行对比,为保证实验结果的公平性,OC-LRBF方法Pytorch实现方式与本文所提方法保持一致。表3给出了不同基准测试函数
下OC-LRBF方法的运行时间及相对
误差。其中,在线训练时间为10,000次迭代下的训练时间;离线求解时间包括预测得到形状参数与求解,从在线训练到离线求解过程时间较短,表明该方法具有较高的计算效率。OC-LRBF方法由于采用了粒子群算法进行优化,设置粒子数为10,表中列出了达到收敛时的整体运行时间与相对
误差,该方法需要针对每个例子均需要进行单独的优化,而本文方法一次训练多次使用,更具有计算效率优势。
Table 3. Comparison of runtime (Seconds) between different benchmark test functions
and the OC-LRBF method
表3. 不同基准测试函数
下与OC-LRBF方法运行时间(秒)对比
|
在线训练时间 |
离线求解时间 |
运行时间(OC-LRBF) |
(OC-LRBF) |
|
420.1250 |
0.7369 |
181.7058 |
|
|
0.6645 |
183.0763 |
|
|
0.6281 |
181.8338 |
|
|
0.6995 |
180.5895 |
|
|
0.9011 |
182.7044 |
|
|
0.6625 |
182.4419 |
|
|
0.6726 |
182.6722 |
|
|
0.6822 |
113.3856 |
|
|
0.8355 |
190.1842 |
|
4.2. 对流扩散方程
考虑一个在二维区域
上的稳态对流扩散方程。
(34)
其中
为扩散系数,
分别为
方向与
方向的对流系数,边界条件为Dirichlet边界条件。
为验证所提出数值方法的精度与稳健性,本文选取了三个具有解析解的二维稳态对流–扩散问题作为基准测试,给定扩散系数
,
。评估测试中,构造数据集样本个数
,配置点在内部取
均匀网格点作为内部配置点,取500个边界点,局部支撑域大小
,采用高斯径向基函数。
第一个基准问题描述了平滑界面的对流传输过程,用于测试在处理尖锐梯度和边界层问题时的能力。其解析解为:
(35)
其中,
控制界面位置,
调节界面曲率,
表示界面厚度。
第二个基准问题采用了一个平滑且具有振荡特征的解析解,结合了指数与三角函数形式:
(36)
其中,
为波数参数,用以控制空间振荡频率。
第三个基准问题选用了一个多项式与三角函数复合形式的解析解:
(37)
为了进一步验证本文提出方法的有效性,图5展示了针对稳态对流扩散方程的三个基准测试问题中,形状参数
与相对
误差之间的关系曲线。每个子图分别对应不同的对流速度场与边界条件设定,用以评估该方法在非对称算子条件下的自适应预测性能。从图中可以观察到,误差曲线整体形态较Poisson方程更为复杂,呈现出多段振荡与局部极值。当
过小,插值矩阵趋于病态,数值震荡明显;当
过大时,径向基函数过于平滑,导致扩散误差增大。尽管误差曲线存在局部波动,模型预测的
与通过遍历获得的最优参数
在三组测试中仍高度一致,均位于全局最优区间内(如图5(a)~(c)所示)。这表明所提出的统一优化策略在对流扩散型问题中依然保持良好的预测准确性与稳健性,能够有效适应算子非对称性带来的插值误差传播。
Figure 5. The relative
error curves with respect to the shape parameter
图5. 形状参数
的相对
误差曲线图
针对三个对流扩散方程基准问题,图6展示了在本文方法框架下的数值解与对应的误差云图。每组子图中,左图为预测数值解分布,右图为相对于解析解的
误差分布。从图6(a)和图6(b)可以看到,数值解能够准确捕捉出平滑的对流主导流型结构,在对流方向上等值线清晰、变化平稳。误差分布主要集中在边界层与出流区域,且最大误差不超过10−5量级,表明模型预测得到的形状参数
能在非对称流场下保持稳定精度。图6(c)和图6(d)对应高频源项下的对流扩散问题,解的局部振荡明显增强。模型预测形状参数仍能在全域范围内维持误差低于10−4,主要误差集中于局部梯度突变区。对于图6(e)和图6(f)的复杂边界条件算例,数值解在边界过渡区仍能保持较好的连续性,误差分布整体平滑。这进一步验证了本文提出的数据驱动形状参数优化策略在稳态对流扩散问题中的有效性。
Figure 6. Numerical solutions (left) and pointwise absolute error distribution (right)
图6. 数值解(左)与逐点绝对误差分布(右)图
最后,在稳态对流扩散方程中,不同基准测试函数
下的形状参数优化结果及其相对
误差结果在表4中展示。从表中结果可以看出,本文方法预测的
与
在整体上比较接近,且相对
误差的差异均处于同一量级的量级,且在不同基准函数下的相对误差波动较小,说明该模型能有效学习算子级的参数规律。尽管对流扩散方程的算子具有非对称性,模型仍能稳定预测出与最优解相匹配的形状参数,体现出所提方法在非对称算子条件下的良好泛化能力与鲁棒性。表5给出了不同基准测试函数
下OC-LRBF方法的运行时间及相对
误差。
Table 4. Optimization results of shape parameters under different benchmark test functions
and their relative
error comparison
表4. 不同基准测试函数
下的形状参数优化结果及其相对
误差对比
|
|
|
|
|
|
3.0373 |
|
|
|
|
3.4409 |
|
|
|
|
4.3491 |
|
|
|
Table 5. Comparison of runtime (Seconds) between different benchmark test functions
and the OC-LRBF Method
表5. 不同基准测试函数
下与OC-LRBF方法运行时间(秒)对比
|
在线训练时间 |
离线求解时间 |
运行时间(OC-LRBF) |
(OC-LRBF) |
|
2158.3883 |
0.9315 |
314.3020 |
|
|
0.9039 |
313.8505 |
|
|
0.8941 |
313.7250 |
|
5. 结论
本文针对局部径向基函数配点法中形状参数选取问题,提出了一种基于数据驱动的统一优化策略。该方法通过离线阶段的神经网络训练,建立了形状参数与PDEs源项、边界条件之间的映射关系,实现了针对同一算子的一次性学习与快速预测。在在线求解阶段,模型可根据不同源项与边界条件自适应生成近似最优形状参数,从而显著降低传统方法中反复调参与搜索的计算代价。数值实验表明,该方法在Poisson方程与稳态对流扩散方程中的预测结果均与最优参数基本一致,所得数值解在全域范围内具有较高精度和良好稳定性。然而,误差曲线分析揭示了当局部矩阵病态性增强时的稳定性退化现象,提示未来工作可在损失函数中引入条件数或稳定性惩罚项,以实现一致性与稳定性的联合优化。
基金项目
本研究得到“基于超声造影–细胞角蛋白的精确诊断胆囊息肉样病变的人工智能模型构建研究”项目(2025L041)的资助。
NOTES
*通讯作者。