1. 引言
科学和工程中物理现象的数学模型往往可以表示成以下形式的初值问题:
要得到(1)的解析解往往非常困难或者无法求解,所以有必要研究该问题的数值方法。长期以来,人们提出了许多求解常微分方程的数值方法,Mohammed [1] 提供了一种三阶常微分方程解的三隐式混合线性多步方法,Olabode [2] 提出了一种三阶常微分方程的分块多步法,Agboola [3] 提出了一种微分变换方法解三阶常微分方程,Hashim [4] 利用伯恩斯坦多项式方法的运算矩阵直接求解三阶方程,并应用于流体流动方程。求解三阶常微分方程问题的数值方法有许多的研究结果,有的计算精度较高,但存在着随着样本量的增加,执行时间迅速增加的问题。
用正交多项式消除隐层已经在神经网络的微分方程数值解法中得到了广泛的应用,Lu [5] 提出了用勒让德神经网络算法求解某些风险模型的破产概率,Ma等人 [6] 提出一种改进的求解连续时间一维资产定价模型的价格红利函数的三角神经网络算法,陈英皞 [7] 用拉盖尔神经网络数值求解广义Black-Scholes微分方程。
本文借用神经网络模型对求解三阶常微分方程模型选择问题进行一些探究。
2. 单隐层前馈神经网络
神经网络中最基本的单元是神经元模型,细胞体分为两部分,前一部分计算总输入值,即输入信号的加权和,后一部分计算总输入值与该神经元阈值的插值,然后通过激活函数处理,产生输出从轴突传送给其他神经元。
人工神经网络模仿了生物神经网络。将神经元模型按层连接,就能得到单层前馈神经网络,其中,我们将隐藏层的基函数选择为正交多项式,就能得到如图1所示的网络结构。单隐层前馈神经网络由输入层、隐含层、输出层组成,其中
是我们的输入,
表偏置,
是我们所选用的正交多项式,
是输出。可简单模拟生物神经网络,每层神经元与下一层神经元连接,神经元之间不存在跨层连接、同层连接,输入层用于数据的输入,隐含层与输出层神经元对数据进行加工。
3. 神经网络对一般三阶微分方程求解步骤
对于给定的任意一般三阶常微分方程:
使用正交多项式作为隐藏层基函数代替近似解,使用ELM算法计算权值,步骤如下:
1) 构造方程的近似解
,并把近似解带入方程组。
2) 剖分定义域
,选取内部节点
,将节点带入方程:
3) 形成数值矩阵
。
4) 使用ELM算法求解权值矩阵
,其中
为矩阵H的Moore-Penrose广义逆。
4. 数值实验
在解域内均匀选择测试点,并在这些测试点上比较真实解与近似解的插值,才用均方误差(MSE)来观察基函数的选择对误差的影响。MSE的定义如下:
例1考虑方程:
方程的精确解为:
。
我们选取神经元个数N = 10,当选择测试点作为区间[0, 1]中的点时,精确解、Legendre神经网络、Chebyshev神经网络和Hermite神经网络结果的比较记录在表1中 。
Table 1. Numerical results using different neural network models
表1. 采用不同神经网络模型的数值结果
由表1可以看出,Legendre神经网络算法得到的误差精度为o(10-8),MSE约为 5.029218803638438e−19。Chebyshev神经网络算法得到的误差精度为o(10-8),MSE约为 5.042613965704128e−19。Hermite神经网络算法得到的误差精度为o(10-8),MSE约为 4.928755732194928e−19。由图2可以看出,三种神经网络模型的性能是相似的,误差曲线图基本上重合。
Figure 2. Error curves of comparative example 1 with different neural network models
图2. 不同神经网络模型对例1误差曲线图
例2考虑方程:
方程的精确解为:
。
我们选取神经元个数N = 10,当选择测试点作为区间[0, 1]中的点时,精确解、Legendre神经网络、Chebyshev神经网络和Hermite神经网络结果的比较记录在表2中。
Table 2. Numerical results using different neural network models
表2. 例2采用不同神经网络模型的数值结果
由表2可以看出,Legendre神经网络算法得到的误差精度为o(10-10),MSE约为 5.029218803638438e−19。Chebyshev神经网络算法得到的误差精度为o(10-10),MSE约为 5.042613965704128e−19。Hermite神经网络算法得到的误差精度为o(10-10),MSE约为 4.928755732194928e−19。由图3可以看出,三种神经网络模型的性能是相似的,误差曲线图基本上重合。
Figure 3. Error curves of comparative example 2 with different neural network models
图3. 不同神经网络模型对例2误差曲线图
5. 结论
本文通过建立不同神经网络模型,对求解一类三阶常微分方程数值解的误差进行探究,通过神经网络方法获取的近似解与数值解之间的误差,探究出选择Legendre多项式、Chebyshev多项式、Hermite多项式作为神经网络的基函数对数值解的误差量级影响较小,为以后用神经网络解三阶常微分方程基函数的选择上,提供了一些参考。
项目基金
贵州省科技计划项目(No. QKHJC-ZK[2021]YB017);贵州大学引进人才项目(No. GzuRJHZ[2019]047);黔科合平台人才[2020]5016。
NOTES
*通讯作者。