三维稳态热传导方程参数反演问题的PINNs解法
PINNs Method for Parameter Inversion Problem of Three-Dimensional Steady-State Heat Conduction Equation
摘要: 热传导反问题广泛应用于地球科学、医学等领域,本文基于内嵌物理机理神经网络(PINNs)研究了一类三维有界域上热传导方程参数反演问题的数值解法。构建三维参数辨识模型,提出基于PINNs求解立方体区域三维稳态热传导方程参数反演问题的算法。通过同步反演热传导系数与整体温度值,实现热物性参数的高精度识别。在含噪声数据条件下,热传导系数反演的误差精度控制在104数量级,证实了算法对病态问题具有良好的抗噪性。
Abstract: Inverse heat conduction problem is widely used in earth science, medicine and other fields. In this paper, based on embedded physical mechanism neural network (PINNs), a numerical method for parameter inversion of heat conduction equation in three-dimensional bounded domain is studied. A three-dimensional parameter identification model is established, and an algorithm based on PINNs is proposed to solve the parameter inversion problem of three-dimensional steady-state heat conduction equation in cube region. Through simultaneous inversion of heat transfer coefficient and global temperature value, high precision identification of thermal physical property parameters is realized. Under the condition of noisy data, the error accuracy of heat transfer coefficient inversion is controlled at the order of 104, which proves that the algorithm has good anti-noise performance for ill-conditioned problems.
文章引用:阮晓晴, 邹琼. 三维稳态热传导方程参数反演问题的PINNs解法[J]. 应用数学进展, 2025, 14(5): 218-227. https://doi.org/10.12677/aam.2025.145250

1. 引言

热传导反问题因其广泛的工程应用背景及固有的不适定性,长期以来受到研究者们的高度关注。近年来,传统数值方法、软计算方法以及深度学习方法的不断发展,为热传导反问题的有效求解提供了丰富的途径和方法。

传统数值方法主要包括有限元法、有限差分法及边界元法等方法。这类方法理论成熟,但在处理不适定问题时需引入正则化技术以增强稳定性。薛齐文等人[1]采用Tikhonov正则化方法,结合加权Bregman距离函数,有效解决了非线性热传导反问题中多个参数的辨识问题,显著提高了计算的稳定性与抗噪能力。周焕林等人[2]利用边界元法反演二维瞬态热传导问题的温度相关导热系数,展示了传统数值方法处理非线性问题的有效性。Mohebbi等人[3]则针对空间与温度相关的导热系数估计问题,提出了有效的数值解决方案。

随着计算机技术的不断进步,人工神经网络(ANN)、支持向量机以及模糊神经网络等软计算方法逐渐应用于热传导领域。Yang等人[4]利用ANN精确建模了超临界乙烷的导热系数,验证了ANN在热物性预测中的高效性。吴自库等人[5]则采用最小二乘支持向量机(LS-SVM)高效求解了一维热传导方程中的热源反问题,获得了较好的稳定性与计算精度。Haznedar等人[6]通过模拟退火算法优化ANFIS结构,实现了动态系统的参数辨识。此外,Psichogios等人[7]的神经网络与物理原理融合的早期研究和Lagaris等人[8]提出的神经网络求解偏微分方程的工作,为软计算方法的应用奠定了基础。

深度学习的迅速兴起,尤其是物理信息神经网络(PINNs)的提出,为热传导反问题的研究注入了新的活力。Raissi等人[9]首次提出PINNs框架,通过引入物理约束成功解决了多个复杂非线性偏微分方程,开创了深度学习与物理知识相结合的新研究领域。随后,Cai等人[10]进一步将PINNs应用于热传导问题,处理了相变Stefan问题等多个复杂的实际工程问题。Rasht-Behesht等人[11]则利用PINNs成功求解了波传播与地震波反演问题,进一步验证了该方法的适用性。陈豪龙等人[12]基于PINNs深入研究了非线性瞬态热传导问题的参数辨识,讨论了网络结构及数据配置对结果的影响,显示出PINNs的良好泛化性能。Lu等人[13]开发的DeepONet模型,通过非线性算子学习,有效提高了偏微分方程求解的泛化性能与误差收敛性。此外,Musgrave等人[14]开发的傅里叶域PINNs方法,显著提升了稀疏数据下的求解精度。Borate等人[15]通过PINNs从实验数据中反演了非线性摩擦参数,证实了该方法在实际数据分析中的可靠性。Zhang等人[16]则成功应用深度神经网络解决了热传导方程的逆源项问题。Chanda等人[17]采用非侵入式方法,结合神经网络高效识别了热接触电导。Liu等人[18]则针对二维时间分数阶热传导方程提出了有效的PINNs逆问题求解方法,拓展了PINNs的适用范围。

传统数值方法虽然理论成熟,但在抗噪性和计算复杂性方面存在局限。以PINNs为代表的深度学习方法,通过物理信息融合和非线性拟合能力,展现了更为广阔的应用前景。

2. PINNs方法求解稳态热传导方程参数反演问题

2.1. 三维稳态热传导方程参数反演问题模型

稳态热传导方程在多个工程领域有广泛应用,主要用于分析和优化与热传导相关的稳态问题,本文研究有界区域 Ω( Ω 3 ) 上的稳态热传导方程参数反演问题,数学模型简述如下:

{ ( λu )( x,y,z )=f( x,y,z ),( x,y,z )Ω, u( x,y,z )| S =g( x,y,z ),( x,y,z )S. (1)

其中, 为空间梯度算子, u u 的梯度; u( x,y,z ) 表示区域内温度, g( x,y,z ) 为边界 S=Ω 上的Dirichlet边界条件, λ 表示热传导系数,可为常数或与位置相关的函数。

已知 f( x,y,z ),g( x,y,z ) ,识别未知参数 λ ,并预测区域 Ω 上的温度值。由于反问题的不适定性,需要额外附加观测数据,本文考虑附加局部区域 Ω D ( Ω D Ω ) 上的温度测量值,对 u D ( x,y,z )=u( x,y,z )( ( x,y,z )Ω ) 进行数值求解。

2.2. 三维稳态热传导方程参数反演问题PINNs方法求解

基于神经网络方法,可以把附加了内部温度测量条件的问题(1)转化为以下的最优控制问题[19]

{ min w,b     C( u( w,b );w,b ), C( u )= Δuf L 2 (Ω) 2 + u g 1 L 2 ( S 1 ) 2 + u u D L 2 (D) 2 u=NET( x,y,z;w,b ). (2)

其中, g 1 为已知边界条件, u D 为内部局部区域测量值, w,b 为神经网络中的参数,通过神经网络方法将其转化为参数优化问题。

具体来说,利用一个物理信息神经网络函数 u ^ ( x,y,z;θ ) 逼近未知函数 u( x,y,z ) ,从而得出未知热传导系数 λ ,其中 θ 为神经网络参数,其中参数 θ 包含了权重向量 w 和偏置 b ,采用L-BFGS算法[20]更新网络参数,使损失函数达到最小,求解过程见图1

Figure 1. Technical route of solving PDE based on PINNs

1. 基于PINNs求解PDE的技术路线

建立神经网络模型,输入层3个,输出层1个,隐藏层 L1 层,每个隐藏层有 N 个神经元,如图2所示。

Figure 2. Neural network structure diagram of inverse problem of heat conduction equation

2. 热传导方程反问题神经网络结构图

定义偏微分方程残差 f ( θ ) 为:

f ( θ )= 1 N f ( λ u ^ )( x,y,z;θ )f L 2 (Ω) 2 . (3)

边界条件残差 u b ( θ ) 为:

u b ( θ )= 1 N b u ^ ( x,y,z;θ ) g i L 2 ( S i ) 2 . (4)

观测数据残差 data D ( θ ) 为:

data D ( θ )= 1 N data u ^ ( x,y,z;θ ) u D L 2 (D) 2 . (5)

其中, N f , N b , N data 分别为方程配置点、边界点,以及观测数据样本集大小,偏导数由自动微分得到。

定义损失函数为:

( θ ) D = ω 1 u b ( θ )+ ω 2 f ( θ )+ ω 3 data D ( θ ). (6)

其中, ω i ( i=1,2,3 ) 为权重且 ω i >0 。损失函数的训练集分为三个部分,分别为边界条件的采样点、偏微分方程残差进行的配置点和观测条件的采样点。其中配置点的选取方式有两种,分别为类网格点选取方式以及伪随机离散取点方式,如图3所示,本文数值实验采用的是伪随机离散点选取方式。

其中损失函数通常都是非线性或者非凸的,利用优化算法(L-BFGS算法等)来求解最小化损失函数,最终得到近似解。

参数反演问题的神经网络求解算法如表1所示。

(a) 类网格取点 (b) 伪随机离散取点

Figure 3. Configuration point selection method

3. 配置点选取方式

Table 1. Algorithm for solving parameter inversion problems using PINNs

1. PINNs解参数反演问题算法

算法1PINNs解参数反演问题算法

Step 1取边界采样点 N b ,方程配置点 N f 和观测采样点 N data 作为训练集;

Step 2构造输出层有1个神经元的网络结构;

Step 3初始化参数 θ ,即神经网络的权重 w 和偏差 b

Step 4利用自动微分技术得到物理约束方程 f ( θ ) 、边界残差 u b ( θ )

Step 5再与边界观测残差 data D ( θ ) 构成损失函数 ( θ ) D

Step 6利用优化算法对网络参数 θ 更新, 最小化损失函数 ( θ ) D

Step 7直到损失函数 ( θ ) D 达到一定精度停止得到最终的近似解 u ^ ( x,y,z;θ )

数值算例:求解区域为立方体区域。采用添加随机误差的观测数据模拟计算,表达式为:

u δ =u×( 1+δ×r ). (7)

其中, δ 为噪声水平, r [ 1,1 ] 区间上的随机数。

数值精度由相对误差来判断,其计算公式如下:

E r ( u )= u u ^ 2 u 2 . (8)

本文所有数值算例的代码运行的版本为TensorFlow 1.15.0,具体实现主要依赖NumPy和TensorFlow两个库。

3. 数值实验

在一个立方体区域 Ω ¯ ={ ( x,y,z )|[ 0,1 ]×[ 0,1 ]×[ 0,1 ] } 内,考虑以下热传导方程分段常参数反演问题数值算例:

{ ( λu( x,y,z ) )=λ( π 2 e πx +4 ),       ( x,y,z )Ω, u| S 1 = g 1 =u( 0,y,z ), u| S 2 = g 2 =u( 1,y,z ),y[ 0,1 ],z[ 0,1 ], u| S 3 = g 3 =u( x,0,z ), u| S 4 = g 4 =u( x,1,z ),x[ 0,1 ],z[ 0,1 ], u| S 5 = g 5 =u( x,y,0 ), u| S 6 = g 6 =u( x,y,1 ),x[ 0,1 ],y[ 0,1 ], u| D =u( 1 2 ,y,z )= e 1 2 π +1+ y 2 + z 2             y[ 0,1 ],z[ 0,1 ]. (9)

其中, λ{ λ 1 =1,x( 0,0.5 ] λ 2 =2,x( 0.5,1 ) ,温度真解为 u( x,y,z )= e πx +2x+ y 2 + z 2 ,其中边界条件 g i ( i=1,2,3,4,5,6 ) 已知, S i ( i=1,2,3,4,5,6 ) 是指立方体区域的六个面,立方体区域示意图见图4 u| D 为附加内部观测条件。

Figure 4. Schematic diagram of a 3D cube

4. 三维立方体示意图

建立神经网络模型,以反演出未知参数 λ 1 , λ 2

网络的隐藏层数分别使用2、3、4、6进行测试,各隐藏层网络的神经元个数均为30,激活函数分别使用ReLU函数、Logistic函数和Tanh函数。得到的整体温度近似解误差 e u 和参数近似解误差 e λ 1 e λ 2 表2所示。

Table 2. Experimental results of different activation functions at different layer numbers

2. 不同激活函数在不同层数下的试验结果

隐藏网络层数

激活函数

e u

e λ 1

e λ 2

2

ReLU

7.29E−3

5.02E−1

5.12E−1

2

Logistic

1.79E−1

9.65E−1

5.33E−1

2

Tanh

2.63E3

8.73E4

2.82E3

3

ReLU

1.13E−2

5.06E−1

5.01E−1

3

Logistic

1.78E−1

8.71E−1

5.43E−1

3

Tanh

1.08E4

2.39E4

2.45E4

4

ReLU

1.18E−2

5.36E−1

5.21E−1

4

Logistic

5.28E−1

3.58E−1

6.17E−1

4

Tanh

1.12E4

2.35E4

2.21E4

6

ReLU

1.03E−2

5.24E−1

5.27E−1

6

Logistic

6.21E−1

4.95E−1

5.16E−1

6

Tanh

1.44E4

3.56E4

5.39E4

由此可以推测,拟合效果虽然随着层数的增加,有一定的提高,但并不会随着层数的增加而无限提高,由表2可以看出,激活函数ReLU函数和Logistic函数在此问题中的效果远远不如Tanh函数;综合考虑,本文的激活函数选用Tanh函数。

确定了激活函数的选取,接下来探索改变网络层数和神经元的数量对PINNs性能的影响,表3展示了在不同网络层数和不同神经元个数下得到的整体温度近似解的误差 e u

Table 3. Prediction errors of PINNs with different network layers and neurons for e u

3. 不同网络层数和神经元的PINNs预测误差 e u

网络层数

神经元个数

10

20

40

50

60

2

1.31E−2

1.07E−3

1.48E−1

1.51E−1

1.49E−1

3

2.69E−1

2.48E−1

1.90E−4

1.47E−4

1.56E−1

4

4.11E−2

1.99E−2

2.27E−4

9.67E5

1.46E−4

5

8.36E−1

1.72E−1

2.23E−4

1.88E−1

6.97E−1

从表中数据可知,当神经元数为40或50,网络层数为3层或4层时,观察到其对误差值的精度影响不大;由表可以观察到4层50个神经元得到的结果效果最好,出于计算精度和时间成本考虑,本数值实验选用4层50个神经元的网络结构来做数值算例。

先建立包含输入、输出和包含50个神经元的4个隐藏层的神经网络,优化算法采用L-BFGS算法,并且取Tanh函数作为激活函数。共选取2800个点的训练数据: N b =400×6, N f =200, N data =200 。损失函数为公式(6),所选取的权重分别为 ω 1 =7, ω 2 =2, ω 3 =1 ,损失函数权重的选取也是一个值得考虑的问题,其中多任务似然损失平衡方法具有较好的数学基础以及理论依据[21],但是会出现数值不稳定。因此,用经验选取损失函数的权重。而边界条件残差 u b ( θ ) 、偏微分方程残差 f ( θ ) 以及观测数据残差 data D ( θ ) 分别为:

u b ( θ )= 1 N b i=1 N b | u ^ ( 0, y i , z i ;θ ) u 1 ( 0, y i , z i ) | 2 + 1 N b i=1 N b | u ^ ( 1, y i , z i ;θ )u( 1, y i , z i ) | 2 + 1 N b i=1 N b | u ^ ( x i ,0, z i ;θ )u( x i ,0, z i ) | 2 + 1 N b i=1 N b | u ^ ( x i ,1, z i ;θ )u( x i ,1, z i ) | 2 + 1 N b i=1 N b | u ^ ( x i , y i ,0;θ )u( x i , y i ,0 ) | 2 + 1 N b i=1 N b | u ^ ( x i , y i ,1;θ )u( x i , y i ,1 ) | 2 . (10)

f ( θ )= 1 N f i=1 N f | [ x i ( λ u ^ ( p i ;θ ) x i )+ y i ( λ u ^ ( p i ;θ ) y i )+ z i ( λ u ^ ( p i ;θ ) z i ) ]f( p i ) | 2 . (11)

data D ( θ )= 1 N data i=1 N data | u ^ ( 1 2 , y i , z i ;θ )u( 1 2 , y i , z i ;θ ) | 2 . (12)

其中, p i =( x i , y i , z i ) 表示在区域内部随机选取的点。为了体现该方法的抗噪性,将带有不同噪声水平的附加条件放入训练,得到损失函数的变化如图5所示。

Figure 5. Loss function iteration diagram of piecewise constant parameter inversion problem

5. 分段常参数反演问题损失函数迭代图

图6为立方体区域利用不同噪声的内部观测数据得到的近似解 u ^ 和精确解 u 的绝对误差对比图,(a)为 δ=0 时近似解的误差,(b)为 δ=1% 时近似解的误差,(c)为 δ=5% 时近似解的误差,(d)为 δ=10% 时近似解的误差。

(a) 无噪声时绝对误差 (b) 1%噪声时绝对误差

(c) 5%噪声时绝对误差 (d) 10%噪声时绝对误差

Figure 6. Absolute error of approximate solution of piecewise constant parameter inversion problem

6. 分段常参数反演问题近似解的绝对误差

Table 4. Relative error of the results for the piecewise constant parameter inversion problem

4. 分段常参数反演问题结果的相对误差

u ^ u 的相对误差

λ ^ 1 λ 相对误差

λ ^ 2 λ 相对误差

无噪声

9.670638E−5

1.01E−4

9.43E−6

1%噪声

9.394715E−5

5.47E−5

1.16E−5

5%噪声

1.971324E−4

8.37E−4

8.18E−4

10%噪声

1.601566E−4

6.86E−4

6.94E−4

表4所示,对于分段常参数反演问题,反演得到的近似解 u ^ 在无噪声时相对误差精度为 10 5 ,而有噪声时的相对误差精度为 10 4 。预测的参数的相对误差精度基本稳定在 10 5 左右。不管是近似解 u ^ 还是参数 λ ^ ,利用PINNs方法求解立方体域三维稳态热传导参数反演问题精度较好。

4. 结语

利用PINNs方法求解三维稳态热传导方程参数反演问题,将此问题转化为优化问题,并利用观测数据、边界条件以及偏微分方程约束条件构造损失函数,再通过优化算法将其极小化。针对参数反演的数值算例的结果显示,在给定噪声水平的情况下,所反演得到的参数近似解精度可达到 10 5 10 4 数量级,表明该方法对噪声具有较低的敏感性,并在数值实验中展现出良好的稳定性。

参考文献

[1] 薛齐文, 魏伟. 非线性热传导反问题参数辨识[J]. 工程力学, 2010, 27(8): 5-10.
[2] 周焕林, 徐兴盛, 李秀丽, 等. 反演二维瞬态热传导问题随温度变化的导热系数[J]. 应用数学和力学, 2014, 35(12): 1341-1351.
[3] Mohebbi, F. and Sellier, M. (2016) Parameter Estimation in Heat Conduction Using a Two-Dimensional Inverse Analysis. International Journal for Computational Methods in Engineering Science and Mechanics, 17, 274-287.
https://doi.org/10.1080/15502287.2016.1204034
[4] Yang, L. and Wang, Z. (2018) Artificial Neural Network (ANN) Modeling of Thermal Conductivity of Supercritical Ethane. Energy Sources, Part A: Recovery, Utilization, and Environmental Effects, 41, 396-404.
https://doi.org/10.1080/15567036.2018.1518358
[5] 吴自库, 李福乐. 一维热传导方程热源反问题基于最小二乘法的正则化方法[J]. 计算物理, 2016, 33(1): 49-56.
[6] Haznedar, B. and Kalinli, A. (2018) Training ANFIS Structure Using Simulated Annealing Algorithm for Dynamic Systems Identification. Neurocomputing, 302, 66-74.
https://doi.org/10.1016/j.neucom.2018.04.006
[7] Psichogios, D.C. and Ungar, L.H. (1992) A Hybrid Neural Network‐First Principles Approach to Process Modeling. AIChE Journal, 38, 1499-1511.
https://doi.org/10.1002/aic.690381003
[8] Lagaris, I.E., Likas, A. and Fotiadis, D.I. (1998) Artificial Neural Networks for Solving Ordinary and Partial Differential Equations. IEEE Transactions on Neural Networks, 9, 987-1000.
https://doi.org/10.1109/72.712178
[9] Raissi, M., Perdikaris, P. and Karniadakis, G.E. (2019) Physics-Informed Neural Networks: A Deep Learning Framework for Solving Forward and Inverse Problems Involving Nonlinear Partial Differential Equations. Journal of Computational Physics, 378, 686-707.
https://doi.org/10.1016/j.jcp.2018.10.045
[10] Cai, S., Wang, Z., Wang, S., Perdikaris, P. and Karniadakis, G.E. (2021) Physics-Informed Neural Networks for Heat Transfer Problems. Journal of Heat Transfer, 143, Article ID: 060801.
https://doi.org/10.1115/1.4050542
[11] Rasht‐Behesht, M., Huber, C., Shukla, K. and Karniadakis, G.E. (2022) Physics‐Informed Neural Networks (PINNs) for Wave Propagation and Full Waveform Inversions. Journal of Geophysical Research: Solid Earth, 127, e2021JB023120.
https://doi.org/10.1029/2021jb023120
[12] 陈豪龙, 唐欣越, 柳兆涛, 等. 基于物理信息神经网络的非线性瞬态热传导正/反问题研究[J]. 重庆大学学报, 2024, 47(12): 124-136.
[13] Lu, L., Jin, P., Pang, G., Zhang, Z. and Karniadakis, G.E. (2021) Learning Nonlinear Operators via DeepONet Based on the Universal Approximation Theorem of Operators. Nature Machine Intelligence, 3, 218-229.
https://doi.org/10.1038/s42256-021-00302-5
[14] Musgrave, J. and Huang, S.W. (2023) Fourier Domain Physics Informed Neural Network. arXiv: 2310.11459.
[15] Borate, P., Rivière, J., Marty, S., Marone, C., Kifer, D. and Shokouhi, P. (2024) Physics Informed Neural Network Can Retrieve Rate and State Friction Parameters from Acoustic Monitoring of Laboratory Stick-Slip Experiments. Scientific Reports, 14, Article No. 24624.
https://doi.org/10.1038/s41598-024-75826-y
[16] Zhang, H. and Liu, J. (2023) Solving an Inverse Source Problem by Deep Neural Network Method with Convergence and Error Analysis. Inverse Problems, 39, Article ID: 075013.
https://doi.org/10.1088/1361-6420/acdaef
[17] Chanda, S., Balaji, C. and Venkateshan, S.P. (2018) Non-Intrusive Measurement of Thermal Contact Conductance at Polymer-Metal Two Dimensional Annular Interface. Heat and Mass Transfer, 55, 327-340.
https://doi.org/10.1007/s00231-018-2410-7
[18] Liu, S. and Feng, L. (2020) An Inverse Problem for a Two-Dimensional Time-Fractional Sideways Heat Equation. Mathematical Problems in Engineering, 2020, Article ID: 5865971.
https://doi.org/10.1155/2020/5865971
[19] Li, Y. and Hu, X. (2022) Artificial Neural Network Approximations of Cauchy Inverse Problem for Linear PDES. Applied Mathematics and Computation, 414, Article ID: 126678.
https://doi.org/10.1016/j.amc.2021.126678
[20] 刘浩洋, 户将, 李勇锋, 等. 最优化: 建模、算法与理论[M]. 北京: 高教出版社, 2020.
[21] Xiang, Z., Peng, W., Liu, X. and Yao, W. (2022) Self-Adaptive Loss Balanced Physics-Informed Neural Networks. Neurocomputing, 496, 11-34.
https://doi.org/10.1016/j.neucom.2022.05.015