基于牛顿型算法的椭圆方程多参数识别
Multi-Parameter Identification of Elliptic Equations Based on Newton-Type Algorithms
摘要: 针对椭圆型偏微分方程(PDE) Neumann边值问题中的多参数联合识别问题展开研究,重点解决在状态测量数据精度不足的条件下,同时辨识扩散矩阵、源项、边界条件及物理状态的挑战。建立了一个结合能量泛函与Tikhonov正则化的变分框架,推导出Karush-Kuhn-Tucker (KKT)系统,并采用有限元方法对PDE进行空间离散,发展牛顿型算法以实现数值求解。我们的算法在不同测量数据条件下能够有效地辨识多个参数,最终的数值算例验证了该方法的有效性。
Abstract: The study focuses on the multi-parameter joint identification problem in the Neumann boundary value problem for elliptic partial differential equations (PDEs). It specifically addresses the challenge of simultaneously identifying the diffusion matrix, source term, boundary conditions, and physical states under conditions of insufficient accuracy in state measurement data. We establish a variational framework that combines an energy functional with Tikhonov regularization and derive the Karush-Kuhn-Tucker (KKT) system. We also employ the finite element method for spatial discretization of the PDE and develop a Newton-type algorithm for numerical solution. Our algorithm effectively identifies multiple parameters under different measurement data conditions, and the final numerical examples validate the effectiveness of the method.
文章引用:吴宇航, 刘欢. 基于牛顿型算法的椭圆方程多参数识别[J]. 统计学与应用, 2026, 15(2): 163-178. https://doi.org/10.12677/sa.2026.152044

1. 引言

偏微分方程(PDE)参数识别问题是一类核心的数学物理反问题,其目标是通过系统输出的观测数据来反演模型中的未知参数、源项或初始边界条件[1]。这类问题广泛存在于含水层分析、地球物理勘探、医学成像及环境污染物传输等关键科学领域,其研究在过去三十余年里持续受到广泛关注[2]-[14]。传统的参数识别研究多集中于标量扩散系数,其理论与数值方法已相对成熟。然而,实际系统往往更为复杂,涉及多参数(如对流速度与源强度)或各向异性扩散矩阵的同时识别,这为反问题研究带来了巨大的理论与计算挑战。系统的源项(source term)难以直接测量或已知甚少,与大量假设源项已知的研究不同,源项本身作为未知量与扩散系数、边界条件一同被识别,构成了一个更具普适性但也不适定性更强的反问题。这类问题解的存在性、唯一性及稳定性分析都更为困难,需要发展专门的正则化理论与稳定的数值算法[15]。在数值求解这类优化问题时,基于一阶最优性条件(Karush-Kuhn-Tucker条件)构建的算法是主流途径。其中,牛顿型算法因其在最优解附近具有二阶收敛速度,相比一阶梯度法能显著提升计算效率,尤其适用于大规模或非线性程度高的参数识别问题[16]

本文借鉴文献[17]在多参数识别研究上的延续与发展,针对扩散矩阵、未知源项及边界条件需同时识别的这一更具一般性的问题,采用一种基于代价泛函凸性分析的新技术路径。该分析为构建稳定的迭代格式提供了理论基础。构建一种高效的牛顿型算法来数值求解由此导出的KKT系统,旨在实现比传统一阶方法更快的收敛速度。后续内容将围绕问题的数学表述、理论分析、算法设计及数值实验展开。

2. 问题介绍

设区域 Ω R d 的开且有界的连通域,其中 1d3 ,并且其边界 Ω 为多边形边界。通过解 u 的测量数据 z δ L 2 ( Ω ) ,本研究关注在椭圆型偏微分方程的Neumann边值问题(1.1)中,扩散矩阵 A 、源项 f 、边界条件 g 以及状态 u 的同时识别问题:

{ ( Au )=finΩ, Au n =gonΩ, (1.1)

其中 n 是在 Ω 上的单位外法向量, ( A,f,g ) ad := A ad × ad × G ad 。这里 A ad , ad G ad 分别定义如下:

A ad :={ A L sym ( Ω )|α | ξ | 2 A( x )ξξβ | ξ | 2 ,ξ R d } ,(1.2)

ad := L 2 ( Ω ) G ad := L 2 ( Ω )

其中 α,β 为满足 βα>0 的常数。

对于 1p ,设

L sym p ( Ω ):={ H:= ( h ij ) i,j= 1,,d ¯ L p ( Ω ) d×d |H( x ):= ( h ij ( x ) ) i,j= 1,,d ¯ S d Ω }

式中, S d 定义为表示具有内积 MN:=trace( MN ) 运算和相应范数 M S d = ( MM ) 1/2 = ( i,j=1 d m ij 2 ) 1/2 的所有 d×d 实对称矩阵的集合,其中 M:= ( m ij ) i,j= 1,,d ¯

L sym p ( Ω ) 中,我们使用标量积和范数

( H 1 , H 2 ) L sym p ( Ω ) = i,j=1 d ( h ij 1 , h ij 2 ) L 2 ( Ω )

H L sym 2 ( Ω ) := ( i,j=1 d h ij L 2 ( Ω ) 2 ) 1 2 = ( Ω H( x ) S d 2 dx ) 1 2

而空间 L sym ( Ω ) 配备的范数为 H L sym ( Ω ) := max i,j= 1,,d ¯ h ij L ( Ω )

γ: H 1 ( Ω ) H 1/2 ( Ω ) 为连续Dirichlet迹算子, H 1 ( Ω ) H 1 ( Ω ) 的一个闭子空间,由边界上所有均值为零的函数组成,即:

H 1 ( Ω ):={ u H 1 ( Ω ) Ω γudx =0 }

以此构建完备的Hilbert空间。

引理1.1 对于每个 ( A,f,g ) ad ,存在唯一的弱解 u 满足(1.1),且存在以下先验估计:

u H 1 ( Ω ) Cmax( γ ( H 1 ( Ω ), H 1/2 ( Ω ) ) g L 2 ( Ω ) + f L 2 ( Ω ) ) C N ( g L 2 ( Ω ) + f L 2 ( Ω ) ) (1.3)

其中, C N :=Cmax( 1, γ ( H 1 ( Ω ), H 1/2 ( Ω ) ) )

证明:由Lax-Milgram引理可得,对于每个 ( A,f,g ) ad v H 1 ( Ω ) 满足等式:

Ω Auvdx =( f,v )+ g,γv (1.4)

对所有的 v H 1 ( Ω ) ,这里的运算符 ( , ) , 分别表示空间 L 2 ( Ω ) L 2 ( Ω ) 上的内积。令 v=u ,结合Poincaré-Friedrichs不等式 C Ω u 2 dx Ω | u | 2 dx 和强制性条件 u H 1 ( Ω ) 2 C Ω | u | 2 C Ω Auudx ,对所有 u H 1 ( Ω ),A A ad 成立,即可得出结论(1.3)。

接下来定义非线性的系数到解算子 U: A ad H 1 ( Ω ) ,其将每个 ( A,f,g ) ad 映射到问题(1.1)的唯一弱解 u A,f,g :=Φ 。为了便于计算纯Neumann问题的数值解,我们对解进行了标准化,使其在边界上的均值为零。

本研究的识别问题现在表述如下:

给定 Φ := U A,f,g H 1 ( Ω ) ,寻找一个 ( A,f,g ) ad ,使得 Φ A,f,g 满足(1.4)式。

这个反问题可能有多个解。根据不适定问题的一般收敛理论[17],我们将使用唯一最小范数解的概念,其定义为

( A , f , g ):=arg min ( A,f,g )I( Φ ) ( A,f,g ) (1.5)

其中 I( Φ ):={ ( A,f,g ) ad | U A,f,g = Φ } ,并且

( A,f,g ):= A L sym 2 ( Ω ) 2 + f L 2 ( Ω ) 2 + g L 2 ( Ω ) 2 .

在下面的问题(1.6)中,函数 作为Tikhonov正则化方法的惩罚项出现, ( A , f , g ) 是识别问题中具有最小惩罚值的解。注意到问题(1.5)的可允许集 I( Φ ) 非空,并且在 L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 这个函数上具有凸性和弱闭性,因此,最小值 ( A , f , g ) 被唯一地确定。本文使用如下的凸能量泛函

( A,f,g ) ad J δ h ( A,f,g ):= l=1 L Ω A( u A,f,g l,h z δ l )( u A,f,g l,h z δ l )dx ,

考虑严格凸问题

min ( A,f,g ) ad J δ h ( A,f,g )+η( A,f,g ) (1.6)

的唯一极小化解 ( A h , f h , g h ) 作为识别问题的离散正则化解。为了便于说明,我们将考虑一组测量数据 ( z δ ) δ>0 的情形。在本文中,为了方便相关符号表示,我们用 Ω 代替 Ω dx 。我们使用来自例如[18]的Sobolev空间 H 1 ( Ω ), H 2 ( Ω ), W k,p ( Ω ) 等的标准概念。

注:文献[19]中证明了测量数据个数 L=4 可以确保扩散矩阵 A 的唯一反演。且在文献[20]中,数值实验表明, L 越大, A 的恢复越准确。所以本文在数值模拟中,选择了5个测量数据,以确保解的唯一性,平衡所提算法的效率和准确性。

3. 有限元离散

3.1. 预备知识

在乘积空间 L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) L sym ( Ω )× L 2 ( Ω )× L 2  ( Ω ) 中分别使用范数

( H,l,s ) L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) = ( H L sym 2 ( Ω ) 2 + l L   2 ( Ω ) 2 + s L   2 ( Ω ) 2 ) 1/2

( H,l,s ) L sym ( Ω )× L 2 ( Ω )× L 2 ( Ω ) = H L sym ( Ω )   + l L   2 ( Ω )   + s L   2 ( Ω )   .

注意到,系数到解的算子

U: ad L sym ( Ω )× L 2 ( Ω )× L 2 ( Ω ) H 1   ( Ω )

和解

Γ:=( A,f,g ) ad U( Γ ):= U Γ

ad 上是Fréchet可微的,对于每个 Γ=( A,f,g ) ad 和所有的 φ H 1 ( Ω )   ,其在方向 λ:=( H,l,s ) L sym ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 上的Fréchet导数 ξ λ := U Γ ( λ ):= U ( Γ )( λ ) 是方程

Ω A ξ λ φ = Ω H U Γ φ +( l,φ )+ s,γφ (2.1)

H 1 ( Ω ) 中的唯一弱解。

S d 中,我们引入凸子集 K:={ M S d | q _ Mξξ q ¯ ξ R d } 以及正交投影: P K : S d K ,则 ( A P K ( A ) )( B P K ( A ) )0 对所有的 A S d BK 成立。此外,设 ξ:=( ξ 1 ,, ξ d ) ζ:=( ζ 1 ,, ζ d ) R d 中的任意两个向量,使用符号 ( ξζ ) 1i,jd S d 表示

( ξζ ) ij := 1 2 ( ξ i ζ j + ξ j ζ i )  i,j=1,,d.

3.2. 离散化

( T h ) 0<h<1 为网格大小为 h 的区域 Ω ¯ 的拟正则均匀三角剖分,使得多边形边界 Ω 的每个顶点都是 T h 的节点。状态函数的离散空间定义为

V 1 h :={ φ h C( Ω ¯ ) H 1 ( Ω )| φ h |T P 1 ( T )T T h } , (2.2)

其中 P r 表示所有次数不超过 r 的多项式函数。与连续情况类似,我们有如下结果。

引理2.1 ( A,f,g ) ad ,则变分方程

Ω A Φ h φ h =( f, φ h )+ g,γ φ h (2.3)

对所有 φ h V 1 h 存在唯一解 Φ h V 1 h 且满足先验估计:

Φ h H 1 ( Ω ) C N ( f L 2 ( Ω ) + g L 2 ( Ω ) ). (2.4)

映射 U h : ad L sym ( Ω )× L 2 ( Ω )× L 2 ( Ω ) V 1 h ,从每个 Γ:=( A,f,g ) ad 到(2.3)的唯一解 U Γ h := Φ h 称为系数到离散解的算子。这个算子在集合 ad 上也是Fréchet可微的。对于每个 Γ=( A,f,g ) ad λ:=( H,l,s ) L sym ( Ω )× L 2 ( Ω )× L 2 ( Ω ) ,Fréchet导数 ξ λ h := U Γ h ( λ ) 属于 V 1 h ,且对 V 1 h 中的所有 φ h 满足等式

Ω A ξ λ h φ h = Ω H U Γ h φ h +( l, φ h )+( s,γ φ h ). (2.5)

由于椭圆型问题的有限元方法的标准理论[21],对于任意固定的 Γ=( A,f,g ) ad ,都有极限

lim h0 U Γ U Γ h H 1 ( Ω ) =0 .(2.6)

是Clément平滑插值算子,则满足以下性质

lim h0 ϕ Π h ϕ H k ( Ω ) =0 对所有 k{ 0,1 } (2.7)

ϕ Π h ϕ H k ( Ω ) C h lk ϕ H 1 ( Ω ) 对于 0kl2 (2.8)

其中 C h ϕ 无关[22]。因此,利用离散算子 U h 和插值算子 Π h ,可以引入离散代价函数

J δ h ( A,f,g ):= Ω A( U A,f,g h Π h z δ )( U A,f,g h Π h z δ ) (2.9)

其中 ( A,f,g ) ad

引理2.2 假设序列 ( Γ n ) n := ( A n , f n , g n ) n ad 弱收敛于 L sym ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 中的 Γ:=( A,f,g ) 。则对于任何固定的 h>0 ,序列 ( U Γ n h ) n V 1 h H 1 ( Ω ) 中收敛到 U Γ h

证明:设 ( A n ) n 有一个由相同符号表示的子序列,该子序列在 L sym ( Ω ) 中弱收敛到 A 。此外,通过不等式(2.4),对应的状态序列 ( U Γ n h ) n 在有限维空间 V 1 h 中是有界的。则存在一个不重新标记的子序列 ( U Γ n h ) n Θ h V 1 h ,使得 ( U Γ n h ) n H 1 ( Ω ) 中收敛到 Θ h 。由式(2.3)可知

Ω A n ( U Γ n h U Γ h ) φ h = Ω ( A A n ) U Γ h φ h +( f n f, φ h )+ g n g,γ φ h (2.10)

对于所有 φ h V 1 h 。取 φ h = U Γ n h U Γ h ,由(1.5)得到

C U Γ n h U Γ h H 1 ( Ω ) 2 Ω ( A A n ) U Γ h ( U Γ n h Θ h + Θ h U Γ h )   +( f n f, U Γ n h Θ h + Θ h U Γ h ) + g n g,γ( U Γ n h Θ h + Θ h U Γ h )

C U Γ n h Θ h H 1 ( Ω ) + Ω ( A A n ) U Γ h ( Θ h U Γ h ) +( f n f, Θ h U Γ h )+ g n g,γ( Θ h U Γ h ) (2.11)

由于 L sym ( Ω ) 中的 A n A ,我们得到 lim n Ω ( A A n ) U Γ h ( Θ h U Γ h ) =0 。因此让 n 趋于 ,从(2.11)中得到, lim n U Γ n h U Γ h H 1 ( Ω ) =0 ,完成了证明。

现陈述以下关于代价函数凸性的结果。

引理2.3 J δ h 在集合 ad 上关于范数 L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 是凸且连续的。

证明:函数 J δ h 的连续性直接由引理2.2得出。接下来证明 J δ h 是凸的。

Γ:=( A,f,g ) ad λ:=( H,l,s ) L sym ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 得到

U Γ h ( λ )= U Γ h A H+ U Γ h f l+ U Γ h g s J δ h ( Γ )( λ )= J δ h ( Γ ) A H+ J δ h ( Γ ) f l+ J δ h ( Γ ) g s.

分别计算最后一个方程右侧的每一项可得,

J δ h ( Γ )( λ )= Ω H ( U Γ h Π z δ h )( U Γ h Π h z δ )+2 Ω A ( U Γ h A H )( U Γ h Π z δ h ) +2 Ω A ( U Γ h f l )( U Γ h Π z δ h )+2 Ω A ( U Γ h g s )( U Γ h Π z δ h ) =2 Ω A ( U Γ h Q H+ U Γ h f l+ U Γ h g s )( U Γ h Π z δ h )+ Ω H ( U Γ h Π z δ h )( U Γ h Π z δ h ) =2 Ω A U Γ h ( λ )( U Γ h Π z δ h )+ Ω H ( U Γ h Π z δ h )( U Γ h Π z δ h ) =2 Ω A U Γ h ( λ )( U Γ h Π ¯ z δ h )+ Ω H ( U Γ h Π ¯ z δ h )( U Γ h Π ¯ z δ h ),

其中,

Π ¯ z δ h := Π z δ h | Ω | 1 1,γ Π z δ h V 1 h Π ¯ z δ h = Π z δ h . (2.12)

根据(2.5),可以推断出

J δ h ( Γ )( λ )=2 Ω H U Γ h ( U Γ h Π ¯ z δ h ) +2( l, U Γ h Π ¯ z δ h ) +2 s,γ( U Γ h Π ¯ z δ h ) + Ω H ( U Γ h Π ¯ z δ h )( U Γ h Π ¯ z δ h ) = Ω H U Γ h U Γ h + Ω H Π ¯ z δ h Π ¯ z δ h +2( l, U Γ h Π ¯ z δ h )+2 s,γ( U Γ h Π ¯ z δ h ) . (2.13)

再利用(2.5)得出结论

J δ h ( Γ )( λ,λ )=2 Ω H U Γ h U Γ h ( λ ) +2( l, U Γ h ( λ ) )+2 s,γ U Γ h ( λ ) =2 Ω A U Γ h ( λ ) U Γ h ( λ ) 2C U Γ h ( λ ) H 1 ( Ω ) 2 0,

结合(1.5)可得 J δ h 在集合 ad 上关于范数 L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 是凸的,证毕。

现在我们证明本节的重要结论。

定理2.4 严格凸优化问题

min ( A,f,g ) ad F η ( A,f,g ):= J δ h ( A,f,g )+η( A,f,g )

存在唯一的极小化解。此外, Γ:=( A,f,g ) ad 的唯一极小化解,当且仅当系统

A( x )= P K ( 1 2ρ ( U Γ h ( x ) U Γ h ( x ) Π ¯ z δ h ( x ) Π ¯ z δ h ( x ) ) ), (2.14)

f( x )= 1 ρ ( Π ¯ z δ h ( x ) U Γ h ( x ) ), (2.15)

g( x )= 1 ρ ϒ( Π ¯ z δ h ( x ) U Γ h ( x ) ) (2.16)

Ω 中几乎处处成立,其中 Π ¯ h 是根据(2.12)从 Π h 生成的。

证明:令 ( Γ n ) n := ( A n , f n , g n ) n ad 的一个极小化序列,即 lim n ϒ δ ρ,h ( Γ n )= inf ( A,f,g ) ad ϒ δ ρ,h ( A,f,g ) 。因此,序列 ( Γ n ) n 在范数 L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 下是有界的。存在一个子序列(不重新标记)和 Γ:=( A,f,g ) L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) ,使得 Γ n L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 中弱收敛于 Γ 。另一方面,由于 ad L sym 2 ( Ω )× L 2 ( Ω )× L 2 ( Ω ) 中的一个闭凸子集,因此它是弱闭的,这意味着 Γ ad 。根据引理2.3, J δ h ad 上都是弱下半连续的,因此

J δ h ( Γ ) liminf n J δ h ( Γ n ) ( Γ ) liminf n ( Γ n ).

J δ h ( Γ )+η( Γ ) liminf n J δ h ( Γ n )+ liminf n η( Γ n ) liminf n ( J δ h ( Γ n )+η( Γ n ) ) = lim n ϒ δ ρ,h ( Γ n )= inf ( A,f,g ) ad ϒ δ ρ,h ( A,f,g )

Γ 的一个极小化解。由于 F η 是严格凸的,因此这个极小化解是唯一的。另外,元素 Γ:=( A,f,g ) ad 的极小化解当且仅当对于所有 Γ ¯ =( H,l,s ) ad ϒ δ ρ,h ( Γ )( Γ ¯ Γ )0 。则根据表达式(2.13),得到

0 Ω ( HA ) Π ¯ z δ h Π ¯ z δ h Ω ( HA ) U Γ h U Γ h +2ρ( HA,A ) +2( lf, U Γ h Π ¯ z δ h )+2ρ( lf,f )+2 sg,γ( U Γ h Π ¯ z δ h ) +2ρ sg,g = Ω ( HA )( Π ¯ z δ h Π ¯ z δ h U Γ h U Γ h +2ρA ) +2( lf, U Γ h Π ¯ z δ h +ρf )+2 sg,γ( U Γ h Π ¯ z δ h )+ρg

对于所有 Γ ¯ =( H,l,s ) ad 成立。将 Γ ¯ 1 =( H,f,g ) Γ ¯ 2 =( A,l,g ) Γ ¯ 3 =( A,f,s ) 代入上述不等式即可得到方程(2.14)~(2.16)。证毕。

4. 数值实验

4.1. 投影牛顿算法

根据定理2.4中的必要最优性系统,我们提出了一种投影牛顿算法。第2节中的论证表明,目标函数 F η ( A h , f h , g h l ) 的方向导数 F η ( A h , f h , g h l )[ D,t,s ] 可以表示为

F η ( A h , f h , g h l )[ D,t,s ]= ( D z δ,h l , z δ,h l ) L 2 ( Ω ) d ( D u h l , u h l ) L 2 ( Ω ) d +2 ( t, u h l z δ,h l +η f h ) L 2 ( Ω ) +2 s, u h l z δ,h l +η g h l L 2 ( Ω ) +2η ( D, A h ) L 2 ( Ω ) d,d ,( D,t,s ) h ,

其中 u h l 满足如下方程

( A h u h l , v h ) L 2 ( Ω ) d ( f h , v h ) L 2 ( Ω ) g h l , v h L 2 ( Ω ) =0, v h V h ,l= 1,,L ¯ (3.1)

逐点的最优性条件为:

A h ( x )= P K ( 1 2η ( z δ,h l z δ,h l u h l u h l ) ) (3.2)

Ω 中几乎处处成立。

总之,变分形式下的一阶必要最优性系统为

{ ( A h u h l , v h ) L 2 ( Ω ) d ( f h , v h ) L 2 ( Ω ) g h l , v h L 2 ( Ω ) =0, v h V h ,l= 1,,L ¯ , ( ( D h A h ) z δ,h l , z δ,h l ) L 2 ( Ω ) d ( ( D h A h ) u h l , u h l ) L 2 ( Ω ) d +2 ( t h f h , u h l z δ,h l +η f h ) L 2 ( Ω ) +2η ( A h , D h A h ) L 2 ( Ω ) d,d +2 s h g h l , u h l z δ,h l +η g h l L 2 ( Ω ) 0,( D h , t h , s h ) h .

为了应用牛顿法,一个关键的步骤是推导未知数 ( u l ,f,A ) 的牛顿更新 ( u ¯ l , f ¯ , A ¯ ) 。这可以通过求解以下方程来实现

{ ( A ¯ u h l,n , v h ) L 2 ( Ω ) d + ( A h u ¯ l , v h ) L 2 ( Ω ) d ( f ¯ , v h ) L 2 ( Ω ) = ( A h n u h l,n , v h ) L 2 ( Ω ) d ( f h n , v h ) L 2 ( Ω ) , v h V h ,l= 1,,L ¯ , 2η ( A ¯ , D h ) L 2 ( Ω ) d,d 2 ( D h u ¯ l , u h l,n ) L 2 ( Ω ) d +2 ( t h , u ¯ l ) L 2 ( Ω ) +2η ( t h , f ¯ ) L 2 ( Ω ) = ( D h z δ,h l , z δ,h l ) L 2 ( Ω ) d ( D h u h l,n , u h l,n ) L 2 ( Ω ) d +2 ( t h , u h l,n z δ,h l +η f h n ) L 2 ( Ω ) +2η ( A h n , D h ) L 2 ( Ω ) d,d ,( D h , t h ) A h × h ,l= 1,,L ¯ . (3.3)

耦合系统(3.3)的解记为 ( u ¯ h l , f ¯ h , A ¯ h ) ,其中 l= 1,,L ¯ 。在为系统(3.3)制定牛顿法时,我们不直接处理变分不等式(即,导电率 A h 的特征值的区间约束),即在(3.2)中的投影算子。因此,我们使用牛顿迭代来更新方程(3.1)和(3.2)的解,而不进行逐点投影 P K 。在更新后,将更新的解投影到凸集 K 上。这导致了一个投影牛顿算法,其细节详见算法1。请注意,该方法的每次迭代需要求解一个耦合线性系统,包括状态变量 u ¯ h l 、源项变量 f ¯ h 和导电率 A ¯ h 。第6行的停止条件是相对误差

max{ u h l,n+1 u h l,n 2 u h l,n+1 2 , f h l,n+1 f h l,n 2 f h l,n+1 2 , A h n+1 A h n 2 A h n+1 2 ,l=1,,L }

降到给定的容忍度 τ 以下,或者最大迭代次数超过预定数。

众所周知,牛顿型算法在提供良好的初始猜测时收敛非常快。正则化参数 η 的选择对于获得满意的重建结果至关重要。为了选择合适的正则化参数并为牛顿算法提供良好的初始猜测,我们采用了一种路径跟随策略,这在许多应用中取得了成功[23]。具体而言,设定 ρ( 0,1 ) ,然后我们应用算法1,令 η n = η 0 ρ n ,初始猜测由 η n1 问题的解给出,即:

min ( A,f,g ) ad { F η n1 ( A,f,g )= l=1 L Ω A ( u A,f,g l,h z δ l )( u A,f,g l,h z δ l )dx+η( A L sym 2 ( Ω ) 2 + f L 2 ( Ω ) 2 + g L 2 ( Ω ) 2 ) }

这将为牛顿更新提供热启动,并充分利用了牛顿型方法的快速收敛性。最终的正则化参数是通过偏差原则确定的[24] [25]

算法1. 投影牛顿法

1: 给定初始猜测 ( A 0 , f 0 , g 0 ) 和容忍度 τ

2:for n=0,1,2, do

3: 求解牛顿系统(3.3)获得 u h l,n , f h n , A h n 的增量 u ¯ h l,n , f ¯ h n , A ¯ h n

4: 更新 u h l,n , f h n , A h n 通过

u h l,n+1 = u h l,n u ¯ h l,n f h n+1 = f h n f ¯ h n A h n+1 = A h n A ¯ h n l=1,,L

5: 将 A h n+1 投影到 A h 中。

6: 检查停机准则。

7: end for

总之,该算法包含两个循环。由于内部牛顿迭代的快速局部收敛性以及来自路径跟随策略的适当初始猜测,通常只需一到两个内部迭代即可确保收敛,因此,算法1预计将非常有效,这在下一部分的数值实验中得到了验证。

注:在实际应用中,面对未知真值的数据,可以采用启发式偏差原则(参考文献([26], Rule 2.1)),该原则仅依赖于测量数据就可以获得最终的正则化参数和反演结果。

4.2. 数值模拟

现在展示二维数值实验,以验证算法的准确性和效率。所有实验均在个人笔记本电脑上使用FreeFem++ [27]进行。所考虑的区域 Ω 取为 ( 1,1 )×( 1,1 ) 。使用一个 ( N+1 )×( N+1 ) 的均匀方形网格,其中 N=20 ,网格大小为 h=2/N 。用于反演 ( A,f,g ) 的数据 z l 是通过在更细的网格上求解问题来模拟的。带噪声的数据 z δ l 是通过对精确数据 z l 进行扰动生成的,即 z δ l ( x )= z l ( x )( 1+δξ( x ) ) ,其中 ξ [ 1,1 ] 上的正态分布, δ>0 表示相对噪声水平。在数值实验中,使用高阶Galerkin逼近,即将 V h ( T ) 选择为 P 2 有限元空间,而 X h ( T ) 选择为 P 1 有限元空间。数值结果表明,这种选择显著优于低阶有限元方法。这里考虑具有对角或非对角各向异性导电率的例子,数据对应于五个不同的Neumann边界条件 ( g 1 , g 2 , g 3 , g 4 , g 5 ):=( x 1 2 x 2 2 , x 1 x 2 , x 2 0.1 x 2 3 , x 1 + x 2 , x 1 ) ,使用 A (其元素为 A i,j ,( i,j=1,2 ) )来表示精确的导电率张量。测试实例及其不同特征列在表1中。为了对算法进行热启动,我们首先设定 η 0 =1 ,并在每次迭代后将其值减少一个因子 ρ=0.6 。重建的导电率 A ˜ 与精确导电率 A 的准确性通过相对误差 e= A ˜ A 2 A 2 来衡量。

Table 1. The test cases for the conductivity tensor and source term

1. 传导张量和源项的测试情况

A 11

A 12

A 22

f

1

2+sin( π x 1 )sin( π x 2 )

0.5sin( 2π x 1 )

2+ x 1 2 + x 2 2

x 1 + x 2

2

2+| x 1 |+| x 2 |

| x 1 x 2 |

2+| sin( π x 1 )sin( π x 2 ) |

x 1 + x 2

3

1+1 χ S 1

1 χ S 2

2+1 χ S 3

0.5+2 χ S 4

图1~3中展示了精确导电率张量、对于精确数据和带噪声数据的重建张量,以及一个横截面。这些图清晰地显示出,即使在不连续情况下,重建结果也相当准确。实际上,图1~3也显示出我们的算法能稳定且准确地恢复具有不同特征的各向异性导电率张量和源项,无论数据是精确的还是带有0.1%噪声的。

Figure 1. The reconstructions for the conductivity tensor and source term for Example 1: (a)~(d), (e)~(h), (i)~(l) and (m)~(p) refer to A 11 , A 12 , A 22 and f , respectively. (a), (e), (i) and (m) are for exact conductivity and source term; (b), (f), (j) and (n) for reconstruction with exact data; (c), (g), (k) and (o) for noisy data with δ=0.1% ; and (d), (h), (l) and (p) for the cross section along { x 2 =0 }

1. 例1中导电率张量和源项的重建结果:(a)~(d)、(e)~(h)、(i)~(l)和(m)~(p)分别对应于函数 A 11 A 12 A 22 和源项 f 。(a)、(e)、(i)和(m)为精确的导电率张量和源项;(b)、(f)、(j)和(n)为使用精确数据得到的重建结果;(c)、(g)、(k)和(o)为0.1%噪声下的重建;(d)、(h)、(l)和(p)为沿 x 2 =0 的横截面

Figure 2. The reconstructions for the conductivity tensor and source term for Example 2: (a)~(d), (e)~(h), (i)~(l) and (m)~(p) refer to A 11 , A 12 , A 22 and f , respectively. (a), (e), (i) and (m) are for exact conductivity and source term; (b), (f), (j) and (n) for reconstruction with exact data; (c), (g), (k) and (o) for noisy data with δ=0.1% ; and (d), (h), (l) and (p) for the cross section along { x 2 =0 }

2. 例2中导电率张量和源项的重建结果:(a)~(d)、(e)~(h)、(i)~(l)和(m)~(p)分别对应于函数 A 11 A 12 A 22 和源项 f 。(a)、(e)、(i)和(m)为精确的导电率张量和源项;(b)、(f)、(j)和(n)为使用精确数据得到的重建结果;(c)、(g)、(k)和(o)为0.1%噪声下的重建;(d)、(h)、(l)和(p)为沿 x 2 =0 的横截面

接下来简要检查算法的收敛性。图4展示了例3的相对误差和残差随迭代次数的变化。观察到,当噪声水平 δ 从1%降至0%时,重构解的准确性稳步提高。同时从图4中可以看出,算法具有良好的收敛性:无论噪声水平 δ 如何,约40次迭代后即收敛。这些结果验证了投影牛顿算法在导电率张量恢复中的效率。虽然未进一步展示,但这些观察结果在其他例子中同样适用。

Figure 3. The reconstructions for the conductivity tensor and source term for Example 3: (a)~(d), (e)~(h), (i)~(l) and (m)~(p) refer to A 11 , A 12 , A 22 and f , respectively. (a), (e), (i) and (m) are for exact conductivity and source term; (b), (f), (j) and (n) for reconstruction with exact data; (c), (g), (k) and (o) for noisy data with δ=0.1% ; and (d), (h), (l) and (p) for the cross section along { x 2 =0 }

3. 例3中导电率张量和源项的重建结果:(a)~(d)、(e)~(h)、(i)~(l)和(m)~(p)分别对应于函数 A 11 A 12 A 22 和源项 f 。(a)、(e)、(i)和(m)为精确的导电率张量和源项;(b)、(f)、(j)和(n)为使用精确数据得到的重建结果;(c)、(g)、(k)和(o)为0.1%噪声下的重建;(d)、(h)、(l)和(p)为沿 x 2 =0 的横截面

Figure 4. The convergence of the algorithm for Example 3 with noisy data. (a) represents the relative error in identifying the conductivity tensor A ; (b) represents the residual error in identifying the conductivity tensor A ; and (c) represents the relative error of the source term

4. 带有噪声数据的例3中算法的收敛性。(a) 是识别导电率张量 A 的相对误差;(b) 是识别导电率张量 A 的残差;(c) 是源项 f 的相对误差

5. 结论

本文针对椭圆方程的多参数识别问题提出了一种牛顿型算法。基于能量代价泛函和罚项构建了Tikhonov正则化模型,并推导出了该模型的一阶最优性系统。随后,采用投影牛顿算法在有限元空间中求解该最优性系统,实现了对椭圆方程中导电张量、源项和状态函数的同时反演。最后通过实例验证了算法的有效性和收敛性。

基金项目

江苏省大学生创新训练项目(202413573112Y),金陵科技学院科教融合项目(2024KJRH41),国家自然科学基金青年项目(No. 12101276)。

NOTES

*通讯作者。

参考文献

[1] 胡君君. 两类偏微分方程参数识别问题的研究[D]: [博士学位论文]. 武汉: 华中科技大学, 2012.
[2] Groetsch, C.W. (1993) Inverse Problems in the Mathematical Sciences. Informatica International, Inc. [Google Scholar] [CrossRef
[3] 王彦飞. 反演问题的计算方法及其应用[M]. 北京: 高等教育出版社, 2007.
[4] Banks, H.T. and Kunisch, K. (1989) Parameter Estimation Techniques for Distributed Systems. Birkhäuser. [Google Scholar] [CrossRef
[5] Vogel, C.R. (2002) Computational Methods for Inverse Problems. Society for Industrial and Applied Mathematics. [Google Scholar] [CrossRef
[6] Tikhonov, A. (1991) Ill-Posed Problems in Natural Sciences. Proceedings of the International Conference Held in Moscow, Moscow, 19-25 August 1991, 19-25.
[7] Anger, G. (1990) Inverse Problems in Differential Equations. Plenum Press. [Google Scholar] [CrossRef
[8] Tam Quyen, T.N. (2020) Determining Two Coefficients in Diffuse Optical Tomography with Incomplete and Noisy Cauchy Data. Inverse Problems, 36, Article 095011. [Google Scholar] [CrossRef
[9] Hào, D.N. and Quyen, T.N.T. (2012) Convergence Rates for Tikhonov Regularization of a Two-Coefficient Identification Problem in an Elliptic Boundary Value Problem. Numerische Mathematik, 120, 45-77. [Google Scholar] [CrossRef
[10] Hein, T. and Meyer, M. (2008) Simultaneous Identification of Independent Parameters in Elliptic Equations—Numerical Studies. Journal of Inverse and Ill-Posed Problems, 16, 417-433. [Google Scholar] [CrossRef
[11] Deckelnick, K. and Hinze, M. (2012) Convergence and Error Analysis of a Numerical Method for the Identification of Matrix Parameters in Elliptic PDEs. Inverse Problems, 28, Article 115015. [Google Scholar] [CrossRef
[12] Hinze, M. and Quyen, T.N.T. (2016) Matrix Coefficient Identification in an Elliptic Equation with the Convex Energy Functional Method. Inverse Problems, 32, Article 085007. [Google Scholar] [CrossRef
[13] Hoffmann, K.-H. and Sprekels, J. (1985) On the Identification of Coefficients of Elliptic Problems by Asymptotic Regularization. Numerical Functional Analysis and Optimization, 7, 157-177. [Google Scholar] [CrossRef
[14] Hsiao, G.C. and Sprekels, J. (1988) A Stability Result for Distributed Parameter Identification in Bilinear Systems. Mathematical Methods in the Applied Sciences, 10, 447-456. [Google Scholar] [CrossRef
[15] Carvalho, E.P., Martínez, J., Martínez, J.M. and Pisnitchenko, F. (2015) On Optimization Strategies for Parameter Estimation in Models Governed by Partial Differential Equations. Mathematics and Computers in Simulation, 114, 14-24. [Google Scholar] [CrossRef
[16] He, Y. (2007) PDE-Based Parameter Reconstruction through a Parallel Newton-Krylov Method. Communications in Computational Physics, 2, 769-787.
[17] Chavent, G. (2009) Nonlinear Least Squares for Inverse Problems. Theoretical Foundations and Step-by-Step Guide for Applications. Springer. [Google Scholar] [CrossRef
[18] Attouch, H., Buttazzo, G. and Michaille, G. (2006) Variational Analysis in Sobolev and BV Space. SIAM. [Google Scholar] [CrossRef
[19] Liu, H., Jin, B. and Lu, X. (2022) Imaging Anisotropic Conductivities from Current Densities. SIAM Journal on Imaging Sciences, 15, 860-891. [Google Scholar] [CrossRef
[20] Bal, G., Guo, C. and Monard, F. (2014) Imaging of Anisotropic Conductivities from Current Densities in Two Dimensions. SIAM Journal on Imaging Sciences, 7, 2538-2557. [Google Scholar] [CrossRef
[21] Brenner, S. and Scott, R. (2008) The Mathematical Theory of Finite Element Methods. Springer. [Google Scholar] [CrossRef
[22] Tarantola, A. (2005) Inverse Problem Theory and Methods for Model Parameter Estimation. Society for Industrial and Applied Mathematics. [Google Scholar] [CrossRef
[23] Jiao, Y., Jin, B. and Lu, X. (2015) A Primal Dual Active Set with Continuation Algorithm for the ℓ0-Regularized Optimization Problem. Applied and Computational Harmonic Analysis, 39, 400-426. [Google Scholar] [CrossRef
[24] Engl, H., Hanke, M. and Neubauer, A. (1996) Regularization of Inverse Problems. Springer. [Google Scholar] [CrossRef
[25] Ito, K. and Jin, B. (2014) Inverse Problems. World Scientific. [Google Scholar] [CrossRef
[26] Liu, H., Real, R., Lu, X., Jia, X. and Jin, Q. (2020) Heuristic Discrepancy Principle for Variational Regularization of Inverse Problems. Inverse Problems, 36, Article 075013. [Google Scholar] [CrossRef
[27] Hecht, F. (2012) New Development in FreeFem++. Journal of Numerical Mathematics, 20, 251-265. [Google Scholar] [CrossRef