Hilbert空间中增量型不精确拟牛顿算法的局部收敛性分析
Local Convergence Analysis of Incremental Inexact Quasi-Newton Algorithm in Hilbert Space
DOI: 10.12677/aam.2025.143111, PDF, HTML, XML,    科研立项经费支持
作者: 郑 浠, 张 鹏*:牡丹江师范学院数学科学学院,黑龙江 牡丹江
关键词: Hilbert空间增量型不精确拟牛顿算法Broyden方法Hilbert Space Incremental Inexact Quasi-Newton Algorithm Broyden Method
摘要: 在图像处理,机器学习和工程学等应用领域中,通常需要处理一些定义在Hilbert空间中的大规模算子方程。为求解这类算子方程及最值问题,构造了一类增量型不精确Broyden方法并证明了该算法的线性收敛和局部超线性收敛性。该算法降低了在处理大规模问题中所产生的储存成本,并通过应用证明了该算法的有效性。
Abstract: In application fields such as image processing, machine learning, and engineering, it is often necessary to solve large-scale operator equations defined in Hilbert spaces. To address such operator equations and optimization problems, a class of incremental inexact Broyden methods has been developed, and the linear convergence as well as local superlinear convergence of this algorithm has been proven. This algorithm reduces the storage costs associated with handling large-scale problems, and its effectiveness has been demonstrated through practical applications.
文章引用:郑浠, 张鹏. Hilbert空间中增量型不精确拟牛顿算法的局部收敛性分析[J]. 应用数学进展, 2025, 14(3): 243-257. https://doi.org/10.12677/aam.2025.143111

1. 引言

随着大数据时代的到来,其深刻改变着人类的生活和工作方式。数据量的急剧增长是大数据时代最直观的表现。从GB到TB,再到PB、EB,数据量的爆炸式增长对存储和处理能力提出了前所未有的挑战,处理速度的快慢直接关系到大数据的时效性。因此,在大数据时代需要不断创新数据处理和分析技术,才能更好地挖掘和利用大数据的潜力,推动社会进步和经济发展。

在图像处理[1]-[3],机器学习[4] [5]和工程学[6] [7]等应用领域中通常是将实际问题转换为算子方程进行求解,考虑抽象空间中算子方程的一般形式为

F( x )= 1 n i=1 n f i ( x ) =0 (1)

其中 f i ( x ):XY 是非线性算子, X,Y 是Hilbert空间。

关于求解非线性方程组的研究已经有很长的历史。在有限维空间中,当F是个非线性算子时,牛顿法较为经典,其具有二阶的收敛速度,但需要精确计算导算子,使得牛顿法在实际的应用受到限制,特别在大规模问题及其不适用。为了解决上述问题,[8]提出了一种新的迭代算法——Broyden迭代算法,其核心优势在于避免了传统导算子的复杂计算过程,并保持了优于常规算法的收敛效率。该算法在非线性最小范数问题和非光滑优化等应用领域中表现出较为明显的优势。然而,当涉及需要离散化处理的无穷维空间问题时,经典Broyden方法受限于有限维近似带来的误差积累,其收敛速率明显降低。为解决该问题,[9]通过构建Hilbert空间的理论框架,将Broyden方法扩展至无穷维情形下的非线性算子方程求解,并证明了算法的线性收敛性和超线性收敛,使得Broyden方法更具一般性。

在无限维空间中,关于求解非线性方程组和无约束优问题的不精确牛顿类方法的研究很多。针对Banach空间中半光滑算子方程的求解问题,[10]提出了两种不精确牛顿法,并分别证明了两种方法的全局收敛性。[11]通过对非线性最小二乘问题的高斯牛顿法展开理论分析,基于Hölder连续性的假设框架,并在仿射不变条件下建立了不精确高斯牛顿法的局部收敛理论,证明了算法在临界点邻域内具有确定的收敛半径和1 + p阶超线性收敛速率。为求解无约束极大极小问题,[12]通过引入光滑凝聚函数对非光滑极大值函数进行可微逼近,将原问题转化为光滑无约束优化形式,再使用不精确牛顿法进行求解,并证明了算法的全局收敛性。值得注意的是,[13]基于[9]的理论基础上,进一步研究了Hilbert空间上算子方程的不精确拟牛顿法,成功将有限维不精确拟牛顿法拓展至Hilbert空间中用于解决算子方程求解问题,并证明了其线性收敛性和超线性收敛性。

在Hilbert空间中,关于增量型不精确拟牛顿法的研究很少。当面对大规模问题时,面对大量的数据时,现有的计算机只能存储有限个数据和做有限次运算,所以如何降低存储成本和提高收敛速度是有必要研究的。[14]对有限维空间中的增量拟牛顿法(IQN)的收敛性和存储成本进行了研究,为将不精确拟牛顿法与增量思想相结合,并推广至无限维空间中作了准备。

本文在[13]的基础上,将Hilbert空间中的不精确拟牛顿法与增量思想相结合,构造了增量型不精确拟牛顿方法用于解决大规模的抽象算子方程问题中出现的存储成本高昂的问题,并证明了该方法的局部收敛性。

2. 预备知识

本研究建立的理论框架基于以下基本假设:

假设1 (解的存在性):非线性算子 f i ( x ):XY ,存在最优解 x X ,使得 F ( x )= 1 n i=1 n f i ( x ) =0

假设2:非线性算子 f i 在解邻域 B δ ( x ) 内Fréchet可微,且在解邻域内 f i 是局部Lipschitz连续的。

假设3: f i ( x ) 是非奇异的或存在 γ>0 ,使得对任意的 xX f i ( x )( x ) γ x

为证明超线性收敛,需要下面的定义及引理:

定义2.1 [9]:设 X,Y 是Hilbert空间。算子 DB( X,Y ) 称为Hilbert-Schmidt算子,若存X的某个标准正交基 { a α :αA } 使得 αA D a α Y 2 <

引理2.1 [9]:设 X,Y 是Hilbert空间, x i X y i Y i=1,2 TB( X,Y ) 则以下性质成立,其中 T 表示伴随算子:

(i) ( y 1 x 1 ) = x 1 y 1 B( Y,X )

(ii) ( y 1 x 1 )( x 2 y 2 )= x 1 , x 2 ( y 1 y 2 )B( Y,Y )

(iii) T( x 1 y 1 )=T x 1 y 1 B( Y,Y )

(iv) ( y 1 x 1 ) T = y 1 T x 1 B( Y,Y )

(v) y 1 x 1 = y 1 x 1

引理2.2 [9]:设 X,Y 是Hilbert空间, x 1 , x 2 X D 1 是Hilbert-Schmidt算子。则对于定义2.1中的标准正交基 { a α :αA } ,对每个算子 TB( X,X ) 进行定义

trT= αA a α ,T a α

只要和是有限的,则以下结论成立:

(i) 对于 i=1,2 tr T i < ,则 tr( T 1 + T 2 )=tr T 1 +tr T 2

(ii) tr x 1 x 2 = x 1 , x 2

3. 增量型不精确拟牛顿型的收敛性分析

为本节主要构造了增量型不精确拟牛顿算法,并对其收敛性进行了分析和证明,为证明第四节Hilbert空间增量型不精确拟牛顿算法的收敛性做好准备。

增量型不精确拟牛顿算法

为解决大规模抽象算子问题,根据不精确拟牛顿算法和[14]中所提出的以循环方式选择进行更新的增量拟牛顿方法,构造的增量型不精确拟牛顿算法框架如下:

算法3.1增量型不精确拟牛顿算法

步0:设 x 0 { B i 0 } i=1 n 分别为初始迭代点和初始迭代算子;

步1:设 z 1 0 = z 2 0 == z n 0 = x 0

步2:设 g 0 = 1 n i=1 n f i ( x 0 ) ( B ˜ 0 )= 1 n i=1 n B i 0

步3:对于 k=0,1, 做循环更新:

3.1设 i k =( kmodn )+1 ,是对于所有k做循环选择需要满足的重要索引,

3.2计算 x k+1 = x k +Δ x k ,其中 Δ x k 为非精确求解得到并满足

r k = B ˜ k Δ x k + g k r k g k η k η k [ 0,1 )

3.3当 i= i k 时,计算 s i k k+1 , y i k k+1 和其中根据 B i k B( X,Y ) 的迭代方法计算 B i k k+1

s i k = z i k+1 z i k y i k = f i ( z i k+1 ) f i ( z i k )

3.4更新 B ˜ k+1 和有关函数信息表,其中

{ z i k k+1 = x k+1   i= i k z i k+1 = z i k     i i k   { f i k ( z i k+1 )= f i k ( x k+1 )  i= i k f i ( z i k+1 )= f i ( z i k )      i i k   { B ˜ k+1 = B ˜ k + 1 n ( B i k k+1 B i k k )  i= i k g k+1 = g k + 1 n ( f i k ( z i k k+1 ) f i k ( z i k k ) )  i= i k B i k+1 = B i k    i i k

基于该算法,有如下的线性收敛性定理:

定理3.1:设 X,Y 是Hilbert空间, f i :XY 是非线性算子,假设在假设均成立的情况下,算法3.1产生的迭代序列 { x k } ,存在 ε>0 η>0 满足 ε< 1 f i ( x ) 1 ( 1 n i=1 n B i k ) 1 ( L( η+1 ) 2 ε+η f i ( x ) +ε )<1 ,其中 η k [ 0,η ) 0<η<1 L为Lipschitz常数,当首次迭代点 x 0 B i k 对任意 kN i=1,2,,n 满足 x 0 x ε B i k f i ( x ) ε ,则序列 { x k } 满足

x k x r [ k1 n ]+1 x 0 x (2)

证明:由算法3.1可知

x k+1 x = x k +Δ x k x = z i k +( r k g k ) ( B ˜ k ) 1 x = z i k +( r k 1 n i=1 n f i ( z i k ) ) ( 1 n i=1 n B i k ) 1 x = ( 1 n i=1 n B i k ) 1 [ 1 n i=1 n B i k z i k + r k 1 n i=1 n f i ( z i k ) 1 n i=1 n B i k x ] = ( 1 n i=1 n B i k ) 1 r k ( 1 n i=1 n B i k ) 1 [ 1 n i=1 n f i ( z i k ) 1 n i=1 n B i k ( z i k x ) ] (3)

对式(3)同时加上并减去 1 n i=1 n f i ( x )( z i k x ) ,并重新排列项得到

x k+1 x = ( 1 n i=1 n B i k ) 1 r k ( 1 n i=1 n B i k ) 1 [ 1 n i=1 n f i ( z i k ) 1 n i=1 n f i ( x )( z i k x ) + 1 n i=1 n f i ( x )( z i k x ) 1 n i=1 n B i k ( z i k x ) ] = ( 1 n i=1 n B i k ) 1 r k ( 1 n i=1 n B i k ) 1 [ 1 n i=1 n f i ( z i k ) 1 n i=1 n f i ( x )( z i k x ) + 1 n i=1 n ( f i ( x ) B i k )( z i k x ) ] ( 1 n i=1 n B i k ) 1 r k + ( 1 n i=1 n B i k ) 1 [ 1 n i=1 n f i ( z i k ) 1 n i=1 n f i ( x )( z i k x ) + 1 n i=1 n ( f i ( x ) B i k )( z i k x ) ]

由于 r k = B ˜ k Δ x k + g k 且满足 r k g k η k η k [ 0,η ) ,则有

x k+1 x ( 1 n i=1 n B i k ) 1 r k + ( 1 n i=1 n B i k ) 1 [ 1 n i=1 n f i ( z i k ) 1 n i=1 n f i ( x )( z i k x ) + 1 n i=1 n ( f i ( x ) B i k )( z i k x ) ] ( 1 n i=1 n B i k ) 1 η g k + ( 1 n i=1 n B i k ) 1 1 n i=1 n f i ( z i k ) 1 n i=1 n f i ( x )( z i k x ) + 1 n i=1 n ( f i ( x ) B i k )( z i k x )

f i ( z i k ) x 处的泰勒展开得到

x k+1 x ( 1 n i=1 n B i k ) 1 r k + ( 1 n i=1 n B i k ) 1 [ 1 n i=1 n f i ( z i k ) 1 n i=1 n f i ( x )( z i k x ) + 1 n i=1 n ( f i ( x ) B i k )( z i k x ) ] ( 1 n i=1 n B i k ) 1 η g k + ( 1 n i=1 n B i k ) 1 1 n i=1 n f i ( z i k ) 1 n i=1 n f i ( x )( z i k x ) + 1 n i=1 n ( f i ( x ) B i k )( z i k x ) ( 1 n i=1 n B i k ) 1 η 1 n i=1 n f i ( z i k ) + ( 1 n i=1 n B i k ) 1 ( L 2n i=1 n z i k x 2 + 1 n i=1 n f i ( x ) B i k z i k x )

又因 B i k f i ( x ) ε ,最后得到

x k+1 x ( 1 n i=1 n B i k ) 1 η( L 2n i=1 n z i k x 2 + 1 n i=1 n f i ( x ) z i k x ) + ( 1 n i=1 n B i k ) 1 ( L 2n i=1 n z i k x 2 + 1 n i=1 n f i ( x ) B i k z i k x ) ( 1 n i=1 n B i k ) 1 L( η+1 ) 2n z i k x i=1 n z i k x (4)

+ ( 1 n i=1 n B i k ) 1 ( + η n f i ( x ) + 1 n f i ( x ) B i k ) i=1 n z i k x ( 1 n i=1 n B i k ) 1 ( L( η+1 ) 2n ε+ η n f i ( x ) + ε n ) i=1 n z i k x

由式(4),可得到首次迭代

x 1 x ( 1 n i=1 n B i 0 ) 1 ( L( η+1 ) 2n ε+ η n f i ( x ) + ε n ) i=1 n z i 0 x ( 1 n i=1 n B i 0 ) 1 ( L( η+1 ) 2 ε+η f i ( x ) +ε ) x 0 x

由于 r= ( 1 n i=1 n B i k ) 1 ( L( η+1 ) 2 ε+η f i ( x ) +ε )<1 ,则

x 1 x r x 0 x <ε

继续进行下一次迭代,有不等式

x 2 x ( 1 n i=1 n B i 1 ) 1 ( L( η+1 ) 2n ε+ η n f i ( x ) + ε n ) i=1 n z i 1 x = ( 1 n i=1 n B i 1 ) 1 ( L( η+1 ) 2 ε+η f i ( x ) +ε )( n1 n x 0 x + 1 n x 1 x ) r( n1 n x 0 x + 1 n x 1 x ) r x 0 x

同理可证,对于所有的迭代 k=1,n ,有 x k x ε 。此外,当 k=1,,n 时,有 x k x r x 0 x

现在使用迭代 k=1,,n 作为归纳论证的基础。为了更精确,假设对于迭代 k=jn+1,jn+2,,jn+n ,残差的上界为 x k x r j+1 x 0 x

下面证明,对于迭代序列 k=( j+1 )n+1,( j+1 )n+2,,( j+1 )n+n ,不等式 x k x r j+2 x 0 x 成立。

基于不等式 B i k f i ( x ) ε f i ( x ) 1 有界,可以证明,对于所有的 k=jn+1,jn+2,,jn+n ,有 ( 1 n i=1 n B i k ) 1 是一致有界的。对于迭代 k=( j+1 )n+1 ,有

x ( j+1 )n+1 x ( 1 n i=1 n B i ( j+1 )n ) 1 ( L( η+1 ) 2n ε+ η n f i ( x ) + ε n ) i=1 n z i ( j+1 )n x ( 1 n i=1 n B i ( j+1 )n ) 1 ( L( η+1 ) 2n ε+ η n f i ( x ) + ε n ) i=1 n z i ( j+1 )n x (5)

由于变量以循环方式更新,因此变量集合 { z i ( j+1 )n } i=1 i=n 等于集合 { x ( j+1 )ni } i=0 i=n1 且对于所有的 j=1,,n 满足 x jn+i x ε ,因此可以将式(5)的右侧简化为

x ( j+1 )n+1 x ( 1 n i=1 n B i ( j+1 )n ) 1 ( L( η+1 ) 2 ε+η f i ( x ) +ε )( 1 n i=1 n x jn+i x ) r( 1 n i=1 n x jn+i x ) (6)

并假设对迭代序列 k=jn+1,jn+2,,jn+n ,有 x k x r j+1 x 0 x ,则有

x ( j+1 )n+1 x r j+2 x 0 x (7)

即证得式(2)。

因此,算法3.1具有Q线性收敛性,其线性收敛因子 r<1 随参数 ε η 的选择而变化,可获得多样的收敛性因子值。

定理3.2:设 X,Y 是Hilbert空间, f i :XY 是非线性算子,在假设条件均成立的情况下, { B ˜ k } 可逆。假设由算法3.1产生的迭代序列 { x k } 收敛到 x ,若 η k =ο( 1 ) ,即 r i k =ο( f i ( z i k+1 ) ) ,则残差序列 x k x 满足:

lim k x k x 1 n ( x k1 x ++ x kn x ) =0 (8)

的充要条件是对于所有的 i=1,2,,n

( B i k f i ( x ) )( z i k x ) =ο( z i k x )

证明:当 f i 满足假设条件(a)~(c)时,对任意向量 x, x ^ , x X

f i ( x ^ ) f i ( x ) f i ( x )( x ^ x ) Lmax{ x ^ x , x x } x ^ x (9)

其中L是Lipschitz常数。故

( B i k f i ( x ) )( z i k+1 z i k )= f i ( z i k+1 ) f i ( z i k ) f i ( x )( z i k+1 z i k )+ r i k f i ( z i k+1 ) (10)

结合式(9)与式(10)得到

r i k f i ( z i k+1 ) z i k+1 z i k Lmax{ z i k x , z i k+1 x } ( B i k f i ( x ) )( z i k+1 z i k ) z i k+1 z i k Lmax{ z i k x z i k+1 x }+ r i k f i ( z i k+1 ) z i k+1 z i k

从而

lim k ( B i k f i ( x ) )( z i k+1 z i k ) z i k+1 z i k =0 (11)

式(11)成立的充要条件为

lim k r i k f i ( z i k+1 ) z i k+1 z i k =0 (12)

下面证明式(12)为式(8)成立的充要条件:

假设 lim k x k x 1 n ( x k1 x ++ x kn x ) =0 成立且 i=1 n z i k x = i=0 n1 x ki x ,则有

lim k x k+1 x 1 n i=1 n z i k x =0

表明算法3.1生成的迭代序列具有平均超线性收敛速度。更准确地说,它表明在步骤k捕获误差的比值除以最后n个误差的平均值收敛于零。

由式(9)可知

f i ( z i k+1 ) f i ( x ) f i ( x )( z i k+1 x ) L z i k+1 x 2

可立即得到

f i ( z i k+1 ) f i ( x )+ f i ( x )( z i k+1 x ) +L z i k+1 x 2 =Ο( z i k+1 x )=ο( z i k x )

同理可得 f i ( z i k ) =ο( z i k x )

又因为 r i k η k g i k = η k f i ( z i k ) ,其中 η k 0 ,从而有

r i k =ο( z i k x )

r i k f i ( z i k+1 ) =ο( z i k x )=ο( z i k+1 z i k )

反之若

lim k r i k f i ( z i k+1 ) z i k+1 z i k =0

则式(11)成立。

下证 lim k x k x 1 n ( x k1 x ++ x kn x ) =0 ,由定理3.1中的式(4)可得

x k+1 x ( 1 n i=1 n B i k ) 1 η( L 2n i=1 n z i k x 2 + 1 n i=1 n f i ( x ) z i k x ) + ( 1 n i=1 n B i k ) 1 ( L 2n i=1 n z i k x 2 + 1 n i=1 n f i ( x ) B i k z i k x ) (13)

将式(13)的两边同时除以 1 n i=1 n z i k x 得到

x k+1 x 1 n i=1 n z i k x ( 1 n i=1 n B i k ) 1 ( ηL 2 i=1 n z i k x 2 +η i=1 n f i ( x ) z i k x ) i=1 n z i k x + ( 1 n i=1 n B i k ) 1 ( L 2 i=1 n z i k x 2 + i=1 n ( f i ( x ) B i k )( z i k x ) ) i=1 n z i k x

由于误差 z i k x 是误差 i=1 n z i k x 的和的下界,因此将 i=1 n z i k x 替换为 z i k x ,则有

x k+1 x 1 n i=1 n z i k x ( 1 n i=1 n B i k ) 1 L( 1+η ) 2 i=1 n z i k x + ( 1 n i=1 n B i k ) 1 η i=1 n f i ( x ) + ( 1 n i=1 n B i k ) 1 i=1 n ( f i ( x ) B i k )( z i k x ) z i k x (14)

由于 ( 1 n i=1 n B i k ) 1 有上界,对式(14)求极限得到:

lim k x k+1 x 1 n i=1 n z i k x =0

定理3.2的结果并不等价于经典的Q-超线性收敛的拟牛顿法,即 lim k x k+1 x / x k x =0 。虽然残差 x k x 的Q-超线性收敛性是不可证明的,但可以证明序列 x k x 存在一个超线性收敛于零的子序列且该子序列为 x k x 的上界。

定理3.3:假设定理3.1和定理3.2中的条件成立,迭代序列由算法3.1产生,存在 x k x 一个子序列并超线性收敛到零。即存在一个序列 ς k ,对于所有 k0 满足 x k x ξ k ,且序列 ξ k 以超线性速率收敛到零,即有

lim k ς k+1 ς k =0

证明:见文[14]

4. Broyden修正不精确增量拟牛顿法的收敛性分析

本节基于第三节的内容,进一步证明了Hilbert空间中增量型不精确拟牛顿算法的局部收敛性。

增量型不精确Broyden算法

B i k 的迭代公式由Broyden修正给出,得到算法4.1:

算法4.1增量型不精确Broyden算法

步0:给出初始迭代点 x 0 X 和初始迭代算子 { B i 0 } i=1 n ,其中 x 0 x 充分接近,算子 { B i 0 } i=1 n { f i ( x 0 ) } i=1 n 也充分接近,并给出合理的容差范围;

步1:设 z 1 0 = z 2 0 == z n 0 = x 0

步2:设 g 0 = 1 n i=1 n f i ( x 0 ) ( B ˜ 0 )= 1 n i=1 n B i 0

步3:对于 k=0,1, 做循环更新直到 { x k } 收敛;

3.1设 i k =( kmodn )+1 ,是对于所有k做循环选择需要满足的重要索引,

3.2计算 x k+1 = x k +Δ x k ,其中 Δ x k 为非精确求解得到并满足

r k = B ˜ k Δ x k + g k r k g k η k η k [ 0,1 )

3.3当 i= i k 时,计算 s i k k+1 , y i k k+1 , B i k k+1 ,其中

s i k = z i k+1 z i k y i k = f i ( z i k+1 ) f i ( z i k ) B i k+1 = B i k + ( y i k B i k s i k ) s i k s i k , s i k

3.4更新 B ˜ k+1 和有关函数信息表,其中

{ z i k k+1 = x k+1   i= i k z i k+1 = z i k     i i k   { f i k ( z i k+1 )= f i k ( x k+1 )  i= i k f i ( z i k+1 )= f i ( z i k )      i i k   { B ˜ k+1 = B ˜ k + 1 n ( B i k k+1 B i k k )  i= i k g k+1 = g k + 1 n ( f i k ( z i k k+1 ) f i k ( z i k k ) )  i= i k B i k+1 = B i k    i i k

由第三节内容可证得算法4.1的线性收敛定理如下:

定理4.1: X,Y 是Hilbert空间, f i :XY 是非线性算子,在满足所有假设条件下且 { B ˜ k } 可逆。L为Lipschitz常数。控制序列 { η k } 满足 η k [ 0,η ) 0<η<1 ,存在 ε>0 η>0 ,当

ε< 1 f i ( x ) 1

( 1 n i=1 n B i k ) 1 ( L( η+1 ) 2 ε+η f i ( x ) +ε )<1

时,若 x 0 X B i 0 满足 x 0 x ε B i 0 f i ( x ) ε ,则由算法4.1产生的迭代点列 { x k } 至少Q-线性收敛于 x

证明:由定理3.1证明可知,存在 ε 1 >0 η 1 >0 ,使得 x 0 x ε 1 B i k f i ( x ) ε 1 ,对任意 kN x k+1 x r 1 x k x ,其中 r 1 ( 0,1 ) 。若初始迭代点 x 0 满足 x 0 x ε< ε 1 且初始迭代算子 B i 0 满足 B i 0 f i ( x ) ε< ε 1 ,则式子 x t x ε 1 B i t f i ( x ) ε 1 ,对于 t=0 是成立的。接下来,将采用归纳法,证明上述两个式子对任意情况的t均成立。假设对于 t=0,1,,kN 时,有 x t x ε 1 B i t f i ( x ) ε 1 成立,又

B i t+1 f i ( x ) = B i t + ( y i t B i t s i t ) s i t s i t , s i t f i ( x ) = ( B i t f i ( x ) )( I s i t s i t s i t , s i t )+ ( y i t f i ( x ) s i t ) s i t s i t , s i t B i t f i ( x ) I s i t s i t s i t , s i t + ( y i t f i ( x ) s i t ) s i t s i t , s i t (15)

X的内积的定义,有

I s i t s i t s i t , s i t =1

利用归纳假设并由定理3.1的证明过程可知

x t+1 x r 1 x t x ,t=0,1,,k (16)

由上式(16)以及 f i ( x ) 的局部Lipschitz连续性有对于 t=0,1,,k

( y i t f i ( x ) s i t ) s i t s i t y i t f i ( x ) s i t f i ( x t + τ i t s i t ) f i ( x ) s i t 2 L( τ i t x t+1 x +( 1 τ i t ) x t x ) s i t 2 L x t x s i t 2

f i ( x ) 的连续性和中值定理可得 τ i t [ 0,1 ] L为Lipschiz常数。

ε= ε 1 ( 1+2L+2L( n1 ) r 1 +2L ( r 1 ) 2 ) 1

显然 ε< ε 1 ,对于 t=0,1,,k

x t+1 x r 1 x t x ( r 1 ) [ t n ]+1 x 0 x ( r 1 ) [ t n ]+1 ε

B i t+1 f i ( x ) B i t f i ( x ) +L x t x B i t f i ( x ) +2L x t x (17)

对式(17)两边进行求和可得

B i k+1 f i ( x ) B i 0 f i ( x ) + t=0 k 2L x t x B i 0 f i ( x ) + t=0 k 2L ( r 1 ) [ t1 n ]+1 ε ε+2Lε( 1+( n1 ) r 1 + ( r 1 ) 2 ) =ε( 1+2L+2L( n1 ) r 1 +2L ( r 1 ) 2 )= ε 1

这说明 x t x ε 1 B i t f i ( x ) ε 1 对于所有的k都成立,结合定理3.1有

x k+1 x ( r 1 ) [ k n ]+1 x 0 x < ε 1

该算法的线性收敛得到证明。

定理4.2:在定理4.1的假设条件下,初始迭代算子 B i 0 满足 B i 0 f i ( x ) 是Hilbert-Schmidt算子且 r i k =ο( f i ( z i k+1 ) ) 。则存在 ε>0 使得当 x 0 B i 0 满足 x 0 x ε B i 0 f i ( x ) ε 时,算法4.1产生的残差序列 x k x 满足:

lim k x k x 1 n ( x k1 x ++ x kn x ) =0

证明:由式(15)有

B i k+1 f i ( x )= B i k f i ( x )+ ( y i t B i t s i t ) s i t s i t , s i t =( B i k f i ( x ) )( I s i k s i k s i k , s i k )+ ( y i k f i ( x ) s i k ) s i k s i k , s i k (18)

D k = B i k f i ( x )B( X,Y ) e k = s i k s i k X d k = y i k f i ( x ) s i k s i k Y ,则式(18)可简化为

D k+1 = D k ( I e k e k )+ d k e k

由引理2.1中的性质(i)~(iv)和 e k =1 ,可以简化 D k+1 D k+1 B( Y,Y ) 如下:

D k+1 D k+1 =( ( I e k e k ) D k + e k d k )( D k ( I e k e k )+ d k e k ) =( I e k e k ) D k D k ( I e k e k )+( e k d k )( D k D k e k e k ) +( I e k e k ) D k d k e k + d k 2 e k e k = D k D k ( e k D k D k e k + D k D k e k e k )+ D k e k 2 e k e k + e k D k d k + D k d k e k +( d k 2 2 d k , D k e k e k e k ) (19)

通过假设, D 1 是一个Hilbert-Schmidt算子,即对于 X 存在 { e i } iI 的标准正交基使得

iI e i , D 1 D 1 e i <

在式(19)中从 D k D k D k+1 D k+1 的每一个修正都由秩为1的算子的有限和给出。因此,根据引理2.2知所有算子 D k D k kN ,的迹 tr( D k D k ) 是有限的。通过 tr tr( x 1 x 2 )= x 1 , x 2 的线性性质,对式(19)在两侧取迹进行化简得到:

tr( D k+1 D k+1 )=tr( D k D k ) D k e k 2 + d k 2 (20)

连续使用式(20)可得

tr( D k+1 D k+1 )=tr( D 1 D 1 )+ i=1 k ( d i 2 D i e i 2 ) (21)

根据定义 tr( D k+1 D k+1 ) 是范数之和是非负的,则有:

i=1 k D i e i 2 tr( D 1 D 1 )+ i=1 k d i 2 (22)

f i 可微的情况下,可以使用Lipschitz常数 L>0 [15]中的中值定理知对 d k 进行估计

d k = f i ( x k+1 ) f i ( x k ) f i x ( x k+1 x k ) x k+1 x k 1 L x k x

利用线性收敛速度,得到对于某个 κ( 0,1 ) ,对所有的 kN

i=0 k d i 2 i=0 k L 2 x i x 2 L 2 x 0 x 2 i=0 k1 ( κ 2 ) i L 2 x 0 x ( 1 κ 2 ) 1

因此,式(22)中左侧不等式的和也是有限的,即

i=1 k D i e i 2 <

并且得到

lim k D k e k = lim k ( B i k f i ( x ) ) s i k s i k =0 (23)

式(23)为Dennis-More条件[16]。已知其在有限维情况下是超线性收敛的。为了达到在无限维情况下的目的有,

γ x k+1 x 1 n i=1 n z i k x f i ( x )( x k+1 x ) 1 n i=1 n z i k x n f i ( x )( x k+1 x ) z i k x 2n ( B i k f i ( x ) ) s i k s i k +L z i k x 2 (24)

其中第一个不等式由假设3得到,第二个不等式由误差 z i k x 是误差 i=1 n z i k x 的和的下界得到,第三个不等式由文[9]中定理3.1的证明可知,并结合式(23),当 k 时,有

lim k x k x 1 n ( x k1 x ++ x kn x ) =0

5. 应用

针对非线性算子方程的高效求解问题,考虑采用具有增量型不精确Broyden方法。参见[17]知可将非线性积分方程如下表示:

X为Hilbert空间,Y为Banach空间, G:XY 是非线性算子, V:YX 是线性算子。对于给定 hY ,有最优解 x 满足

x VG x =h (25)

定理5.1:设 X,Y 分别是Hilbert空间和Banach空间,在 B δ ( x ) 内, G:XY 是Fréchet可微的且导数 G x 满足Lipschitz连续性, VB( Y,X ) ,且对任意的 xX V G x :XX 是Hilbert-Schmidt算子,且 V G x 的特征值不是1, r i k =ο( f i ( z i k+1 ) ) 。则存在 ε>0 η>0 ,当

ε< 1 f i ( x ) 1 ( 1 n i=1 n B i k ) 1 ( L( η+1 ) 2 ε+η f i ( x ) +ε )<1

若初始迭代点 x 0 X 满足 x 0 x ε ,初始迭代算子 B i 0 B( X,X ) B i 0 =I v i g i ( x 0 ) 时,算法4.1产生的迭代点列超线性收敛到 x

证明:定义 F( x )= 1 n i=1 n f i ( x ) f i ( x ):XX

f i ( x )=x v i g i xh

并假设 f i f i -可微的,则

f i ( x )=I v i g i ( x )

在满足定理5.1的条件下,存在 m>0 对于所有的 uU

f i ( x )( u ) = ( I v i g i ( x ) )u m u

B i 0 =I v i g i ( x 0 )

B i 0 f i ( x )=I v i g i ( x 0 )I+ v i g i ( x )= v i ( g i ( x ) g i ( x 0 ) ) (26)

和对于某些常数 κ>0

B i 0 f i ( x ) v i g i ( x ) g i ( x 0 ) v i κ x x 0

因此,若 x x 0 很小,则 B i 0 f i ( x ) 也很小。此外,由假设与Hilbert-Schmidt算子的可加性,证明式(26)是Hilbert-Schmidt算子。因此,由定理4.2可得到超线性收敛速度结果。

基金项目

这项研究由黑龙江省科研业务费一般项目(项目编号:1452MSYYB007)资助。

NOTES

*通讯作者。

参考文献

[1] Zhang, W., Zhuang, P., Sun, H., Li, G., Kwong, S. and Li, C. (2022) Underwater Image Enhancement via Minimal Color Loss and Locally Adaptive Contrast Enhancement. IEEE Transactions on Image Processing, 31, 3997-4010.
https://doi.org/10.1109/tip.2022.3177129
[2] Xiang, H., Zou, Q., Nawaz, M.A., Huang, X., Zhang, F. and Yu, H. (2023) Deep Learning for Image Inpainting: A Survey. Pattern Recognition, 134, Article ID: 109046.
https://doi.org/10.1016/j.patcog.2022.109046
[3] Tian, C., Zheng, M., Zuo, W., Zhang, S., Zhang, Y. and Lin, C. (2024) A Cross Transformer for Image Denoising. Information Fusion, 102, Article ID: 102043.
https://doi.org/10.1016/j.inffus.2023.102043
[4] Hamdia, K.M., Zhuang, X. and Rabczuk, T. (2020) An Efficient Optimization Approach for Designing Machine Learning Models Based on Genetic Algorithm. Neural Computing and Applications, 33, 1923-1933.
https://doi.org/10.1007/s00521-020-05035-x
[5] Zhang, J. (2019) Gradient Descent Based Optimization Algorithms for Deep Learning Models Training.
[6] Yan, G., Zou, H., Wang, S., Zhao, L., Wu, Z. and Zhang, W. (2022) Bio-Inspired Toe-Like Structure for Low-Frequency Vibration Isolation. Mechanical Systems and Signal Processing, 162, Article ID: 108010.
https://doi.org/10.1016/j.ymssp.2021.108010
[7] Li, H.N., Wang, W., Lai, S.K., Yao, L.Q. and Li, C. (2023) Nonlinear Vibration and Stability Analysis of Rotating Functionally Graded Piezoelectric Nanobeams. International Journal of Structural Stability and Dynamics, 24, Article ID: 2450103.
https://doi.org/10.1142/s0219455424501037
[8] Broyden, C.G. (1965) A Class of Methods for Solving Nonlinear Simultaneous Equations. Mathematics of Computation, 19, 577-593.
https://doi.org/10.1090/s0025-5718-1965-0198670-6
[9] Sachs, E.W. (1986) Broyden’s Method in Hilbert Space. Mathematical Programming, 35, 71-82.
https://doi.org/10.1007/bf01589442
[10] 刘晶, 高岩. Banach空间中半光滑算子方程的不精确牛顿法(英文) [J]. 运筹学学报, 2010, 14(3): 41-47.
[11] 李丙通, 贾春霞. 不精确高斯法的局部收敛性质[J]. 上海师范大学学报(自然科学版), 2011, 40(5): 460-468.
[12] 路云龙. 求解无约束极大极小问题的光滑化不精确牛顿算法[J]. 北华大学学报(自然科学版), 2014, 15(5): 593-595.
[13] 王娟, 于波. 一类不精确拟牛顿型算法的局部收敛性分析[J]. 数学的实践与认识, 2017, 47(19): 237-244.
[14] Mokhtari, A., Eisen, M. and Ribeiro, A. (2018) IQN: An Incremental Quasi-Newton Method with Local Superlinear Convergence Rate. SIAM Journal on Optimization, 28, 1670-1698.
https://doi.org/10.1137/17m1122943
[15] 薛小平, 秦泗甜, 等. 非线性分析[M]. 北京: 科学出版社, 2017.
[16] Dennis, J.E. and Moré, J.J. (1974) A Characterization of Superlinear Convergence and Its Application to Quasi-Newton Methods. Mathematics of Computation, 28, 549-560.
https://doi.org/10.1090/s0025-5718-1974-0343581-1
[17] Anselone, P.M. and Davis, J. (1971) Collectively Compact Operator Approximation Theory and Applications to Integral Equations.