1. 引言
在非线性领域,求解非线性方程
在定义域内的单根
所使用的迭代算法为牛顿迭代法[1]:
(1)
其为最著名的收敛迭代算法之一。
Figure 1. The process of solving the root of a nonlinear equation using Newton’s iteration method
图1. 牛顿迭代法求解非线性方程根的过程
经典牛顿迭代法将非线性方程根的求解问题转化为一个迭代逼近过程,其核心思想是利用函数在当前点的线性近似来估计方程根的位置。图1展示了牛顿迭代法逼近方程根的过程。从
开始,画出
处的切线与
轴的交点为
,重复此过程,每次迭代都使用当前点的切线来近似原函数,切线与
轴的交点作为下一次迭代的起点,迭代点
逐渐逼近函数的真实根。
经典牛顿迭代法具有局部二阶收敛性,但是牛顿迭代法在实际求解的过程中存在一些明显不足,比如,对初始值的要求比较高,这样才能保证算法的收敛;需要计算导数,这就使得算法无法应用于导数较为复杂或是不存在导数解析式的函数;在迭代过程中,当函数在迭代点附近的非线性程度极高时,算法有可能失效。
为了克服这些问题,本文考虑引入自适应步长因子,通过自适应步长因子来控制每一步的前进幅度。
2. 自适应参数牛顿法(APNM)
2.1. 自适应参数的构造
从
的角度考虑,当
时,离方程根较远,这时步长应取较小的值以避免出现因线性近似误差较大而导致发散,当
时,说明已接近方程根,这时可以保持牛顿法的二阶收敛速度,因此引入自适应步长
,其中
是控制自适应强度的参数,
越大,
对
的变化越敏感;
是控制敏感度非线性程度的参数。这样的设计满足自适应收敛的要求,即当
越大,迭代步长越小[2]-[4]。
2.2. 自适应参数牛顿法的构造
在(1)中引入自适应步长因子
,可得
(2)
将
用一阶泰勒展开式展开,得到:
(3)
将(2)代入(3)得:
(4)
为了每经过一次迭代,都有
,因此,可得
,即
为了降低迭代风险,将
的取值范围限制在
,其中,当
时,(2)变为经典牛顿迭代法。
以此,得到自适应参数牛顿法
(5)
2.3. α和p对收敛域的影响
2.3.1. 参数α对收敛域的影响分析
对于固定的
:
当
时,退化为经典牛顿法,
;
当
时,当
较大时,
减小,增强稳定性;
当
时,
,迭代步长极小化;
增大
会扩大收敛域,减少发散区域,但过大的
会减慢收敛速度。
2.3.2. 参数p对收敛域的影响分析
对于固定的
:
当
时,
为常数
,退化为固定阻尼牛顿法;
当
时,对大的
很敏感,当
时,对大残差高度敏感;
增大
会增强对初始残差的敏感性,
过小可能导致自适应不足,
过大可能导致过度阻尼。
综上所述,
和
共同决定自适应行为,
控制阻尼强度,
控制阻尼对函数值的非线性响应最优参数组合应使
在远离根时足够小以维持稳定性,在接近根时接近1以保持收敛速度。
下面给出展示了经典牛顿法以及
和
取不同值时的收敛盆分型图,见图2~5。
当
时,算法退化为经典牛顿法,图2中复杂分形边界,明显发散区域,颜色对比强烈,明显的茱莉亚集结构,黑色发散区域明显,收敛率为93.8%;
当
时,分形边界模糊,发散区域减少,颜色更加均匀,分形边界变得模糊,各根吸引盆扩大,收敛率为94.6%;
当
时,分形边界几乎消失,收敛盆变得连续,颜色明亮均匀,收敛率为96.1%;
当
时,发散区域最小,分形边界最平滑,但颜色较暗,收敛率为96.9%。
综上所述,自适应参数牛顿法相较于经典牛顿发显著减少了发散区域面积,提高了收敛率。
Figure 2. Classical Newton’s method
图2. 经典牛顿法
Figure 3. α = 0.5 p = 1.5
图3. α = 0.5 p = 1.5
Figure 4. α = 1 p = 2
图4. α = 1 p = 2
2.4. 定理(不动点迭代定理) [5]
设
在不动点
的某个邻域内连续可微,且
,则存在一个邻域
使得对于任意初始值
,迭代序列
收敛到
,并且是线性收敛的,收敛速度为
。如果
,那么收敛速度至少是二阶的(假设
连续)。
Figure 5. α = 2 p = 2.5
图5. α = 2 p = 2.5
2.5. 自适应参数牛顿法算法流程
注1:输入:函数
,初始值
,参数
,
,误差
,最大迭代次数
。
注2:计算
,
,
,
。
3. 收敛性分析
定理3.1
设
是充分光滑函数,
在
处有单根,
,且
在
的去心邻域
内二阶连续可微,则存在常数
,使得对于任意初始值
,由自适应参数牛顿法生成的序列
至少以线性收敛速度收敛到
,且当
充分接近
时,收敛速度为二阶。
证明:令
,
,且
连续,
又
在
内连续。
对于迭代函数,有
,
令
,则
计算得
,且
,
,
。
因此,即使保留该项,也不影响
的结果。
令
,将
在
处泰勒展开,得
至少二阶连续可微
在
处二阶连续可微
又
,
,
且
,
,
可得
在
处连续
迭代函数
在不动点
处满足
,且
在
附近连续,则根据不动点迭代定理,序列
收敛到
,并满足
即收敛速度至少为二阶,得证。
定理3.2 (全局收敛性)
设函数
在区间
上满足以下条件:
1)
是凸函数(或凹函数),且
(即
在
上严格单调);
2)
在
上有界,即存在常数
,使得
;
3)
在
上存在且有界,即存在常数
,使得
。
则对任意初始点
,自适应参数牛顿法(APNM)产生的序列
收敛到方程
的唯一根
,且当
充分大时,收敛速度至少为二阶。
证明:令
为凸函数且
的情形
设初始点
,下证序列
单调递减且有下界
∵
且
严格递增 ∴
,故
从而
,即序列
严格单调递减。
当
时,有
假设
,则
∵
是凸函数 ∴
单调递增,根据凸函数的定义,对任意
,可得
根据上述结论,
由于
,且
,故
序列
单调递减且有下界,故收敛。
令
可得
其中
根据上述等式可得,
又∵
,∴
,由零点的唯一性,得
当序列
进入
去心邻域
内时,
。
此时APNM变为经典牛顿法。由定理3.1 (局部收敛性)可知,在邻域内收敛速度至少为二阶。另外3种情况,
为凸函数且
,
为凹函数且
以及
为凸函数且
的情形同理可证。
综上所述,APNM在全局阶段以线性速度收敛,但最终会进入局部收敛区域并达到至少二阶收敛速度。
4. 数值验证
为检验迭代法的收敛性,将本文的自适应参数牛顿迭代法(APNM)与Armijo线搜索的牛顿法(ANM)和牛顿迭代法(NM)进行比较。用上述两种迭代法来求解以下函数的根,要求
,迭代次数不超过100,自适应参数设置为
,
,运行环境为Matlab2016b,给定几个不同的初始值
,并以函数
为例验证APNM的二阶收敛性,见表1、表2。
Table 1. Number of iterations and errors of APNM and NM iterative methods
表1. APNM与NM迭代法的迭代次数与误差
函数 |
初始值 |
迭代次数 |
误差 |
APNM |
ANM |
NM |
APNM |
ANM |
NM |
|
1.5 |
8 |
15 |
>100 |
2.2 × 10−15 |
5.6 × 10−14 |
失效 |
|
3.0 |
5 |
7 |
6 |
2.8 × 10−14 |
4.2 × 10−14 |
3.6 × 10−14 |
|
5.0 |
12 |
20 |
>100 |
4.1 × 10−14 |
3.8 × 10−14 |
失效 |
Table 2. Four iterations of data using the APNM iterative method of
表2.
使用APNM迭代法的4次迭代数据
n |
xn |
误差 |
收敛阶 |
1 |
2.258 |
1.63 × 10−1 |
- |
2 |
2.096 |
1.38 × 10−3 |
2.01 |
3 |
2.0946 |
1.02 × 10−6 |
2.00 |
4 |
2.0946 |
5.62 × 10−13 |
2.00 |
(1)
;
(2)
;
(3)
,
。
本文给出的APNM迭代法针对于使用牛顿法容易发散的情况,比如
较小或者是震荡函数,通过自适应调整步长予以改进,确保其收敛,同时通过验证,证明了APNM的二阶收敛性。
基金项目
(1) 2024年安徽省高校自然科学科研重点项目“基于自适应事件触发机制的一类时滞神经网络系统研究”(编号:2024AH050887)。
(2) 2023年安徽省高校自然科学科研重点项目“三维Magneto-Micropolar流体方程弱解的正则性及衰减性研究”(编号:2023AH040194)。
(3) 2024年安徽省高校自然科学科研重点项目“基于图论的集成电路版图分解快速算法”(编号:2024AH050891)。
(4) 2024年安徽省高校自然科学科研重点项目“基于贝叶斯优化算法的一类氟化反应研究”(编号:2024AH050897)。