基于Armijo非单调线搜索的修正LM方法

doi:10.12677/AAM.2022.119689

期刊菜单

基于Armijo非单调线搜索的修正LM方法
A Modified Levenberg-Marquardt Method with an Armijo Nonmonotone Line Search

DOI: 10.12677/AAM.2022.119689, PDF, HTML, XML,
作者: 陈咪：长沙理工大学数学与统计学院，湖南长沙
关键词: 非线性方程组；LM方法；非单调线搜索；全局收敛；Nonlinear Equations； LM Method； Nonmonotone Line Search； Global Convergence

摘要: 近年来，非线性方程组问题越来越多地出现在科学与工程领域中。Levenberg-Marquardt (LM)方法是解决此问题的有效方法。为了避免信赖域步不可取的情况，文章提出一种基于非单调线搜索技术的修正LM方法，同样保证了算法在局部误差界的条件下达到全局收敛，并在文末附上了相应的数值结果，证明算法是有效的。

Abstract: Recently, systems of nonlinear equations have wide application in fields of science and engineering. The Levenberg-Marquardt method is an effective method to solve this problem. In this paper, we propose a modified Levenberg-Marquardt method by using a nonmonotone line search technique for the nonlinear equations system to avoid the situation where a trust step is not acceptable. The global and cubic convergence of this new method is also preserved under the local error bound con-dition. Finally, some numerical results are reported, which show that the algorithm is efficient.

文章引用：陈咪. 基于Armijo非单调线搜索的修正LM方法[J]. 应用数学进展, 2022, 11(9): 6511-6520. https://doi.org/10.12677/AAM.2022.119689

1. 前言

考虑如下非线性方程组：

$F (x) = 0$ (1)

其中 $F : R^{n} \to R^{n}$ 是连续可微的。文章中，假设(1)的解集X非空，符号 $‖ \cdot ‖$ 指2-范数。

Levenberg-Marquardt方法(LM)是解决问题(1)的一种经典有效的方法。

为了进一步提高算法的收敛速度，范在文 [1] 中提出一种修正的LM方法。该算法结合信赖域技术，采用两步走的方式，每一次迭代过程中通过求解以下方程组来计算两个步长 $d_{k}^{L M}$ 和 $d_{k}^{M L M}$ ：

$(J_{k}^{T} J_{k} + λ_{k} I) d = - J_{k}^{T} F_{k}$ ， $(J_{k}^{T} J_{k} + λ_{k} I) d = - J_{k}^{T} F ( y k )$

其中 $J_{k} = F^{'} (x_{k})$ 是F在 $x_{k}$ 处的雅克比矩阵， $F_{k} = F (x_{k})$ $λ_{k} = μ_{k} {‖ F_{k} ‖}^{δ}, δ \in [1, 2]$ ， $μ_{k} > 0$ 由信赖域技术更新， $y_{k} = x_{k} + d_{k}^{L M}$ 。该算法具有全局收敛性和三次收敛速度。但是算法中的搜索方向可能不是问题(1)的优化函数 ${‖ F (x) ‖}^{2}$ 的下降方向。在范文章的基础上，郭和黄 [2] 提出了新的非单调修正L-M方法。新算法在每次迭代步都引入校正步，使新的试探步更靠近Moore-Penrose步。Chen、Ma [3] 还提出了多步走的LM方法。何和马在文 [4] 中利用非单调搜索准则提出求解非线性方程组的修正LM算法(L-M算法)，该算法中，当试探步未被接受时，执行非单调线搜索来获取下一个迭代点。

周在文 [5] 中提出了一种新的非单调二阶Armijo线搜索方式，通过下式更新算法的步长因子：

${‖ F (x_{k} + α d_{k} + α^{2} {\hat{d}}_{k}) ‖}^{2} - {‖ F_{k} ‖}^{2} \leq - σ_{1} α^{2} {‖ d_{k} ‖}^{2} - σ_{2} α^{2} {‖ {\hat{d}}_{k} ‖}^{2} - σ_{3} α^{2} {‖ F_{k} ‖}^{2} + ε_{k} {‖ F_{k} ‖}^{2}$

其中 ${ε_{k}}$ 是给定的正数列，满足 $\sum_{k = 0}^{\infty} ε_{k} < \infty$ 。周 [4] 结合上述非单调线搜索，进一步修正了LM算法，同样

确保了算法在局部误差界的条件下具有全局收敛性，且有三次收敛速度。He、Ma和Fan [6] 在周 [5] 的基础上，结合平均值型线搜索提出一种修正LM方法，该方法同样具有全局收敛性以及三次收敛速度。

目前，还有许多其他方法 [7] [8] [9] 都是解决问题(1)的有效方法。

文章在文 [1]、文 [5] 和文 [6] 的基础上，结合Grippo L在文 [10] 中提出的Max型Armijo非单调线搜索，构造一种基于Armijo非单调线搜索的修正LM方法。

2. 算法及其全局收敛性

定义(1)的优化函数为 $f (x) = {‖ F (x) ‖}^{2}$

假设1

a) 水平集 $Ω_{1} = {x | f (x) \leq f (x_{0})} \subset Ω$ 是有界闭集

b) $F (x)$ 和其雅可比矩阵 $J (x)$ 在水平集 $Ω_{1}$ 上Lipschitz连续，即存在正常数L使得

$‖ F (x) - F (y) ‖ \leq L ‖ x - y ‖, \forall x, y \in Ω_{1},$ (6)

$‖ J (x) - J (y) ‖ \leq L ‖ x - y ‖, \forall x, y \in Ω_{1},$ (7)

由(6)易知 $‖ J (x) ‖ \leq L, \forall x \in Ω_{1}$ 。

取 $J_{k}$ 的SVD分解为 $J_{k} = U Σ V^{T}$ ，其中U和V正交矩阵， $Σ$ 是一对角矩阵，其对角元素为 $σ_{i} \geq 0, i = 1, \dots, n$ ，且 $σ_{1} \geq σ_{2} \geq σ_{3} \geq \dots \geq σ_{n}$ 。由(7)知 $σ_{1} \leq L$ 。

引理 1 设假设1成立，若存在 $τ_{1} > 0$ 使得 $‖ F (x) ‖ \geq τ_{1}, \forall x \in Ω_{1}$ ，则存在常数 $C_{1}, C_{2} > 0$ 使得下式成立

$F_{k}^{T} J_{k} d_{k} \leq C_{1} {‖ J_{k}^{T} F_{k} ‖}^{2}$ (8)

$F^{T} (y_{k}) J_{k} d_{k} \leq C_{1} {‖ J_{k}^{T} F_{k} ‖}^{2}$ (9)

$‖ d_{k} ‖ \leq C_{2} ‖ J_{k}^{T} F_{k} ‖$ (10)

$‖ {\hat{d}}_{k} ‖ \leq C_{2} ‖ J_{k}^{T} F (y_{k}) ‖$ (11)

证明：由 $(J_{k}^{T} J_{k} + λ_{k} I) d_{k} = - J_{k}^{T} F_{k}$ ，可以得到

$\begin{matrix} F_{k}^{T} J_{k} d_{k} = - ‖ F_{k}^{T} J_{k} {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} J_{k}^{T} F_{k} ‖ \\ = - ‖ F_{k}^{T} J_{k} V {(Σ^{2} + λ_{k} I)}^{- 1} V^{T} J_{k}^{T} F_{k} ‖ \\ = - ‖ A_{k}^{T} {(Σ^{2} + λ_{k} I)}^{- 1} A_{k} ‖ \leq - {(σ_{1}^{2} + λ_{k})}^{- 1} ‖ A_{k}^{T} A_{k} ‖ \\ \leq - {(L^{2} + μ M)}^{- 1} ‖ F_{k}^{T} J_{k} J_{k}^{T} F_{k} ‖ ≜ - C_{1} {‖ J_{k}^{T} F_{k} ‖}^{2} \end{matrix}$

$\begin{matrix} ‖ d_{k} ‖ = ‖ {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} J_{k}^{T} F_{k} ‖ \leq ‖ {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} ‖ ‖ J_{k}^{T} F_{k} ‖ \\ \leq λ_{k}^{- 1} ‖ J_{k}^{T} F_{k} ‖ = {(μ ‖ F_{k} ‖)}^{- 1} ‖ J_{k}^{T} F_{k} ‖ \\ \leq {(μ τ_{1})}^{- 1} ‖ J_{k}^{T} F_{k} ‖ ≜ C_{2} ‖ J_{k}^{T} F_{k} ‖ \end{matrix}$

其中 $C_{1} = {(L^{2} + μ M)}^{- 1}$ ， $C_{2} = {(μ τ_{1})}^{- 1}$ ， $A_{k} = V^{T} F_{k}^{T} J_{k}$ 。

同理，可以得到(9)和(11)。

引理 2 设 ${x_{k}}$ 是由算法1产生的序列，则总存在正常数使得下式成立

${‖ F (x_{k} + α d_{k} + α^{2} {\hat{d}}_{k}) ‖}^{2} \leq \max_{0 \leq j \leq m (k)} {{‖ F (x_{k - j}) ‖}^{2}} + σ_{1} α^{2} F_{k}^{T} J_{k} d_{k} + σ_{2} α^{2} F^{T} (y_{k}) J_{k} {\hat{d}}_{k}$

其中 $m (0) = 0$ ， $0 \leq m (k) \leq \min [m (k - 1) + 1, M_{0}]$ ， $k \geq 1$ 。

证明：用反证法证明。假设对 $\forall α$ ， $0 < α \leq 1$ 都有

${‖ F (x_{k} + α d_{k} + α^{2} {\hat{d}}_{k}) ‖}^{2} > \max_{0 \leq j \leq m (k)} {{‖ F (x_{k - j}) ‖}^{2}} + σ_{1} α^{2} F_{k}^{T} J_{k} d_{k} + σ_{2} α^{2} F^{T} (y_{k}) J_{k} {\hat{d}}_{k}$

则有

${‖ F (x_{k} + α d_{k} + α^{2} {\hat{d}}_{k}) ‖}^{2} - {‖ F (x_{k}) ‖}^{2} > σ_{1} α^{2} F_{k}^{T} J_{k} d_{k} + σ_{2} α^{2} F^{T} (y_{k}) J_{k} {\hat{d}}_{k}$

对上式两边同除α，有

$\frac{{‖ F (x_{k} + α d_{k} + α^{2} {\hat{d}}_{k}) ‖}^{2} - {‖ F (x_{k}) ‖}^{2}}{α} > σ_{1} α F_{k}^{T} J_{k} d_{k} + σ_{2} α F^{T} (y_{k}) J_{k} {\hat{d}}_{k}$

令 $α \to 0^{+}$ ，由极限的性质有

$2 F_{k}^{T} J_{k} d_{k} \geq 0$

然而，由于 ${(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1}$ 是正定的， $d_{k} = - {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} J_{k}^{T} F_{k}$ ，则有 $F_{k}^{T} J_{k} d_{k} < 0$

显然，这是矛盾的，则原命题成立。这也意味着算法中所使用的线搜索技术是可行的。

定理1 设假设1成立。则算法1将有限终止，或满足 $\underset{k \to \infty}{\lim \inf} ‖ J_{k}^{T} F_{k} ‖ = 0$ 。

证明：用反证法证明。

假设 $\exists \bar{k} > 0$ ， $τ > 0$ ，s.t. $\forall k \geq \bar{k}$ ， $‖ J_{k}^{T} F_{k} ‖ \geq τ$ 。则 $\exists τ_{1} > 0$ ，s.t. $‖ F_{k} ‖ \geq τ_{1}$ 。

设 $l (k)$ 是满足下式的整数

${\begin{cases} k - m (k) \leq l (k) \leq k \\ f (x_{l (k)}) = {‖ F (x_{l (k)}) ‖}^{2} = \max_{0 \leq j \leq m (k)} [f (x_{k - j})] \end{cases}$

由 $m (k + 1) \leq m (k) + 1$ ，知

$\begin{matrix} f (x_{l (k + 1)}) = \max_{0 \leq j \leq m (k + 1)} [f (x_{k + 1 - j})] \\ \leq \max_{0 \leq j \leq m (k) + 1} [f (x_{k + 1 - j})] \\ = \max_{0 \leq j \leq m (k) + 1} \max_{k} [f (x_{k + 1}), f (x_{k - j})] \\ = \max_{k} [f (x_{k + 1}), f (x_{l (k)})] = f (x_{l ( k )}) \end{matrix}$

即 ${f (x_{l (k)})}$ 非增。对 $\forall k > M$

$\begin{matrix} f (x_{l (k)}) = f (x_{l (k) - 1} + α_{l (k) - 1} d_{l (k) - 1} + α_{l (k) - 1}^{2} {\hat{d}}_{l (k) - 1}) \\ \leq \max_{0 \leq j \leq m (l (k) - 1)} [f (x_{l (k) - 1 - j})] + σ_{1} α_{l (k) - 1}^{2} F_{l (k) - 1}^{T} J_{l (k) - 1} d_{l (k) - 1} \\ + σ_{2} α_{l (k) - 1}^{2} F^{T} (x_{l (k) - 1} + d_{l (k) - 1}) J_{l (k) - 1} {\hat{d}}_{l (k) - 1} \\ = f (x_{l (l (k) - 1)}) + σ_{1} α_{l (k) - 1}^{2} F_{l (k) - 1}^{T} J_{l (k) - 1} d_{l (k) - 1} + σ_{2} α_{l (k) - 1}^{2} F^{T} (x_{l (k) - 1} + d_{l (k) - 1}) J_{l (k) - 1} {\hat{d}}_{l (k) - 1} \end{matrix}$

定义上式为(12)。

因为 $F (x)$ 在 $Ω_{1}$ 上Lipschitz连续，则 $F (x)$ 在 $Ω_{1}$ 上一致连续，则有

$\lim_{k \to \infty} f (x_{l (k)}) = \lim_{k \to \infty} f (x_{l (l (k) - 1)})$ (13)

由(11)以及(12)，可知

$\lim_{k \to \infty} (α_{l (k) - 1}^{2} F_{l (k) - 1}^{T} J_{l (k) - 1} d_{l (k) - 1} + α_{l (k) - 1}^{2} F^{T} (x_{l (k) - 1} + d_{l (k) - 1}) J_{l (k) - 1} {\hat{d}}_{l (k) - 1}) = 0$

由于上式的两加数都非正，则有

$\lim_{k \to \infty} α_{l (k) - 1}^{2} F_{l (k) - 1}^{T} J_{l (k) - 1} d_{l (k) - 1} = 0$

$\lim_{k \to \infty} α_{l (k) - 1}^{2} F^{T} (x_{l (k) - 1} + d_{l (k) - 1}) J_{l (k) - 1} {\hat{d}}_{l (k) - 1} = 0$

由引理1知， $α_{k}^{2} F_{k}^{T} J_{k} d_{k} \leq - C_{1} α_{k}^{2} {‖ J_{k}^{T} F_{k} ‖}^{2} \leq - \frac{C_{1}}{C_{2}^{2}} α_{k}^{2} {‖ d_{k} ‖}^{2}$ ，则有

$\lim_{k \to \infty} α_{l (k) - 1}^{2} {‖ J_{k}^{T} F_{k} ‖}^{2} = 0$ ， $\lim_{k \to \infty} α_{l (k) - 1}^{2} {‖ d_{l (k) - 1} ‖}^{2} = 0$

又因为 $α_{k} > 0$ ， $‖ d_{k} ‖ > 0$ ，则有

$\lim_{k \to \infty} α_{l (k) - 1} ‖ J_{k}^{T} F_{k} ‖ = 0$ (14)

$\lim_{k \to \infty} α_{l (k) - 1} ‖ d_{l (k) - 1} ‖ = 0$ (15)

同理，可以得到

$\lim_{k \to \infty} α_{l (k) - 1} ‖ {\hat{d}}_{l (k) - 1} ‖ = 0$ (16)

接下来证明 $\lim_{k \to \infty} α_{k} ‖ d_{k} ‖ = 0$

取 $\hat{l} (k) = l (k + M + 2)$ 。

首先证明 $\forall j \geq 1$ ，下式都成立

$\lim_{k \to \infty} α_{\hat{l} (k) - j} ‖ d_{\hat{l} (k) - j} ‖ = 0$ (17)

$\lim_{k \to \infty} α_{\hat{l} (k) - j} ‖ {\hat{d}}_{\hat{l} (k) - j} ‖ = 0$ (18)

$\lim_{k \to \infty} α_{\hat{l} (k) - j} ‖ J_{\hat{l} (k) - j}^{T} F_{\hat{l} (k) - j} ‖ = 0$ (19)

$\lim_{k \to \infty} f (x_{\hat{l} (k) - j}) = \lim_{k \to \infty} f (x_{l (k)})$ (20)

用数学归纳法证明这些等式。

当 $j = 1$ 时，因为 ${\hat{l} (k)} \subset {l (k)}$ ，由(14)、(15)、(16)，易得到(17)、(18)以及(19)成立。等式

$\lim_{k \to \infty} α_{\hat{l} (k) - 1} ‖ d_{\hat{l} (k) - 1} ‖ = 0$ 也意味着 $‖ x_{\hat{l} (k)} - x_{\hat{l} (x) - 1} ‖ \to 0$ 。由 $F (x)$ 的一致连续性有(20)成立。

下面，假设对某一 $j \geq 1$ ，(17)至(20)成立。

则对 $j + 1$ ，由(12)知

$\begin{matrix} f (x_{\hat{l} (k) - j}) \leq f (x_{l (\hat{l} (k) - j - 1)}) + σ_{1} α_{\hat{l} (k) - j - 1}^{2} F_{\hat{l} (k) - j - 1}^{T} J_{\hat{l} (k) - j - 1} d_{\hat{l} (k) - j - 1} \\ + σ_{2} α_{\hat{l} (k) - j - 1}^{2} F^{T} (x_{\hat{l} (k) - j - 1} + d_{\hat{l} (k) - j - 1}) J_{\hat{l} (k) - j - 1} {\hat{d}}_{\hat{l} (k) - j - 1} \end{matrix}$

由上述假设，对上式令 $k \to \infty$ ，则有

$\lim_{k \to \infty} α_{\hat{l} (k) - j - 1}^{2} F_{\hat{l} (k) - j - 1}^{T} J_{\hat{l} (k) - j - 1} d_{\hat{l} (k) - j - 1} = 0$

$\lim_{k \to \infty} α_{\hat{l} (k) - j - 1}^{2} F^{T} (x_{\hat{l} (k) - j - 1} + d_{\hat{l} (k) - j - 1}) J_{\hat{l} (k) - j - 1} {\hat{d}}_{\hat{l} (k) - j} = 0$

同(15)、(16)的证明，可得到

$\lim_{k \to \infty} α_{\hat{l} (k) - j - 1} ‖ J_{\hat{l} (k) - j - 1}^{T} F_{\hat{l} (k) - j - 1} ‖ = 0$ ， $\lim_{k \to \infty} α_{\hat{l} (k) - j - 1} ‖ d_{\hat{l} (k) - j - 1} ‖ = 0$ ， $\lim_{k \to \infty} α_{\hat{l} (k) - j - 1} ‖ {\hat{d}}_{\hat{l} (k) - j - 1} ‖ = 0$

同样有

$‖ x_{\hat{l} (k) - j} - x_{\hat{l} (x) - j - 1} ‖ \to 0$ ， $\lim_{k \to \infty} f (x_{\hat{l} (k) - j - 1}) = \lim_{k \to \infty} f (x_{\hat{l} (k) - j}) = \lim_{k \to \infty} f (x_{l ( k )})$

即(17)至(20)对 $j \geq 1$ 成立。

由 $l (k)$ 以及 $\hat{l} (k)$ 的定义知 $\hat{l} (k) - k - 1 \leq M + 1$ ，所以 $\sum_{j = 1}^{\hat{l} (k) - k - 1} α_{\hat{l} (k) - j} d_{\hat{l} (k) - j}$ 是有限项和。

由(16)、(17) 以及

$x_{\hat{l} (k)} = x_{k + 1} + \sum_{j = 1}^{\hat{l} (k) - k - 1} α_{\hat{l} (k) - j} d_{\hat{l} (k) - j}$

有 $\lim_{k \to \infty} ‖ x_{k + 1} - x_{\hat{l} (k)} ‖ = 0$ 。

这也意味着

$\lim_{k \to \infty} f (x_{k + 1}) = \lim_{k \to \infty} f (x_{k}) = \lim_{k \to \infty} f (x_{\hat{l} (k)}) = \lim_{k \to \infty} f (x_{l (k)})$ (21)

由(11)知

$f (x_{k + 1}) \leq f (x_{l (k)}) + σ_{1} α_{k}^{2} F_{k}^{T} J_{k} d_{k} + σ_{2} α_{k}^{2} F^{T} (x_{k} + d_{k}) J_{k} {\hat{d}}_{k}$

不等式两边令 $k \to \infty$ ，由(21)有

$\lim_{k \to \infty} α_{k}^{2} F_{k}^{T} J_{k} d_{k} = 0$

$\lim_{k \to \infty} α_{k}^{2} F^{T} (x_{k} + α_{k} d_{k}) J_{k} {\hat{d}}_{k} = 0$

同样的方法有

$\lim_{k \to \infty} α_{k} ‖ d_{k} ‖ = 0$ ， $\lim_{k \to \infty} α_{k} ‖ J_{k}^{T} F_{k} ‖ = 0$

又由于 $‖ J_{k}^{T} F_{k} ‖ \geq τ > 0$ ，则有 $\lim_{k \to \infty} α_{k} = 0$

由 $J_{k}$ 的SVD分解，可得到

$‖ {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} ‖ = ‖ V {(Σ^{2} + λ_{k} I)}^{- 1} V^{T} ‖ = \max_{i} {(σ_{i}^{2} + λ_{k})}^{- 1} \leq λ_{k}^{- 1}$

$\begin{matrix} ‖ d_{k} ‖ = ‖ {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} J_{k}^{T} F_{k} ‖ \leq ‖ {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} ‖ ‖ J_{k} ‖ ‖ F_{k} ‖ \\ \leq L λ_{k}^{- 1} ‖ F_{k} ‖ = L μ^{- 1} \end{matrix}$

$\begin{matrix} ‖ {\hat{d}}_{k} ‖ = ‖ {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} J_{k}^{T} F (y_{k}) ‖ \\ \leq ‖ {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} J_{k}^{T} (F (y_{k}) - F_{k}) ‖ + ‖ {(J_{k}^{T} J_{k} + λ_{k} I)}^{- 1} J_{k}^{T} F_{k} ‖ \\ \leq L^{2} λ_{k}^{- 1} ‖ d_{k} ‖ + ‖ d_{k} ‖ \leq (1 + L^{2} μ^{- 1} τ_{1}^{- 1}) ‖ d_{k} ‖ \end{matrix}$

若 $\lim_{k \to \infty} ‖ d_{k} ‖ = 0$ ，由于 $0 \leq ‖ J_{k}^{T} F_{k} ‖ \leq ‖ J_{k}^{T} J_{k} + λ_{k} I ‖ ‖ d_{k} ‖ \leq (L^{2} + μ M) ‖ d_{k} ‖$

则有 $\lim_{k \to \infty} \inf ‖ J_{k}^{T} F_{k} ‖ = 0$

这与假设矛盾，所以存在常数 $τ_{2} > 0$ 使得 $\lim_{k \to \infty} \inf ‖ d_{k} ‖ \geq τ_{2}$

令 ${\bar{α}}_{k} = α_{k} r^{- 1}$ ，由 $α_{k}$ 的定义知

$\begin{matrix} {‖ F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) ‖}^{2} > \max_{j} {‖ F (x_{k - j}) ‖}^{2} + σ_{1} {\bar{α}}_{k}^{2} F_{k}^{T} J_{k} d_{k} + σ_{2} {\bar{α}}_{k}^{2} F^{T} (y_{k}) J_{k} {\hat{d}}_{k} \\ \geq {‖ F_{k} ‖}^{2} + σ_{1} {\bar{α}}_{k}^{2} F_{k}^{T} J_{k} d_{k} + σ_{2} {\bar{α}}_{k}^{2} F^{T} (y_{k}) J_{k} {\hat{d}}_{k} \end{matrix}$

即 ${\bar{α}}_{k}^{2} (σ_{1} F_{k}^{T} J_{k} d_{k} + σ_{2} F^{T} (y_{k}) J_{k} {\hat{d}}_{k}) < {‖ F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) ‖}^{2} - {‖ F_{k} ‖}^{2}$

$\begin{array}{l} ‖ F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) ‖ - {‖ F_{k} ‖}^{2} \\ = 2 F_{k}^{T} (F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) - F_{k}) + {‖ F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) - F_{k} ‖}^{2} \\ \leq 2 F_{k}^{T} (F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) - F_{k}) + L^{2} {\bar{α}}_{k}^{2} {(‖ d_{k} ‖ + ‖ {\hat{d}}_{k} ‖)}^{2} \\ \leq 2 F_{k}^{T} (F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) - F_{k}) + L^{2} {\bar{α}}_{k}^{2} (2 + L^{2} μ^{- 1} τ_{1}^{- 1}) {‖ d_{k} ‖}^{2} \end{array}$

此外，

$\begin{array}{l} F_{k}^{T} (F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) - F_{k}) \\ = F_{k}^{T} (F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) - F (x_{k} + {\bar{α}}_{k} d_{k})) + F_{k}^{T} (F (x_{k} + {\bar{α}}_{k} d_{k}) - F_{k}) \\ \leq ‖ F_{k} ‖ ‖ F (x_{k} + {\bar{α}}_{k} d_{k} + {\bar{α}}_{k}^{2} {\hat{d}}_{k}) - F (x_{k} + {\bar{α}}_{k} d_{k}) ‖ + {\bar{α}}_{k} F_{k}^{T} J_{k} d_{k} + F_{k}^{T} \int_{0}^{1} (J (x_{k} + t {\bar{α}}_{k} d_{k}) - J_{k}) {\bar{α}}_{k} d_{k} d t \\ \leq L M {\bar{α}}_{k}^{2} ‖ {\hat{d}}_{k} ‖ - {\bar{α}}_{k} d_{k}^{T} (J_{k}^{T} J_{k} + λ_{k} I) d_{k} + L M {\bar{α}}_{k}^{2} {‖ d_{k} ‖}^{2} \\ \leq (2 + L^{2} μ^{- 1} τ_{1}^{- 1}) L M {\bar{α}}_{k}^{2} {‖ d_{k} ‖}^{2} - {\bar{α}}_{k} d_{k}^{T} (J_{k}^{T} J_{k} + λ_{k} I) d_{k} \end{array}$

综上所述，有

$\begin{matrix} {\bar{α}}_{k} > \frac{- d_{k}^{T} (J_{k}^{T} J_{k} + λ_{k} I) d_{k}}{σ_{1} F_{k}^{T} J_{k} d_{k} + σ_{2} F^{T} (y_{k}) J_{k} {\hat{d}}_{k} - (2 + L^{2} μ^{- 1} τ_{1}^{- 1}) L M ‖ d_{k} ‖} \\ \geq \frac{λ_{k} d_{k}^{T} d_{k}}{C_{1} σ_{1} {‖ J_{k}^{T} F_{k} ‖}^{2} + C_{1} σ_{1} {‖ J_{k}^{T} F (y_{k}) ‖}^{2} + (2 + L^{2} μ^{- 1} τ_{1}^{- 1}) L M ‖ d_{k} ‖} \\ \geq \frac{μ τ_{1} τ_{2}^{2}}{L^{2} M^{2} (C_{1} σ_{1} + C_{1} σ_{1}) + (2 + L^{2} μ^{- 1} τ_{1}^{- 1}) L^{2}} \end{matrix}$ (22)

又 ${\bar{α}}_{k} \in {α_{k}}$ ，(22)与 $\lim_{k \to \infty} α_{k} = 0$ 矛盾。

所以，假设不成立，原命题成立。即

$\lim_{k \to \infty} \inf ‖ J_{k}^{T} F_{k} ‖ = 0$

3. 数值结果

为了验证算法１的有效性，该部分进行了数值试验，并与文 [5] [6] 的算法进行了比较，结果列于表1中。

· 文 [6] 中修正LM算法(表中记为LM1)的参数选为： $μ = 10^{- 6}$ ， $ε = 0.01$ ， $γ = 0.5$ ，

$κ_{1} = κ_{2} = σ_{1} = σ_{2} = σ_{3} = 0.005$ ， $η_{k} \equiv 0.5$ 。

· 文 [5] 中修正LM算法(表中记为LM2)的参数选为： $σ_{1} = σ_{2} = σ_{3} = 0.05$ ， $ρ = 0.8$ ， $r = 0.5$ ， $μ = 10^{- 6}$ ，

$ε_{k} = \frac{{0.5}^{k}}{10}$ 。

· 算法1的参数选为 $σ_{1} = σ_{2} = 0.02$ ， $ρ = 0.8$ ， $r = 0.2$ ， $μ = 10^{- 6}$ ， $M_{0} = 1$

如果 $‖ J_{k}^{T} F_{k} ‖ \leq 10^{- 4}$ 或者迭代次数 $k > 500$ ，则终止算法。算法的测试问题是对文 [11] 中的问题改编得到的。选择不同长度得初始点 $x_{0} = {(1, - 1, 1, - 1, \dots, 1, - 1)}^{T}$ ，测试函数为

$\hat{F} (x) = F (x) - J (x^{*}) A {(A^{T} A)}^{- 1} A^{T} (x - x^{*})$

其中 $A \in R^{n \times 1}$ ， $A^{T} = (1, 1, \dots, 1)$ ， $F (x)$ 是文 [11] 中非奇异标准测试函数， $x^{*}$ 是其根， $J (x^{*})$ 是 $F (x)$ 在 $x^{*}$ 处的雅可比函数。显然， $\hat{F} (x^{*}) = 0$ ， $\hat{J} (x^{*}) = J (x^{*}) (1 - A {(A^{T} A)}^{- 1} A^{T})$ 的秩为n − 1。

表1中，“NF”和“NJ”分别代表函数、其雅可比函数的计算量，“NF + NJ × n”表示总计算量。如果算法迭代100(n + 1)次仍然无法找到解，用符合“--”表示。

Table 1. The numerical results

表1. 数值实验结果

4. 结束语

论文提出了一个基于Armijo非单调线搜索的修正LM方法，避免了传统LM算法中信赖域步不可被接受的情况。在适当的假设条件下，证明了该算法的全局收敛性。通过数值试验可以看出这个算法对于奇异值问题的求解是可行并有效的。

参考文献

[1]	Fan, J.Y. (2012) The Modified Levenberg-Marquardt Method for Nonlinear Equations with Cubic Convergence. Math-ematics of Computation, 81, 447-466. [Google Scholar] [CrossRef]
[2]	郭楠, 黄华鹰. 求解非线性方程组的一类非单调修正Levenberg-Marquardt算法[J]. 安徽大学学报(自然科学版), 2016, 40(2): 14-20.
[3]	何叶丹, 马昌凤. 求解非线性方程组的一个修正非单调L-M算法[J]. 福建师范大学学报(自然科学版), 2013, 29(4): 15-22.
[4]	Chen, L. and Ma, Y.F. (2020) Shamanskii-Like Levenberg-Marquardt Method with a New Line Search for Systems of Nonlinear Equations. Journal of Systems Science and Complexity, 33, 1694-1707. [Google Scholar] [CrossRef]
[5]	Zhou, W.J. (2013) On the Convergence of the Modified Leven-berg-Marquardt Method with a Nonmonotone Second Order Armijo Type Line Search. Journal of Computational & Ap-plied Mathematics, 239, 152-161. [Google Scholar] [CrossRef]
[6]	He, Y.D., Ma, C.F. and Fan, B. (2015) A Corrected Leven-berg-Marquardt Algorithm with a Nonmonotone Line Search for the System of Nonlinear Equations. Applied Mathemat-ics & Computation, 260, 159-169. [Google Scholar] [CrossRef]
[7]	周童, 陈亮, 伍珍香. 一种求解非线性方程组的Levenberg-Marquardt方法及其收敛性[J]. 淮北师范大学学报(自然科学版), 2021, 42(1): 1-7.
[8]	Amini, K. and Rostami, F. (2016) Three-Steps Modified Levenberg-Marquardt Method with a New Line Search for Systems of Non-linear Equations. Journal of Computational & Applied Mathematics, 300, 30-42. [Google Scholar] [CrossRef]
[9]	Chen, L. (2016) A Modified Levenberg-Marquardt Method with Line Search for Nonlinear Equations. Computational Optimization & Applications, 65, 753-779. [Google Scholar] [CrossRef]
[10]	Grippo, L., Lampariello, F. and Lucidi, S. (1986) A Nonmonotone Line Search Technique for Newton’s Method. SIAM Journal on Numerical Analysis, 23, 707-716. [Google Scholar] [CrossRef]
[11]	Moré, J.J., Garbow, B.S. and Hillstrom, K.E. (1981) Testing Unconstrained Optimization Software. ACM Transform on Mathematical Software, 7, 17-41. [Google Scholar] [CrossRef]

为你推荐

友情链接