基于分式模型的非单调自适应信赖域方法

doi:10.12677/AAM.2023.125226

期刊菜单

基于分式模型的非单调自适应信赖域方法
A Nonmonotone Adaptive Trust Region Method Based on Fractional Model

DOI: 10.12677/AAM.2023.125226, PDF, HTML, XML,
作者: 杨玉梅：长沙理工大学数学与统计学院，湖南长沙
关键词: 无约束优化；分式模型；非单调信赖域；自适应半径；全局收敛性；Unconstrained Optimization； Fractional Model； Nonmonotone Trust Region； Adaptive Radius； Global Convergence

摘要: 本文针对无约束优化问题提出了一个基于分式模型的非单调自适应信赖域的算法。首先用折线法求解子问题，之后算法结合非单调线搜索技术得到步长，产生下一个迭代点，提高算法的收敛速度；并引入自适应半径，避免传统信赖域半径更新的局限性。在一定的假设条件下，证明了该算法具有全局收敛性，数值实验证明了非单调自适应分式模型信赖域算法是有效的并且优于原来求解分式模型的算法，并且比二次模型和锥模型更为有效和稳健。

Abstract: This paper proposes a nonmonotone adaptive trust region algorithm based on fractional model for unconstrained optimization problems. First, the dogleg step method is used to solve the sub- problem, and then the algorithm combines nonmonotonic line search technology to obtain the step size, generates the next iteration point, and improves the convergence speed of the algorithm; The adaptive radius is introduced to avoid the limitations of traditional trust region radius updating. Under certain assumptions, it is proved that the algorithm has global convergence. Numerical experiments show that the nonmonotonic adaptive fractional model trust region algorithm is effective and superior to the original algorithm for solving fractional models, and is more effective and robust than the quadratic model and the cone model.

文章引用：杨玉梅. 基于分式模型的非单调自适应信赖域方法[J]. 应用数学进展, 2023, 12(5): 2207-2219. https://doi.org/10.12677/AAM.2023.125226

1. 引言

目前，最优化理论与方法在自然科学、经济管理、工程设计、环境保护、地震勘探、国家安全等领域上被广泛地应用，现已成为运筹学的一个重要分支。在许多亟待解决的、对社会有重大影响的大规模复杂科学和工程问题一般都是非线性的，如大气科学中的同化问题、信息科学中的模式识别问题、地球科学中的反演问题等。因此，研究高效的非线性最优化计算方法不仅具有重要的科学意义，而且具有广泛的应用前景。

很多非线性优化问题的数学模型本身是无约束的，求解相对容易，而无约束问题解法的基本思想又常常可以推广到一般有约束的情形。求解无约束优化问题的主要方法有信赖域法和线搜索法 [1] 。在实际应用中，信赖域方法比线搜索方法在解决Hessian矩阵不正定和x_k为鞍点等问题上更具优势，使得它在优化领域取得了较好的发展 [2] 。

传统的信赖域方法是基于二次函数，如果目标函数非二次性比较强或者其曲率变化剧烈，那么二次模型方法可能会产生一个比较差的函数极小值的估计值。1980年，Davidon [3] 针对二次模型的不足首次提出了锥函数，即二次函数的推广形式。用锥函数逼近原函数，可以插值较多的函数和梯度信息，比二次函数逼近更为一般 [4] 。以锥函数为基础所形成的方法简称锥模型方法。这类方法的提出引起了很多国内外学者对其做深入的研究，其中包括国外的Ariyawansa，Di，Wright和Sorensen教授，我国的李正峰、倪勤、孙文瑜教授等。此外，锥模型中含有参量a_k，虽然可以提供一定的自由度来充分利用迭代点中的梯度和函数值信息，但其水平参向量只有一个，这会影响其搜索方向的选择。对此，2015年朱红兰和倪勤等人首次提出了分式模型 [5] ，即是锥函数的推广形式，拥有三个水平向量，可以提供更多的插值信息。

近年来，信赖域算法常常应用非单调技术去提升算法的效率和性能。1986年，Grippo等 [6] [7] 为了克服单调技术要求在每次迭代中都减少目标函数值的缺点，提出了一种具有直线搜索技术的非单调信赖域方法。基于Grippo等人提出的非单调技术上，2004年，Zhang和Hager [8] 发现非单调技术有一些缺点。例如，数值性能严重依赖于参数M的选择；在任何迭代中生成的良好函数值可能都没有用处等。为了克服这些缺点，Zhang和Hager提出了另一种非单调技术。受前人的启发，2012年，Ahookhosh等人 [9] 提出了更为简化的非单调参数。

传统信赖域方法通过使用r_k来修改信赖域在迭代点处的半径，效率不高且参数难取。2002年，Zhang等人 [10] 在中提出了自适应半径。2008年，Shi和Guo [11] 提出了另一种自适应半径，解决了Zhang等人提出的自适应半径不适合大规模问题的缺点。2018年，盛洲等人 [12] 提出了一种较为简便的自适应信赖域方法求解无约束优化问题的，该方法由一般信赖域方法和修正正割方程驱动。2019年，Xue等人 [13] 提出了一种新的改进的非单调自适应信赖域方法，用于解决无约束优化问题。2022年，Kamandi [14] 等人在此前的基础上提出了一种有效的非单调自适应信任域方法。

2011年，冯琳和段复建 [15] 基于锥模型提出非单调自适应信赖域算法。2015年，王开荣和曾刘拴 [16] 采用滤子技术改进了锥模型的非单调自适应信赖域方法。

从理论分析的角度出发，基于分式模型非单调自适应信赖域算法是具备全局收敛性的，从数值实验分析，该算法是可行的，有效的。但是，由于分式模型的插值较多，导致计算量较大；以及引用非单调自适应技术，导致算法比较复杂，所以关于分式模型的非单调自适应算法的国内外研究并不多。

因此，为了克服单调技术的局限性以及传统信赖域依靠r_k来设定半径的困难，本文基于朱红兰等人 [5] 提出的分式模型，之后结合Ahookhosh等人 [9] 的非单调技术，盛洲等人 [12] 的自适应技术提出一个求解分式模型的非单调自适应信赖域算法。

2. 非单调自适应分式模型信赖域方法

本文考虑无约束优化问题

$\min_{x \in R^{n}} f (x)$ (1)

其中 $f : R^{n} \to R$ 是二次连续可微函数。

1980年，Davidon [3] 提出的锥函数为

${\tilde{ϕ}}_{k} (s) = f_{k} + \frac{g_{k}^{T} s}{1 - a_{k}^{T} s} + \frac{s^{T} B_{k} s}{2 {(1 - a_{k}^{T} s)}^{2}},$ (2)

其中 $a_{k} \in R^{n}$ 是水平参向量。当 $a_{k} = 0$ 时，锥函数退化为二次函数。此外，锥模型中含有参量 $a_{k}$ ，虽然可以提供一定的自由度来充分利用迭代点中的梯度和函数值信息，但其水平参向量只有一个，这会影响其搜索方向的选择。因此，朱红兰等人首次提出了如下分式模型 [5] ：

$ϕ_{k} (s) = \frac{1 + c_{k}^{T} s}{(1 - a_{k}^{T} s) (1 - b_{k}^{T} s)} g_{k}^{T} s + \frac{{(1 + c_{k}^{T} s)}^{2}}{2 {(1 - a_{k}^{T} s)}^{2} {(1 - b_{k}^{T} s)}^{2}} s^{T} B_{k} s,$ (3)

以及相应的分式模型信赖域子问题：

$\begin{array}{l} \min_{s \in R^{n}} ϕ_{k} (s) \\ s .t . ‖ s ‖ \leq \tilde{Δ}, | (1 - a_{k}^{T} s) (1 - b_{k}^{T} s) | > ω . \end{array}$ (4)

其中参数向量 $a_{k}, b_{k}, c_{k} \in R^{n}$ 是有界的。如果 $b_{k} = c_{k} = 0$ ， $ϕ_{k} (s)$ 退化为锥模型。如果 $a_{k} = b_{k} = c_{k} = 0$ ，则 $ϕ_{k} (s)$ 为二次模型。基于这个新的分式模型(4)，文献 [5] 提出了一个简化的分式信赖域子问题：

$\begin{array}{l} \min_{s \in R^{n}} ϕ_{k} (s) \\ s .t . ‖ s ‖ \leq Δ_{k}, \end{array}$ (5)

其中 $Δ_{k}$ 是信赖域半径，且有

$Δ_{k} = \min {{\tilde{Δ}}_{k}, \frac{ω}{‖ a_{k} ‖}, \frac{ω}{‖ b_{k} ‖}, \frac{ω}{‖ c_{k} ‖}}, 0 < ω < \frac{1}{3} .$ (6)

参数向量满足

$‖ a_{k} ‖ Δ_{k} < ω, ‖ b_{k} ‖ Δ_{k} < ω, ‖ c_{k} ‖ Δ_{k} < ω .$ (7)

非单调技术由于在信赖域方法中引用可以得到较好的数值结果，得到了很大的发展。Grippo等 [6] [7] 在1986年提出了一种具有直线搜索技术的非单调信赖域方法，其步长α_k满足 $α_{k} \in {s, ρ s, ρ s^{2}, \dots}$ ，且有：

$f (x_{k} + α_{k} s_{k}) \leq f_{l (k)} + β α_{k} g_{k}^{T} s_{k}$ (8)

其中 $s > 0, ρ \in (0, 1), β \in (0, \frac{1}{2})$ 。一般非单调项f_l_(k)定义为：

$f_{l (k)} = \max_{0 \leq j \leq m (k)} {f (x_{k - j})}$ (9)

其中

$m (0) = 0, 0 \leq m (k) \leq \min {m (k - 1) + 1, N}, k \geq 1,$

N为非负整数。

2012年，Ahookhosh等人 [9] 提出了更为简化的非单调参数R_k，满足：

$f (x_{k} + α_{k} s_{k}) \leq R_{k} + β α_{k} g_{k}^{T} s_{k},$ (10)

其中

$R_{k} = η_{k} f_{l (k)} + (1 - η_{k}) f (x_{k})$ (11)

其中 $η_{k} \in (η_{\min}, η_{\max}); η_{\min} \in [0, 1); η_{\max} \in [η_{\min}, 1)$ 是两个前缀常量。

当信赖域半径更新时，通常依赖参数的选取，具有盲目性。2018年，盛洲等人 [12] 提出了一种由修正正割方程驱动的自适应方法，其中修正方程为：

$B_{k + 1} d_{k} = q_{k},$ (12)

其中

$\begin{array}{l} q_{k} = y_{k} + h_{k} d_{k}, \\ y_{k} = g_{k + 1} - g_{k}, \\ h_{k} = \frac{{(g_{k + 1} + g_{k})}^{T} d_{k} + 2 (f_{k} - f_{k + 1})}{{‖ d_{k} ‖}^{2}} . \end{array}$ (13)

新的自适应半径为：

$Δ_{k} : = c^{p} \frac{‖ d_{k - 1} ‖}{‖ q_{k - 1} ‖} ‖ g_{k} ‖,$ (14)

其中 $c \in (0, 1)$ 。

修改后的BFGS更新公式为

$B_{k + 1} = B_{k} - \frac{B_{k} d_{k} d_{k}^{T} B_{k}}{d_{k}^{T} B_{k} d_{k}} + \frac{q_{k} q_{k}^{T}}{q_{k}^{T} d_{k}} .$ (15)

3. 基于分式模型的非单调自适应信赖域算法

为了求解问题(5)，我们用如下的分式模型来近似f(x)：

$φ_{k} (s) = f_{k} + ϕ_{k} (s),$ (16)

其中 $ϕ_{k} (s)$ 由(3)式可得。

该分式模型满足下面五个插值条件 [5] ：

$ϕ_{k} (0) = f_{k}, \nabla ϕ_{k} (0) = g_{k},$

$ϕ_{k} (- s_{k - 1}) = f_{k - 1}, ϕ_{k} (- s_{12}) = f_{k - 2}, ϕ_{k} (- s_{13}) = f_{k - 3},$

其中

$s_{k - 1} = x_{k} - x_{k - 1}, s_{12} = x_{k} - x_{k - 2}, s_{13} = x_{k} - x_{k - 3},$

由上面的插值条件，得到

$a_{k} = v_{1} g_{k - 1}, b_{k} = v_{2} B_{k - 1} s_{k - 1}, c_{k} = v_{3} g_{k},$

其中 $v_{1}, v_{2}, v_{3}$ 参考文献 [5] 可得。

接着，给出如下折线法来求解分式模型(16)，求解近似解的详细过程可参考文献 [17] [18] 。

算法1 子问题的求解

步1：计算分式模型(16)的牛顿点 $s_{N}$ ，最速下降点 $s_{C p}$ 。

步2：若 $‖ s_{N} ‖ \leq Δ_{k}$ ，则 $s_{*} = s_{N}$ ，算法停止，否则转步3。

步3：令 $s_{*} = s_{C p}$ 。

有了算法1，结合Ahookhosh等人的非单调技术和盛洲等人的自适应技术，下面给出一个求解分式模型(16)的非单调自适应信赖域算法。

算法2 基于折线法的非单调自适应分式模型信赖域算法

步0. 设

$u \in (0, 1), Δ_{\max} > 0, ω \in (0, \frac{1}{3}), ε > 0, η \in (0, 1), c \in (0, 1), x_{0} \in R^{n}, B_{0} = I, Δ_{0} \in (0, Δ_{\max}], β \in (0, \frac{1}{2}), ρ \in (0, 1)$ 。

令k = 0，p = 0。

步1. 计算 $f_{k} = f (x_{k}), g_{k} = \nabla f (x_{k})$ 。假设满足 $‖ g_{k} ‖ \leq ε$ 时，则 $x_{k + 1} = x_{k}$ ，算法停止，否则，转步骤2。

步2. 通过算法1计算 $s_{k}$ 。

步3. 校正信赖域半径。

$Δ_{k} : = c^{p} \frac{‖ s_{k - 1} ‖}{‖ q_{k - 1} ‖} ‖ g_{k} ‖ .$ (17)

步4. 计算 $R_{k}$ ，选择合适的参数 $η_{k} \in [η_{\min}, η_{\max}]$ ，计算

$r_{k} = \frac{R_{k} - f (x_{k} + s_{k})}{φ_{k} (0) - φ (s_{k})} .$ (18)

如果 $r_{k} \geq u$ ，则 $x_{k + 1} = x_{k} + s_{k}$ ，转步5；否则，令 $x_{k + 1} = x_{k} + α_{k} s_{k}$ ，计算 $α_{k}$ 使其满足式(10)， $p = p + 1$ ，转步3。

步5. 计算 $q_{k}$ ，如果 $s_{k}^{T} q_{k} > 0$ ，则用(15)式迭代 $B_{k + 1}$ 进行修正，否则令 $B_{k + 1} = B_{k}$ 。令 $k = k + 1$ ，转步1。

备注：1) 算法2中“步骤3–步骤4–步骤3”的过程称为内循环。

2) 记集合 $I = {k : r_{k} \geq u}, J = {k : r_{k} < u}$ 。

3) 定义模型(16)的预测下降量为

$P r e d (s) = φ_{k} (0) - φ_{k} ( s )$

4. 收敛性分析

为了证明算法2的收敛性，现给出以下假设：

(H1) 有界闭集 $L (x_{0}) = {x \in ℝ^{n} | f (x) \leq f (x_{0})}$ 满足 $L (x) \subseteq Ω \subseteq ℝ^{n}$ ，且 $f (x)$ 二阶连续可微。

(H2) 存在一个正数m使得对所有 $s \in ℝ^{n}, k \in N$ ，有

$s^{T} B_{k} s \geq m {‖ s ‖}^{2} .$ (19)

(H3) 矩阵 $B_{k}$ 是一致有界的，存在一个正常数M₁使得对所有 $k \in N$ ，有

$‖ B_{k} ‖ \leq M_{1} .$ (20)

引理1 [18] 假设(7)成立，如果 $s_{k}$ 是由算法1生成的子问题(16)的解，则有，

$P r e d (s_{k}) \geq \frac{1}{2} \frac{‖ g_{k} ‖}{‖ B_{k} ‖} \min {‖ g_{k} ‖, \frac{ξ Δ_{k}}{‖ B_{k}^{- 1} ‖}} .$ (21)

其中 $ξ = \frac{1 - ω}{{(1 + ω)}^{2}}, ω \in (0, \frac{1}{3})$ 。

引理2 [12] 如果 $B_{k + 1}$ 由BFGS公式(15)更新，则 $B_{k}$ 正定， $s_{k}^{T} q_{k} > 0$ 当且仅当 $B_{k + 1}$ 正定。

引理3 若 $s_{k}$ 是由算法1生成的子问题(16)的解， $‖ g_{k} ‖ \neq 0$ ，则 $\exists \tilde{k} > 0$ ，使得

$g_{k}^{T} s_{k} + κ_{k} g_{k}^{T} s_{k} + \frac{1}{2} s_{k}^{T} B_{k} s_{k} \leq - \tilde{k} {‖ g_{k} ‖}^{2} .$ (22)

其中

$\tilde{k} = \frac{1}{2 M_{1}} \min {1, ξ c^{p}}, ξ = \frac{1 - ω}{{(1 + ω)}^{2}}, ω \in (0, \frac{1}{3}) .$

证明：定义

$P r e d (s_{k}) = - h_{k} g_{k}^{T} s_{k} - \frac{1}{2} h_{k}^{2} s_{k}^{T} B_{k} s_{k} .$ (23)

其中

$h_{k} = \frac{1 + c_{k}^{T} s_{k}}{(1 - a_{k}^{T} s_{k}) (1 - b_{k}^{T} s_{k})} > 0.$ (24)

由分式模型定义可得，

$| a_{k}^{T} s_{k} | \leq ‖ a_{k} ‖ Δ_{k} \leq ω, ω \in (0, \frac{1}{3}) .$

同理可得

$| b_{k}^{T} s_{k} | \leq ω, | c_{k}^{T} s_{k} | \leq ω, ω \in (0, \frac{1}{3}) .$

因此，可得

$\frac{1}{1 - a_{k}^{T} s_{k}} = 1 + a_{k}^{T} s_{k} + o (‖ s_{k} ‖),$ (25)

$\frac{1}{1 - b_{k}^{T} s_{k}} = 1 + b_{k}^{T} s_{k} + o (‖ s_{k} ‖),$ (26)

所以，可得

$h_{k} g_{k}^{T} s_{k} = g_{k}^{T} s_{k} + κ_{k} g_{k}^{T} s_{k} + o ({‖ s_{k} ‖}^{2}),$ (27)

$h_{k}^{2} s_{k}^{T} B_{k} s_{k} = s_{k}^{T} B_{k} s_{k} + o ({‖ s_{k} ‖}^{2}),$ (28)

其中

$κ_{k} = a_{k}^{T} s_{k} + b^{T} s_{k} + c^{T} s_{k} .$ (29)

则由引理1和(27)、(28)得

$- g_{k}^{T} s_{k} - κ_{k} g_{k}^{T} s_{k} - o ({‖ s_{k} ‖}^{2}) - \frac{1}{2} s_{k}^{T} B_{k} s_{k} - \frac{1}{2} o ({‖ s_{k} ‖}^{2}) \geq \frac{1}{2} \frac{‖ g_{k} ‖}{‖ B_{k} ‖} \min {‖ g_{k} ‖, \frac{ξ Δ_{k}}{‖ B_{k}^{- 1} ‖}},$

且由(12)和矩阵的相容性可得

$Δ_{k} = c^{p} \frac{‖ s_{k - 1} ‖}{‖ q_{k - 1} ‖} ‖ g_{k} ‖ \geq c^{p} ‖ B_{k}^{- 1} ‖ ‖ g_{k} ‖,$ (30)

则有

$\begin{matrix} - g_{k}^{T} s_{k} - κ_{k} g_{k}^{T} s_{k} - \frac{1}{2} s_{k}^{T} B_{k} s_{k} \geq \frac{1}{2} \frac{‖ g_{k} ‖}{‖ B_{k} ‖} \min {‖ g_{k} ‖, \frac{ξ Δ_{k}}{‖ B_{k}^{- 1} ‖}} \\ \geq \frac{1}{2} \frac{‖ g_{k} ‖}{‖ B_{k} ‖} \min {‖ g_{k} ‖, \frac{ξ c^{p} ‖ B_{k}^{- 1} ‖ ‖ g_{k} ‖}{‖ B_{k}^{- 1} ‖}} \\ \geq \frac{1}{2} \frac{{‖ g_{k} ‖}^{2}}{‖ B_{k} ‖} \min {1, ξ c^{p}} \\ \geq \frac{1}{2 M_{1}} \min {1, ξ c^{p}} {‖ g_{k} ‖}^{2} \end{matrix}$

令 $\tilde{k} = \frac{1}{2 M_{1}} \min {1, ξ c^{p}}$ ，则证明完毕。

引理4 若序列{x_k}由算法2生成。那么对于所有 $k \in Ν \cup {0}$ ，有 $x_{k} \in L (x_{0})$ ， ${f_{l (k)}}$ 是递减序列。

证明：根据 $f_{l (k)}, R_{k}$ 定义，可得

$f_{l (k)} = η_{k} f_{l (k)} + (1 - η_{k}) f_{l (k)} \geq η_{k} f_{l (k)} + (1 - η_{k}) f_{k} = R_{k} .$ (31)

显然有， $f_{0} = R_{0}$ 。现假设 $x_{k} \in L (x_{0})$ 成立，我们需通过数学归纳法证明 $x_{k +1} \in L (x_{0})$ 成立即可。

从以下两个方面证明：

1) 当 $k \in I$ ，则有

$R_{k} - f (x_{k} + s_{k}) \geq μ (P r e d (s_{k})) \geq \frac{1}{2} μ \frac{‖ g_{k} ‖}{‖ B_{k} ‖} \min {‖ g_{k} ‖, \frac{ξ Δ_{k}}{‖ B_{k}^{- 1} ‖}} \geq 0.$ (32)

2) 当 $k \in J$ ，由 $α_{k}$ 的定义可知 $α_{k} > 0$ ，由(7)、(29)可得 $0 < ‖ κ_{k} ‖ \leq 3 ω < 1$ ，由假设(H2)得 $s^{T} B_{k} s \geq m {‖ s ‖}^{2} > 0$ ，则有

$g_{k}^{T} s_{k} < g_{k}^{T} s_{k} + κ_{k} g_{k}^{T} s_{k} + \frac{1}{2} s_{k}^{T} B_{k} s_{k} .$

由引理3得到 $β α_{k} g_{k}^{T} s_{k} \leq 0$ 。则有

$f (x_{k} + α_{k} s_{k}) \leq R_{k} + β α_{k} g_{k}^{T} s_{k} \leq R_{k} .$ (33)

通过式子(31)~(33)可得

$f_{k + 1} \leq R_{k} \leq f_{l (k)} \leq f_{0}, k \in Ν \cup {0}$ (34)

所以， $x_{k +1} \in L (x_{0})$ 成立。

接着，证明序列 ${f_{l (k)}}$ 是递减数列。为此考虑以下情况：

1) 对 $k < N$ ，明显有 $m (k) = k$ 。因此，对任意k，有 $f_{k} \leq f_{0}$ ，可得 $f_{l (k)} = f_{0}$ 。

2) 对 $k \geq N$ ， $m (k + 1) \leq m (k) + 1$ 。根据 $f_{l (k + 1)}$ 的定义和(34)，可得

$f_{l (k + 1)} = \max_{0 \leq j \leq m (k + 1)} {f (x_{k + 1 - j})} \leq \max_{0 \leq j \leq m (k) + 1} {f_{k + 1 - j}} = \max {f_{l (k)}, f_{k + 1}} \leq f_{l (k)} .$ (35)

因此，这两种情况都表明 $f_{l (k + 1)}$ 是递减序列。

引理5 若序列{x_k}由算法2生成，则有

$f_{k + 1} \leq R_{k + 1}, \forall k \in Ν \cup {0} .$ (36)

证明：根据 $f_{l (k + 1)}$ 的定义，对于所有的 $k \in Ν \cup {0}$ ，我们有 $f_{k + 1} \leq f_{l (k + 1)}$ ，则

$\begin{matrix} f_{k + 1} = η_{k + 1} f_{k + 1} + (1 - η_{k + 1}) f_{k + 1} \\ \leq η_{k + 1} f_{l (k + 1)} + (1 - η_{k + 1}) f_{k + 1} \\ = R_{k + 1}, \forall k \in N \cup {0} . \end{matrix}$

引理6 [19] 若序列{x_k}由算法2生成，则有

$\lim_{k \to \infty} f_{l (k)} = \lim_{k \to \infty} f (x_{k}) .$ (37)

引理7 假设(H1)、(H2)、(H3)成立，则存在常数Q > 0使得对任意的k有

$| [f (x_{k}) - f (x_{k} + s_{k})] - [ϕ_{k} (0) - ϕ_{k} (s_{k})] | \leq \frac{1}{2} (Q - \tilde{k}) Δ_{k}^{2} .$ (38)

证明：假设存在正数Q，使得 $‖ \nabla^{2} f (x) ‖ \leq Q$ ，则由引理3和Taylor展开式得

$\begin{array}{l} | [f (x_{k}) - f (x_{k} + s_{k})] - [ϕ_{k} (0) - ϕ_{k} (s_{k})] | \\ = | f (x_{k}) - f (x_{k} + s_{k}) + g_{k}^{T} s_{k} + κ_{k} g_{k}^{T} s_{k} + \frac{1}{2} s_{k}^{T} B_{k} s_{k} + o ({‖ s_{k} ‖}^{2}) | \\ = | - \frac{1}{2} s_{k}^{T} \nabla^{2} f (x_{k} + v_{k} s_{k}) s_{k} + κ_{k} g_{k}^{T} s_{k} + \frac{1}{2} s_{k}^{T} B_{k} s_{k} + o ({‖ s_{k} ‖}^{2}) | \\ \leq \frac{1}{2} (Q - \tilde{k}) {‖ s_{k} ‖}^{2} \\ \leq \frac{1}{2} (Q - \tilde{k}) Δ_{k}^{2}, \end{array}$

其中 $\tilde{k} = \frac{1}{2 M_{1}} \min {1, ξ c^{p}}$ 。则结论得证。

定理1 假设(H1)、(H2)、(H3)成立，序列 ${‖ g_{k} ‖}, {‖ B_{k} ‖}$ 是有界的，那么对任意的 $ε > 0$ ，算法2在有限次迭代后终止。

证明：反证法。

首先证明 $‖ g_{k} ‖ > ε > 0$ 时必有 $\lim_{k \to \infty} Δ_{k} = 0$ 。由 $r_{k}$ 的定义知：

(1) 若 $k \in I$ 时，

$R_{k} - f (x_{k} + s_{k}) \geq μ (P r e d (s_{k})) \geq \frac{1}{2} μ \frac{‖ g ‖}{‖ B ‖} \min {‖ g ‖, \frac{ξ Δ_{k}}{‖ B^{- 1} ‖}} \geq \frac{1}{2} μ ε \min {\frac{ε}{M_{1}}, ξ Δ_{k}},$ (39)

其中 $ξ = \frac{1 - ω}{{(1 + ω)}^{2}}, ω \in (0, \frac{1}{3})$ 。

因 $f_{k}$ 有界可得 $R_{k}$ 有界，所以

$+ \infty > \sum_{k = 1}^{\infty} R_{k} - f (x_{k} + s_{k}) \geq \sum_{k \in I} R_{k} - f (x_{k} + s_{k}) \geq \sum_{k \in I} μ (P r e d (s_{k})) \geq \sum_{k \in I} \frac{1}{2} μ ε \min {\frac{ε}{M_{1}}, ξ Δ_{k}},$ (40)

又因为

$\sum_{k \in I} \frac{1}{2} μ ε \min {\frac{ε}{M_{1}}, ξ Δ_{k}} < + \infty,$ (41)

所以 $\sum_{k \in I} Δ_{k}$ 是收敛的，故必有 $\lim_{k \to \infty} Δ_{k} = 0$ 。

由于 $Δ_{k} : = c^{p} \frac{‖ s_{k - 1} ‖}{‖ q_{k - 1} ‖} ‖ g_{k} ‖ \geq c^{p} \frac{‖ g_{k} ‖}{‖ B_{k} ‖}$ ，对充分大的k，则有

$Δ_{k} \geq c^{p} \frac{ε}{M_{1}} > 0$ (42)

这与 $\lim_{k \to \infty} Δ_{k} = 0$ 矛盾，从而定理得证。

(2) 若 $k \in J$ 时，由(34)~(36)可得

$f_{k} \leq R_{k} \leq f_{l (k)},$ (43)

因 $f_{k}$ 有界以及引理6可得 $R_{k}$ 有界且收敛，所以 $R_{k} - f (x_{k} + α_{k} s_{k}) \geq - β α_{k} g_{k}^{T} s_{k} > 0$ 。

因为 $s_{k}$ 是下降方向，有 $f_{k + 1} \leq f_{k}$ ，可得 $R_{k} \geq \max {f_{k + 1}, f_{k + 2}, \dots} - β α_{k} g_{k}^{T} s_{k} .$

又根据 $R_{k}$ 的定义得 $R_{k + 1}$ 是 $f_{l (k + 1)}$ 和 $f_{(k + 1)}$ 的凸组合，则有 $R_{k + 1} \leq \max {f_{l (k + 1)}, f_{k + 1}}$ ，可得

$R_{k} - R_{k + 1} \geq - β α_{k} g_{k}^{T} s_{k} > 0.$ (44)

所以对充分大的k，这与 $R_{k}$ 收敛矛盾，从而定理得证。

定理2 假设(H1)、(H2)、(H3)成立，则有

$\lim_{k \to \infty} \inf ‖ g_{k} ‖ = 0.$ (45)

证明：反证法

假设存在充分大的k，有 $g_{k} \geq ε_{0} > 0$ 。由引理7和式子(4-24)得

$\begin{matrix} | \frac{f (x_{k}) - f (x_{k} + s_{k})}{P r e d (s_{k})} - 1 | = | \frac{[f (x_{k}) - f (x_{k} + s_{k})] - [ϕ_{k} (0) - ϕ_{k} (s_{k})]}{P r e d (s_{k})} | \\ = | \frac{\frac{1}{2} (Q - \tilde{k}) Δ_{k}^{2}}{P r e d (s_{k})} | \leq \frac{(Q - \tilde{k}) Δ_{k}^{2}}{ε \min {\frac{ε}{M_{1}}, ξ Δ_{k}}} . \end{matrix}$

又 $r_{k} = \frac{R_{k} - f (x_{k} + s_{k})}{P r e d (s_{k})} \geq \frac{f (x_{k}) - f (x_{k} + s_{k})}{P r e d (s_{k})}$ ，令 $k \to \infty$ ，由于 $\lim_{k \to \infty} Δ_{k} = 0$ ，则

$\lim_{k \to \infty} \frac{f (x_{k}) - f (x_{k} + s_{k})}{P r e d (s_{k})} = 1 .$ (46)

所以，必存在一个充分大的k，有 $r_{k} \geq u$ ，且存在 $c > 0$ 使得

$Δ_{k} : = c^{p} \frac{‖ s_{k - 1} ‖}{‖ q_{k - 1} ‖} ‖ g_{k} ‖ \geq c^{p} \frac{‖ g_{k} ‖}{‖ B_{k} ‖} > c^{p} \frac{ε_{0}}{M_{1}} > 0,$

这与 $\lim_{k \to \infty} Δ_{k} = 0$ 矛盾，从而定理得证。

5. 数值结果

本节给出算法2 (non monotonic adaptive fractional trust region, NAFTR)的数值试验结果，并与分式模型信赖域算法(fractional trust region, FTR) (文献 [18] 中算法3)做比较。算法用Matlab R2020a编程实现，数值实验在PC机上Windows系统中进行。

本节选出的18个测试函数选自于文献 [20] [21] ，初始点的选取与文献 [18] 相同。同时在本文的算法2中取 $a_{k} = b_{k} = c_{k} = 0$ ，得到二次模型信赖域子问题(non monotonic adaptive trust region, NATR)；取 $b_{k} = c_{k} = 0$ ，得到锥模型信赖域子问题(non monotonic adaptive conic trust region, NACTR)，一起与分式模型子问题进行比较。算法2选取的迭代终止条件为最后一次迭代梯度的范数小于10⁻⁴。在表中， $‖ g_{k} ‖$ 是最后一次迭代梯度的欧式范数；CPU(s)表示算法总的迭代时间(单位秒)。如果计算不出结果或者时间超过200 s或者迭代次数超过1000次，则用“----”表示。在算法2中选择的参数为：

$ω = 0.33, Δ_{0} = 1, Δ_{\max} = 10, u = 0.25, N = 4, ρ = 0.5.$

另外，本文选择 $η_{0} = 0.15$ 且 $η_{k}$ 按如下方式更新：

$η_{k} = {\begin{cases} η_{0} / 2, if k = 1, \\ (η_{k - 1} + η_{k - 2}) / 2, if k \geq 2. \end{cases}$

以及半径相关参数c的更新方式如下：

$c = {\begin{cases} 0.3, if \frac{Δ_{\max}}{10} < Δ \leq Δ_{\max}, \\ 0.45, if 10^{- 6} < Δ \leq \frac{Δ_{\max}}{10}, \\ 0.6, o .w . \end{cases}$

测试函数如表1，数值结果如表2，表3。

Table 1. Testing issues

表1. 测试问题

Table 2. Numerical results

表2. 数值结果

Table 3. Numerical results of the improved algorithm under different level vectors

表3. 改进后算法在不同水平向量下的数值结果

表2为NAFTR和FTR在18个测试问题下的数值比较，其中维数最高为11。对于其中的15个测试问题，NAFTR算法的迭代次数或者是CPU运行时间是优于FTR算法的，3个问题的数值结果几乎和原算法一样。

与此同时，在NAFTR算法中使水平向量 $a_{k} = b_{k} = c_{k} = 0$ 或者 $b_{k} = c_{k} = 0$ ，分别得到二次模型以及锥模型信赖域子问题。数值结果如表3所示，可以看出，分式模型子问题的数值结果明显优于二次模型子问题和锥模型子问题。

6. 结论

本文从理论上证明了非单调自适应分式模型信赖域算法的全局收敛性。在数值实验中，新算法比文献 [18] 的算法3的数值结果更优。从一定程度上证明了引用非单调自适应技术能使信赖域算法的效率更高，尤其在维度较高的问题上。

另外，分式模型子问题拓宽了信赖域子问题的适用性，在大规模以及较复杂的问题上分式模型是比二次模型和锥模型子问题更为有效和稳健的。

因此，无论是从理论还是数值结果上看，非单调自适应分式模型信赖域算法都值得我们进一步探究。但是，本文对分式模型的水平向量的插值条件或者是子问题求解方法的研究比较单一，这些内容都需要我们深思研究。

参考文献

[1]	袁亚湘, 孙文瑜. 最优化理论与方法[M]. 北京: 科技出版社, 1999.
[2]	Powell, M.J.D. and Yuan, Y.X. (1991) A Trust Region Algorithm for Equality Constrained Optimization. Mathematical Programming, 49, 189-211. [Google Scholar] [CrossRef]
[3]	Davidon, W.C. (1980) Conic Approximations and Collinear Scalings for Optimizers. SIAM Journal on Numerical Analysis, 17, 268-281. [Google Scholar] [CrossRef]
[4]	Ni, Q. (2005) Optimality Conditions for Trust-Region Subproblems Involving a Conic Model. SIAM Journal on Optimization, 15, 826-837. [Google Scholar] [CrossRef]
[5]	Zhu, H., Ni, Q. and Zeng, M. (2015) A Quasi-Newton Trust Region Method Based on a New Fractional Model. Numerical Algebra, Control and Optimization, 5, 237-249. [Google Scholar] [CrossRef]
[6]	Grippo, L., Lampariello, F. and Lucidi, S. (1986) A Nonmonotone Line Search Technique for Newton’s Method. SIAM Journal on Numerical Analysis, 23, 707-716. [Google Scholar] [CrossRef]
[7]	Grippo, L., Lampariello, F. and Lucidi, S. (1989) A Truncated Newton Method with Nonmonotone Line Search for Unconstrained Optimization. Journal of Optimization Theory and Applica-tions, 60, 401-419. [Google Scholar] [CrossRef]
[8]	Zhang, H. and Hager, W.W. (2004) A Nonmonotone Line Search Tech-nique and Its Application to Unconstrained Optimization. SIAM Journal on Optimization, 14, 1043-1056. [Google Scholar] [CrossRef]
[9]	Ahookhosh, M., Amini, K. and Peyghami, M.R. (2012) A Nonmonotone Trust-Region Line Search Method for Large-Scale Unconstrained Optimization. Applied Mathematical Modelling, 36, 478-487. [Google Scholar] [CrossRef]
[10]	Zhang, X., Zhang, J. and Liao, L. (2002) An Adaptive Trust Re-gion Method and Its Convergence. Science in China Series A: Mathematics, 45, 620-631.
[11]	Shi, Z.J. and Guo, J. (2008) A New Trust Region Method with Adaptive Radius. Computational Optimization and Applications, 41, 225-242. [Google Scholar] [CrossRef]
[12]	Cui, Z.R., et al. (2018) A New Adaptive Trust Region Algorithm for Optimization Problems. Acta Mathematica Scientia, 38, 479-496. [Google Scholar] [CrossRef]
[13]	Xue, Y., Liu, H. and Liu, Z. (2019) An Improved Nonmon-otone Adaptive Trust Region Method. Applications of Mathematics, 64, 335-350. [Google Scholar] [CrossRef]
[14]	Kamandi, A. and Amini, K. (2022) A New Nonmonotone Adap-tive Trust Region Algorithm. Applications of Mathematics, 67, 233-250. [Google Scholar] [CrossRef]
[15]	冯琳, 段复建. 基于锥模型的非单调自适应信赖域算法[J]. 山西大学学报: 自然科学版, 2011(4): 580-586.
[16]	王开荣, 曾刘拴. 基于锥模型的非单调自适应信赖域算法[J]. 华中师范大学学报(自然科学版), 2015, 49(2): 171-178.
[17]	陆晓平, 倪勤, 刘浩. 解新锥模型信赖域子问题的折线法[J]. 应用数学学报, 2007, 30(5): 855-871.
[18]	朱红兰, 倪勤, 党创寅, 等. 求解无约束优化问题的分式模型信赖域算法[J]. 中国科学: 数学, 2018, 48(4): 531-546.
[19]	Ahookhosh, M. and Amini, K. (2010) A Nonmonotone Trust Region Method with Adaptive Radius for Unconstrained Optimization Problems. Computers & Mathematics with Applications, 60, 411-422. [Google Scholar] [CrossRef]
[20]	Moré, J.J., Garbow, B.S. and Hillstrom, K.E. (1981) Testing Unconstrained Optimization Software. ACM Transactions on Mathematical Software (TOMS), 7, 17-41. [Google Scholar] [CrossRef]
[21]	诸梅芳, 薛毅, 张凤圣. 锥模型的拟NEWTON型信赖域方法[J]. 高等学校计算数学学报, 1995, 17(1): 36-47.

为你推荐

友情链接