可微无约束全局优化问题的一种新的无参数填充函数法

doi:10.12677/aam.2024.1312516

期刊菜单

可微无约束全局优化问题的一种新的无参数填充函数法
A New Non-Parameter Filled Function Method for Differentiable Unconstrained Global Optimization Problems

DOI: 10.12677/aam.2024.1312516, PDF, HTML, XML,
作者: 宋鸿杰：浙江师范大学数学科学学院，浙江金华；朱桂勇^*：浙江师范大学行知学院，浙江金华
关键词: 全局优化；填充函数；无参数；Global Optimization； Filled Function； Non-Parameter

摘要: 填充函数法在求解全局优化问题中有广泛的应用，此方法利用目标函数的局部性质搜索局部极小点，并通过构造填充函数避免陷入局部极小，通过极小化过程和填充过程的迭代，直到满足终止条件，得到问题的全局极小点。本文提出了一个新的求解无约束全局优化问题的无参数填充函数，其局部极小点与目标函数相同，能够减少算法计算量。在合理的假设条件下，证明该函数的填充性质和相关性质，并设计相应的算法，利用经典算例进行实验，表明该算法是有效可行的。

Abstract: The filled function method has a wide range of applications in solving global optimization problems. This method utilizes the local properties of the objective function to search for local minima, and avoids getting stuck in local minima by constructing a filled function. Through the iteration of the minimization process and filled process until the termination condition is satisfied, the global minima of the problem is obtained. In this paper, we propose a new parameter free filled function, whose local minima are the same as the objective function, which can reduce the computational complexity of the algorithm. Based on reasonable assumptions, we discuss the theoretical properties of the filled function, and develop a corresponding algorithm. Numerical experiments demonstrate the algorithm’s effectiveness and feasibility.

文章引用：宋鸿杰, 朱桂勇. 可微无约束全局优化问题的一种新的无参数填充函数法[J]. 应用数学进展, 2024, 13(12): 5343-5349. https://doi.org/10.12677/aam.2024.1312516

1. 引言

全局优化是数学优化领域中非常有意义的研究方向，近年来，随着科学技术的发展，科学和技术领域中需要解决的问题越来越追求全局最优解，特别是在图像处理、金融规划、工程设计等领域中遇到的很多现实问题，都可以将其转化为数学的全局优化问题进行求解。

从算法的结构来看，全局优化算法可以分为确定性算法和随机性算法，其中确定性算法利用目标函数的一些局部特性，并根据某种确定性策略搜索得到局部极小点，并试图跳出已获得的局部极小点而达到全局极小点。填充函数算法是求解全局优化问题的一种确定性算法，这一概念最初是由西安交通大学的葛人溥教授提出的[1]。

考虑如下的无约束优化问题：

$\begin{array}{l} \min f (x) \\ s .t . x \in R^{n}, \end{array}$

其中， $f (x)$ 为 $R^{n}$ 上的二阶连续可微函数，且满足假设[1]：1) 目标函数 $f (x)$ 满足强制性条件，当 $‖ x ‖ \to \infty$ 时， $f (x) \to \infty$ ；2) $f (x)$ 含有有限个局部极小值。该假设说明存在有界闭集 $X \subset R^{n}$ 包含 $f (x)$ 的所有全局极小点和函数值较小的局部极小点，且可认为目标函数在X边界上的函数值大于在其内部的函数值。

填充函数法的基本思想如下：首先运用已有的局部极小化算法对目标函数进行运算，得到一个局部极小点 $x^{*}$ ，在 $x^{*}$ 处构造填充函数，并对填充函数进行极小化运算，这样就能使填充函数的局部极小点 $\bar{x}$ 跳出原目标函数局部极小点 $x^{*}$ 所在的谷域，接着以 $\bar{x}$ 作为新的初始点，再次对目标函数进行极小化运算，就能进入目标函数值更小的区域进行搜索，从而逐步逼近全局极小点。不断重复迭代，直到满足终止条件，即可以当前局部极小点作为全局极小点输出。

在文献[1]中，葛人溥教授提出一个填充函数为：

$P (x, x^{*}, γ, ρ) = \frac{1}{γ + f (x)} \cdot \exp (- \frac{‖ x - x^{*} ‖}{ρ^{2}}) .$

后续学者针对上述函数中参数选取困难和指数项会导致出现假的平稳点等不足之处，对填充函数理论进行了一系列的研究和改进，提出了许多不含指数项的、单参数或是无参数的填充函数[2]-[14]，填充函数的理论得到不断发展。杨永建教授等在文献[4]中提出了一种新的填充函数定义。

定义1 $x^{*}$ 是函数 $f (x)$ 的当前局部极小点，函数 $P (x, x^{*})$ 称为函数 $f (x)$ 在局部极小点 $x^{*}$ 处的填充函数，如果满足：

1) $x^{*}$ 是 $P (x, x^{*})$ 的一个严格局部极大点；

2) $P (x, x^{*})$ 在 $S_{1} = {x \in X | f (x) \geq f (x^{*}), x \neq x^{*}}$ 上没有平稳点；

3) 如果 $x^{*}$ 不是全局极小点，那么 $f (x)$ 和 $P (x, x^{*})$ 在 $S_{2} = {x \in X | f (x) < f (x^{*})}$ 上有相同平稳点。

定义1修改了文献[1]定义中峰和盆谷的概念，使得填充函数的定义更加清晰，在该定义下，当 $x^{*}$ 非全局极小点，则极小化填充函数 $P (x, x^{*})$ 所得的下一个局部极小点只会出现在函数值比 $f (x^{*})$ 小的区域中，且填充函数与目标函数有相同的局部极小点，于是在算法运行过程中可以通过极小化填充函数而不用极小化原函数得到局部极小点，提高了算法的运行效率。本文在该定义的基础上，提出了一个新的无参数填充函数，并设计了相应填充函数算法，证明了其有效性。

2. 一个新的无参数填充函数

令 $L (P)$ 表示目标函数 $f (x)$ 的所有局部极小点的集合，给出在定义1下的如下填充函数：

$P (x, x^{*}) = [\frac{π}{2} - \arctan (‖ x - x^{*} ‖)] \cdot \max {0, φ (f (x) - f (x^{*}))} + φ (f (x) - f (x^{*})),$ (1.1)

其中

$φ (t) = {\begin{cases} 1, t \geq 0, \\ t^{3}, t < 0. \end{cases}$

下证函数 $P (x, x^{*})$ 是满足定义2的填充函数。

定理1 假设 $x^{*}$ 是函数 $f (x)$ 的一个局部极小点，则 $x^{*}$ 是 $P (x, x^{*})$ 的一个严格局部极大点。

证明：因为 $x^{*}$ 是函数 $f (x)$ 的一个局部极小点，那么，存在 $δ > 0$ ，使得对任意 $x \in O (x^{*}, δ)$ 且 $x \neq x^{*}$ 时，有 $f (x) \geq f (x^{*})$ ，所以有 $φ (f (x) - f (x^{*})) = 1$ ，由此得到

$\begin{array}{l} P (x^{*}, x^{*}) = \frac{π}{2} + 1 \\ P (x, x^{*}) = \frac{π}{2} - \arctan (‖ x - x^{*} ‖) + 1 \\ P (x^{*}, x^{*}) - P (x, x^{*}) = \arctan (‖ x - x^{*} ‖) > 0, \end{array}$

从而 $x^{*}$ 是 $P (x, x^{*})$ 的一个严格局部极大点，定理得证。 □

定理2 $P (x, x^{*})$ 在 $S_{1} = {x \in X | f (x) \geq f (x^{*}), x \neq x^{*}}$ 上没有平稳点。

证明：任意 $x \in S_{1}$ ，有

$\begin{array}{l} P (x, x^{*}) = \frac{π}{2} - \arctan (‖ x - x^{*} ‖) + 1 \\ \nabla P (x, x^{*}) = - \frac{x - x^{*}}{‖ x - x^{*} ‖} \cdot \frac{1}{1 + {‖ x - x^{*} ‖}^{2}}, \end{array}$

又因为 $x \neq x^{*}$ ，由此

$\begin{matrix} {(x - x^{*})}^{T} \cdot \nabla P (x, x^{*}) = - \frac{{(x - x^{*})}^{T} (x - x^{*})}{‖ x - x^{*} ‖} \cdot \frac{1}{1 + {‖ x - x^{*} ‖}^{2}} \\ = - \frac{‖ x - x^{*} ‖}{1 + {‖ x - x^{*} ‖}^{2}} < 0, \end{matrix}$

故对任意的 $x \in S_{1}$ ， $\nabla P (x, x^{*}) \neq 0$ ，定理得证。 □

注1：当 $f (x) \geq f (x^{*})$ 时，由定理2可知 $d = x - x^{*}$ 是 $P (x, x^{*})$ 在 $x^{*}$ 处的下降方向，即 $d^{T} \nabla P (x, x^{*}) < 0$ 。

定理3 假设函数 $f (x)$ 连续可微，则 $f (x)$ 和 $P (x, x^{*})$ 在 $S_{2} = {x \in X | f (x) < f (x^{*})}$ 上有相同平稳点。

证明：对任意 $x \in S_{2}$ ， $f (x) - f (x^{*}) < 0$ ， $φ (f (x) - f (x^{*})) = {(f (x) - f (x^{*}))}^{3} < 0$ ，则

$P (x, x^{*}) = {(f (x) - f (x^{*}))}^{3}$ ，那么 $\nabla P (x, x^{*}) = 3 {(f (x) - f (x^{*}))}^{2} \cdot \nabla f (x)$ 。则当 $\nabla f (x) = 0$ 时， $\nabla P (x, x^{*}) = 0$ ，反之亦然。定理得证。 □

综上，说明式(1.1)定义的函数 $P (x, x^{*})$ 是满足定义2的填充函数。

性质1 若对任意 $x_{1}, x_{2} \in S_{1}$ ，满足 $f (x_{1}) \geq f (x^{*})$ 和 $f (x_{2}) \geq f (x^{*})$ ，则 $P (x_{2}, x^{*}) < P (x_{1}, x^{*}) < P (x^{*}, x^{*})$ 的充要条件是 $‖ x_{2} - x^{*} ‖ > ‖ x_{1} - x^{*} ‖$ 。

证明：充分性：因为 $f (x_{1}) \geq f (x^{*})$ ， $f (x_{2}) \geq f (x^{*})$ ，由定义，得到

$\begin{array}{l} P (x_{1}, x^{*}) = \frac{π}{2} - \arctan (‖ x_{1} - x^{*} ‖) + 1 \\ P (x_{2}, x^{*}) = \frac{π}{2} - \arctan (‖ x_{2} - x^{*} ‖) + 1. \end{array}$

因 $‖ x_{2} - x^{*} ‖ > ‖ x_{1} - x^{*} ‖$ ，故 $P (x_{2}, x^{*}) < P (x_{1}, x^{*})$ ，又由定理2知 $P (x_{1}, x^{*}) < P (x^{*}, x^{*})$ ，因此 $P (x_{2}, x^{*}) < P (x_{1}, x^{*}) < P (x^{*}, x^{*})$ 。

反之，必要性显然，若 $P (x_{2}, x^{*}) < P (x_{1}, x^{*})$ ，则有 $\frac{π}{2} - \arctan (‖ x_{1} - x^{*} ‖) + 1 < \frac{π}{2} - \arctan (‖ x_{2} - x^{*} ‖) + 1$ ，由

此可得 $‖ x_{2} - x^{*} ‖ > ‖ x_{1} - x^{*} ‖$ ，定理得证。 □

注2：性质1说明在 $S_{1}$ 中，填充函数 $P (x, x^{*})$ 的值离 $f (x)$ 当前局部极小点 $x^{*}$ 越远就越小，从而保证算法运行中，能有效地跳出当前局部极小点所在的区域，避免出现重复往返搜索的现象，得到一个函数值更小的局部极小点。

性质2 对任意 $x_{1}, x_{2} \in X \ {x^{*}}$ ，若 $f (x_{1}) \geq f (x^{*}) > f (x_{2})$ ，则 $P (x_{2}, x^{*}) < P (x_{1}, x^{*}) < P (x^{*}, x^{*})$ 。

证明：因为 $f (x_{1}) \geq f (x^{*}) > f (x_{2})$ ，由填充函数的定义，得到

$\begin{array}{l} P (x_{1}, x^{*}) = \frac{π}{2} - \arctan (‖ x_{1} - x^{*} ‖) + 1 \\ P (x_{2}, x^{*}) = {(f (x_{2}) - f (x^{*}))}^{3} . \end{array}$

因 $‖ x_{1} - x^{*} ‖ \geq 0$ ， $f (x_{1}) \geq f (x^{*}) > f (x_{2})$ ，则 $P (x_{2}, x^{*}) < 0 < P (x_{1}, x^{*}) < P (x^{*}, x^{*})$ ，定理得证。 □

性质3 对 $P (x, x^{*})$ 的任一个局部极小点 $x_{P}^{*}$ ，其中 $x_{P}^{*} \neq x^{*}$ ，有 $f (x_{P}^{*}) < f (x^{*})$ 。

证明：根据定理2， $P (x, x^{*})$ 在 $S_{1}$ 上没有平稳点，则 $P (x, x^{*})$ 的任一局部极小点 $x_{P}^{*}$ 都在 $S_{2}$ 中，而根据 $S_{2}$ 的定义，立即得到 $f (x_{P}^{*}) < f (x^{*})$ 。 □

3. 算法与数值实验

根据上述填充函数的性质，极小化该填充函数 $P (x, x^{*})$ 得到的局部极小点同时也是目标函数 $f (x)$ 的一个更好的局部极小点，于是在计算过程中就不用再对目标函数进行极小化，相比传统的填充函数算法减少了一个循环，减少了计算量。在此基础上提出了一个新的无参数填充函数算法，称为NPFF算法，具体算法如下：

步骤0：选取 $ε = 10^{- 8}$ ，作为该算法的容许误差;选取方向 $e_{i}$ ， $i = 1, 2, \dots, m$ ， $m \geq 2 n$ ，其中n是变量的个数；令 $k = 1$ ，表示迭代次数，记迭代次数上界为K，可取 $K = 20$ ；选取初始点 $x_{0} \in X$ 。

步骤1：以 $x_{0}$ 为初始点，利用局部极小化算法得到目标函数 $f (x)$ 的一个局部极小点 $x_{1}^{*}$ 。

步骤2：在局部极小点 $x_{1}^{*}$ 处构造填充函数

$P (x, x_{1}^{*}) = [\frac{π}{2} - \arctan (‖ x - x_{1}^{*} ‖)] \cdot \max {0, φ (f (x) - f (x_{1}^{*}))} + φ (f (x) - f (x_{1}^{*})) .$

步骤3：如果 $i \leq m$ ，则以 ${\bar{x}}_{k} : = x_{1}^{*} + δ e_{i}$ 作为初始点，应用局部极小化算法得到 $P (x, x_{1}^{*})$ 的局部极小点 $x^{*}$ ；否则，我们认为使用初始点 ${\bar{x}}_{k}$ 已经找不到更好地局部极小点，终止算法，将当前极小点 $x_{1}^{*}$ 和 $f (x_{1}^{*})$ 作为近似全局极小点和近似全局极小值输出。

步骤4：如果 $x^{*}$ 不在 $X$ 中，则令 $i : = i + 1$ ，转步骤3；否则，转步骤5。

步骤5：如果 $f (x^{*}) < f (x_{1}^{*})$ ，则令 $x_{1}^{*} = x^{*}$ ， $k : = k + 1$ ，转步骤2；否则，令 $i : = i + 1$ ，转步骤3。

NPFF算法相比当前大部分填充函数算法，只需对填充函数进行极小化计算，而不需要对原函数进行极小化计算，减小了相当一部分计算量，同时NPFF算法不含有参数，省略了调整参数的步骤，使得算法的运行速度变得更快。

对上述算法，使用Python3.9软件进行编程，并通过以下数值实验对NPFF算法的有效性进行验证。以下是符号说明：

$x_{0}$ ：目标函数局部极小化时的初始点；

k：外循环目标函数局部极小化迭代次数；

$x_{k}^{*}$ ：目标函数的第k个局部极小点；

$f (x_{k}^{*})$ ：目标函数第k个局部极小点处的局部极小值；

T：算法运行时间。

例1 (Six-hump back camel function)

$\begin{array}{l} \min f (x) = 4 x_{1}^{2} - 2.1 x_{1}^{4} + \frac{1}{3} x_{1}^{6} - x_{1} x_{2} - 4 x_{2}^{2} + 4 x_{2}^{4} \\ s .t . - 3 \leq x_{i} \leq 3, i = 1, 2. \end{array}$

选取若干不同初始点得到的算法运行结果如下表1所示：

Table 1. Result of Example 1

表1. 算例1结果

$x_{0}$	k	$x_{k}^{*}$	$f (x_{k}^{*})$	T
$(1, 1)$	1	$(0.0898, 0.7126)$	−1.0316	0.7248 s
$(- 3, 3)$	1	$(- 1.7036, - 0.7961)$	−0.2154
	2	$(- 0.0898, - 0.7126)$	−1.0316	0.7554 s
$(- 3, - 3)$	1	$(- 1.6071, 0.5686)$	2.1042
	2	$(- 0.0898, - 0.7126)$	−1.0316	0.7262 s

通过选取三个不同初始点，得到全局最优解为 $x^{*} = (- 0.0898, - 0.7126)$ 和 $(0.0898, 0.7126)$ ，全局极小值为 $f^{*} = - 1.0316$ 。

例2 (Two-dimensional Rastrigin function)

$\begin{array}{l} \min f (x) = x_{1}^{2} + x_{2}^{2} - \cos (18 x_{1}) - \cos (18 x_{2}) \\ s .t . - 2 \leq x_{i} \leq 2, i = 1, 2. \end{array}$

选取若干不同初始点得到的算法运行结果如下表2所示：

Table 2. Result of Example 2

表2. 算例2结果

$x_{0}$	k	$x_{k}^{*}$	$f (x_{k}^{*})$	T
$(1, 1)$	1	$(1.0407, - 1.0407)$	0.1791
	2	$(- 3.63 e^{- 14}, 1.04 e^{+ 00})$	−0.9101
	3	$(- 7.65 e^{- 17}, - 4.92 e^{- 14})$	−2.0	0.0986 s
$(2, 2)$	1	$(1.0407, 2.0814)$	3.4493
	2	$(- 4.59 e^{- 10}, 2.08 e^{+ 00})$	2.3594
	3	$(- 3.29 e^{- 10}, 1.04 e^{+ 00})$	−0.9101
	4	$(2.07 e^{- 12}, - 4.59 e^{- 10})$	−2.0	0.0871 s
$(1, - 2)$	1	$(1.0407, - 1.0407)$	0.1791
	2	$(- 4.22 e^{- 14}, - 6.93 e^{- 01})$	−1.5156
	3	$(1.09 e^{- 11}, 1.62 e^{- 10})$	−2.0	0.0935 s

通过选取三个不同初始点，均算得该问题的全局极小值为 $f^{*} = - 2.0$ 。

例3 (Three-hump back camel function)

$\begin{array}{l} \min f (x) = 2 x_{1}^{2} - 1.05 x_{1}^{4} + \frac{1}{6} x_{1}^{6} - x_{1} x_{2} + x_{2}^{2} \\ s .t . - 3 \leq x_{i} \leq 3, i = 1, 2. \end{array}$

选取若干不同初始点得到的算法运行结果如下表3所示：

Table 3. Result of Example 3

表3. 算例3结果

$x_{0}$	k	$x_{k}^{*}$	$f (x_{k}^{*})$	T
$(1, 1)$	1	$(6.44 e^{- 12}, 2.80 e^{- 12})$	$7.28 e^{- 23}$	0.2773 s
$(3, 1)$	1	$(1.7475, 0.8737)$	0.2986
	2	$(- 1.29 e^{- 16}, 3.51 e^{- 17})$	$2.02 e^{- 32}$	0.4381 s
$(- 3, 2)$	1	$(- 1.7475, - 0.8737)$	0.2986
	2	$(3.32 e^{- 17}, 9.01 e^{- 17})$	$7.33 e^{- 33}$	0.3742 s

通过选取三个不同初始点，均算得该问题的全局极小值为 $f^{*} = 0$ 。

例4 (n-dimensional function)

$\begin{array}{l} \min f (x) = \frac{π}{n} [10 \sin^{2} (π x_{1}) + g (x) + {(x_{n} - 1)}^{2}] \\ s .t . - 10 \leq x_{i} \leq 10, i = 1, 2, \dots, n . \end{array}$

其中 $g (x) = \sum_{i = 1}^{n - 1} {{(x_{i} - 1)}^{2} [1 + 10 \sin^{2} (π x_{i + 1})]}$ 。选取不同n的值得到的算法运行结果如下表4所示：

Table 4. Result of Example 4

表4. 算例4结果

n	$x_{0}$	$x_{k}^{*}$	$f (x_{k}^{*})$	T
3	$(2, 2, 2)$	$(1.00, 1.00, 1.00)$	$6.31 e^{- 16}$	0.62 s
5	$(2, 2, 2, 2, 2)$	$(1.00, 0.99, 1.001.00, 0.99)$	$4.31 e^{- 15}$	0.77 s
8	$(3, 3, 3, 3, 3, 3, 3, 3)$	$(0.99, 1.00, 1.00, 1.001.00, 1.00, 0.99, 1.00)$	$3.66 e^{- 16}$	1.24 s

通过选取 $n = 3, 5, 8$ 三个维度的初始点，均能算得该问题全局极小值为 $f^{*} = 0$ 。

4. 结语

本文提出的填充函数与原目标函数有相同的局部极小点，省去了以往填充函数算法中需要重新计算目标函数局部极小点的过程，并且不含参数，省去了参数调节的过程，所构造的填充函数算法形式简单，便于计算。数值算例的结果表明该算法是有效可行的，在此基础上，可以将其与机器学习算法结合，进行进一步的理论探讨与应用研究。

NOTES

^*通讯作者。

参考文献

[1]	Ge, R.P. and Qin, Y.F. (1987) A Class of Filled Functions for Finding Global Minimizers of a Function of Several Variables. Journal of Optimization Theory and Applications, 54, 241-252. [Google Scholar] [CrossRef]
[2]	An, L., Zhang, L. and Chen, M. (2004) A Parameter-Free Filled Function for Unconstrained Global Optimization. Journal of Shanghai University (English Edition), 8, 117-123. [Google Scholar] [CrossRef]
[3]	Wu, Z.Y., Lee, H.W.J., Zhang, L.S. and Yang, X.M. (2005) A Novel Filled Function Method and Quasi-Filled Function Method for Global Optimization. Computational Optimization and Applications, 34, 249-272. [Google Scholar] [CrossRef]
[4]	Gao, Y., Yang, Y. and You, M. (2015) A New Filled Function Method for Global Optimization. Applied Mathematics and Computation, 268, 685-695. [Google Scholar] [CrossRef]
[5]	张玉琴, 冯向东, 张建亮. 一个求解无约束优化的单参数填充函数算法[J]. 计算机技术与发展，2020, 30(7): 38-41.
[6]	钟以维, 徐应涛, 张莹. 用填充函数法改进的人脸比对算法[J]. 计算机技术与发展, 2009, 19(8): 78-81.
[7]	姚桂霞, 叶仲全, 马雪. 一类求全局最小点的填充函数及其算法[J]. 计算机技术与发展, 2012, 22(8): 96-99.
[8]	刘津, 叶仲泉. 一类新的寻求全局最优解的填充函数[J]. 计算机技术与发展, 2010, 20(6): 36-38.
[9]	吴波, 高岳林. 求无约束连续全局优化问题的单参数填充函数法[J]. 宁夏大学学报(自然科学版), 2017, 38(3): 221-223.
[10]	茅嘉, 杨永建. 一个无参数的填充函数算法[J]. 应用数学与计算数学学报, 2010, 24(1): 35-44.
[11]	陈佳利, 张莹, 王胜刚, 等. 一个新的填充函数及其在数据拟合问题中的应用[J]. 运筹学学报, 2021, 25(1): 81-88.
[12]	王伟祥, 尚有林, 王朵. 求解带箱子集约束的非光滑全局优化问题的填充函数方法[J]. 运筹学学报, 2019, 23(1): 28-34
[13]	屈德强, 尚有林, 詹悦, 等. 全局优化问题的一个新的无参数填充函数[J]. 运筹学学报, 2021, 25(1): 89-95.
[14]	马素霞, 高岳林, 杨丽丽, 等. 约束优化问题的单参数填充函数算法[J]. 应用数学, 2023, 36(4): 891-902.

为你推荐

友情链接