一类混合束方法子问题的求解研究
Study on the Solution of a Hybrid Bundle Method Subproblem
DOI: 10.12677/ORF.2019.92019, PDF, HTML, XML, 下载: 715  浏览: 1,583 
作者: 李函阳:辽宁师范大学数学学院,辽宁 大连
关键词: 非光滑优化束方法Lagrange对偶空间Non-Smooth Optimization Bundle Method Lagrange Dual Space
摘要: 非光滑优化问题的求解一直以来都是优化理论的重点研究对象,本文提出了一类带有矩阵范数的混合束方法子问题,然后利用对偶空间理论研究该问题的Lagrange函数,最后通过对偶问题与原问题的关系,计算出该混合束方法子问题的解,并给出具体的表达式。
Abstract: The solutions of non-smooth optimization problem have been the focus of the optimization theory for a long time. This paper proposes a class of hybrid bundle method subproblem with matrix norm, and then researches this subproblem’s Lagrange function by taking advantage of the dual space theorem. Finally, based on relation between the dual problem and the original problem, the solution of hybrid bundle method subproblem is calculated, and the concrete expression is given.
文章引用:李函阳. 一类混合束方法子问题的求解研究[J]. 运筹与模糊学, 2019, 9(2): 165-169. https://doi.org/10.12677/ORF.2019.92019

1. 引言

对非光滑优化问题来说,束方法是其最有效的解决方法之一。很多学者在束方法的理论和应用方面都取得了较多的有益成果,见文献 [1] [2] [3] [4] [5] 。考虑原始问题 min x R n f ( x ) ,其中 f R n R 的非光滑凸函数。文献 [6] 中作者提出了一个带矩阵范数的双稳定子问题,文献 [7] 中作者对目标函数增加迫近项和对可行域增加信赖域约束,灵活地把邻近束方法和信赖域束方法结合起来构造了混合束方法。通过 [6] 和 [7] 的启发,本文提出了一类带矩阵范数的混合束方法子问题:

{ min f ^ k ( x ) + 1 2 τ k | x x k | k 2 s .t . | x x k | k 2 δ k 2

这里引用了矩阵范数,并通过计算得到该子问题解的表达式。

2. 预备知识

束方法基本原理是在迭代进行到第 k 步时,产生了一组候选点列 { y i } i = 1 k 和一组稳定中心点列 { x i } i = 1 k ,它利用候选点列的信息来构造目标函数 f ( x ) 的切平面近似 f ^ k ( x ) ,然后求得 d k ,令 y k + 1 = x k + d k 作为下一个候选点,然后进行下降性检验,以此来确定下一个稳定中心,同时更新束,如此迭代得一点列 { x k } ,满足 { x k } 的任一聚点都是原问题的最优解。

束方法具体来说常见的有信赖域束方法、邻近束方法和水平束方法,其中信赖域束方法和邻近束方法的迭代格式分别为:

y k + 1 = arg min { f ^ k ( x ) | x x k δ k , x R n } y k + 1 = arg min { f ^ k ( x ) + 1 2 τ k x x k 2 | x R n }

其中 δ k > 0 为信赖域参数, τ k > 0 为邻近参数。

3. 混合束方法子问题的产生

受文献 [6] 和 [7] 的启发,本文提出了一类带矩阵范数的混合束方法子问题:

{ min f ^ k ( x ) + 1 2 τ k | x x k | k 2 s .t . | x x k | k 2 δ k 2 (2.1)

在这里令 f ^ k ( x ) = max j J k { f ( y j ) + g j , x y j } = max j J k { f ( x k ) + g j , x x k α j k } ,其中, f x k 点的线性化误差为 α j k = f ( x k ) f ( y j ) + g j , x y j ,由此知 g j α j f ( y j ) J k 为指标集, x k 为当前稳定中心,当 k 时, δ k 0 ,记问题(2.1)的最优解为 x k + 1 。我们定义原空间范数 | | k 2 = M k , ,其对偶空间范数为 k 2 = M k - 1 M k 是对称正定矩阵。

当迭代次数的增加,束中的元素原来越多,对之后的计算和储存会带来巨大的麻烦,所以采用现已有的聚合技术,将束进行压缩至只保留 n p k 个元素, n p k 甚至有可能小于 k ,这时 j { 1 , 2 , , n p k } ,接着我们对其对偶问题展开研究。

4. 混合束方法子问题解的表达式

由于问题(2.1)是非光滑凸优化问题,对非光滑凸优化问题来说在满足Slater约束规格的条件下,对问题的求解可以转化为其极小化Lagrange函数问题的求解,也就是说必然存在一个乘子 0 λ k R ,能

使 x k + 1 = arg min x R n L ( x , λ k ) ,在这里 L ( x , λ k ) = f ^ k ( x ) + 1 2 τ k | x x k | k 2 + 1 2 λ k ( | x x k | k 2 δ k 2 ) ,故问题(2.1)等价于下述问题:

{ min f ^ k ( x ) + 1 2 τ k | x x k | k 2 + 1 2 λ k ( | x x k | k 2 δ k 2 ) x R n (3.1)

问题(3.1)还可以等价的写成:

{ min f ^ k ( x ) + 1 + λ k τ k 2 τ k | x x k | k 2 λ k δ k 2 2 x R n (3.2)

我们定义相应的额定下降:

ξ k + 1 = f ( x k ) ( f ^ k ( x k + 1 ) + 1 + λ k τ k 2 τ k | x k + 1 x k | k 2 λ k δ k 2 2 )

定理3.1:令问题(2.1)的最优解为 x k + 1 ,假设参数 δ k , τ k > 0 ,则有

x k + 1 = x k τ k 1 + λ k τ k M k 1 g ^ k ,其中 g ^ k = j = 1 n p k β g j

并且 β ¯ = ( β ¯ 1 β ¯ 2 , β ¯ n p k ) 是下述问题的最优解

{ min τ k 2 ( 1 + λ k τ k ) j = 1 n p k β j g j k 2 + j = 1 n p k β j α j k s . t . β Δ k : = { z [ 0 , 1 ] n p k : j = 1 n p k z j = 1 } (3.3)

证明:因为问题(3.2)和问题(2.1)是等价的,所以可以通过引入变量 r 得到问题(3.2)的等价形式如下:

(3.4)

β R + n p k 时,问题(3.4)的Lagrange函数为:

L ( x , r , β ) = r + 1 + λ k τ k 2 τ k | x x k | k 2 λ k δ k 2 2 + j = 1 n p k β j ( f ( x k ) + g j , x x k α j k r )

整理得:

L ( x , r , β ) = ( 1 j = 1 n p k β j ) r + j = 1 n p k β j ( f ( x k ) + g j , x x k α j k ) + 1 + λ k τ k 2 τ k | x x k | k 2 λ k δ k 2 2

由于目标函数是强凸的,所以问题(2.1)有且仅有一个解。记最优乘数为 β ¯ ( x k + 1 , β ¯ ) 可以从问题(3.4)和它的对偶问题中获得。

min ( x , r ) R n × R max β R + n p k L ( x , r , β ) = max β R + n p k min ( x , r ) R n × R L ( x , r , β )

该问题与问题(3.4)的有限最优值是一样的,不一样的是对偶问题的内层是无约束最小化优化问题,所以必有 1 j = 1 n p k β j = 0 。基于以上结论,问题(3.2)的最优解 x k + 1 和最优乘数 β ¯ 分别可以从原问题和对偶问题中得到。

min x R n max β R + n p k L ( x , β ) = max β R + n p k min x R n L ( x , β )

其中

L ( x , β ) = j = 1 n p k β j ( f ( x k ) + g j , x x k α j k ) + 1 + λ k τ k 2 τ k | x x k | k 2 λ k δ k 2 2 = f ( x k ) + j = 1 n p k ( β j g j , x x k β j α j k ) + 1 + λ k τ k 2 τ k ( x x k ) T M k ( x x k ) λ k δ k 2 2

考虑对偶问题,对于 β Δ k ,应用 x ( β ) = arg min x L ( x , β ) 的最优性条件 x L ( x ( β ) , β ) = 0 。即

x L ( x ( β ) , β ) = j = 1 n p k β j g j + 1 + λ k τ k τ k M k ( x ( β ) x k ) = 0 (3.5)

g ^ k = j = 1 n p k β ¯ g j ,当 β = β ¯ x ( β ¯ ) = x k + 1 时,有 x k + 1 = x k τ k 1 + λ k τ k M k 1 g ^ k

接下证明 β ¯ 是问题(3.3)的解。

首先,在式子(3.5)的两边同时乘 x ( β ) x k

j = 1 n p k β j g j ( x ( β ) x k ) + 1 + λ k τ k τ k ( x ( β ) x k ) T M k ( x ( β ) x k ) = 0

j = 1 n p k β j g j , x ( β ) x k + 1 + λ k τ k τ k | x ( β ) x k | k 2 = 0 (3.6)

同理在式(3.5)两边同时乘 M k 1

M k 1 j = 1 n p k β j g j + 1 + λ k τ k τ k ( x ( β ) x k ) = 0

再在两边同乘 τ k 1 + λ k τ k j = 1 n p k β j g j

τ k 1 + λ k τ k j = 1 n p k β j g j M k 1 j = 1 n p k β j g j + j = 1 n p k β j g j , x ( β ) x k = 0

(3.7)

将式子(3.6)和式子(3.7)联立,得

τ k 1 + λ k τ k j = 1 n p k β j g j k 2 = 1 + λ k τ k τ k | x ( β ) x k | k 2

故有

L ( x ( β ) , β ) = f ( x k ) + j = 1 n p k ( β j g j , x x k β j α j k ) + 1 + λ k τ k 2 τ k | x x k | k 2 λ k δ k 2 2 = f ( x k ) + 1 + λ k τ k 2 τ k | x x k | k 2 λ k δ k 2 2 + j = 1 n p k β j g j , x x k j = 1 n p k β j α j k = f ( x k ) + τ k 2 ( 1 + λ k τ k ) j = 1 n p k β j g j k 2 λ k δ k 2 2 + g ^ k , τ k 1 + λ k τ k M k 1 g ^ k j = 1 n p k β j α j k = f ( x k ) + τ k 2 ( 1 + λ k τ k ) g ^ k k 2 λ k δ k 2 2 τ k 1 + λ k τ k g ^ k k 2 j = 1 n p k β j α j k = f ( x k ) ( τ k 2 ( 1 + λ k τ k ) g ^ k k 2 + λ k δ k 2 2 + j = 1 n p k β j α j k )

综上所述 β ¯ 是问题(3.3)的解。

5. 结论

本文从Lagrange对偶空间理论出发,研究了一类带有矩阵范数的混合束方法子问题,并通过计算得到该子问题的解,最后给出解的具体表达式,为以后束方法问题研究工作的展开提供了新的理论基础。

参考文献

[1] 高岩. 非光滑优化[M]. 北京: 科学出版社, 2008.
[2] 王宜举, 修乃华. 非线性最优化理论与方法[M]. 北京: 科学出版社, 2012.
[3] 沈洁, 曹天水, 李娜, 等. 关于复合迫近束方法对偶问题的研究[J]. 吉林师范大学学报(自然科学版), 2013, 34(4): 1-4.
[4] 沈洁, 赵睿, 高亚丽. 水平束方法子问题的求解研究[J]. 吉林师范大学学报(自然科学版), 2017, 38(2): 54-57.
[5] 沈洁, 李轩, 李娜. 关于双稳定束方法对偶问题的研究[J]. 吉林师范大学学报(自然科学版), 2014, 35(3): 64-67.
[6] 沈洁, 李娜, 田佳茜. 双稳定束方法以及收敛性分析[J]. 沈阳师范大学学报(自然科学版), 2015, 33(2): 177-180.
[7] 张清叶, 高岩. 求解非光滑凸规划的一种混合束方法[J]. 运筹学学报, 2016, 20(2): 113-120.