基于修正的Carroll函数的概率约束优化问题的对偶算法
A Dual Algorithm for Probabilistic Constrained Optimization Problems Based on Modified Carroll Functions
摘要: 本文用连续可微非凸函数描述的概率约束分析非线性随机优化问题。为此描述了潜在概率函数的水平集的切锥和法锥,并在此基础上,提出p-有效点的定义,形成问题的一阶和二阶最优性条件,基于p-有效点生成的概率函数的水平集,通过修正的Carroll函数生成一个对偶算法。
Abstract: In this paper, probabilistic constraints described by continuously differentiable non-convex functions are used to analyze nonlinear stochastic optimization problems. To this end, the tangent and normal cones of the level set of potential probability functions are described, and on this basis, the definition of p-effective points is proposed to form the first and second order optimality conditions of the problem. Based on the water-level set of probability functions generated by p-effective points, a dual algorithm is generated by the modified Carroll function.
文章引用:冯千千. 基于修正的Carroll函数的概率约束优化问题的对偶算法[J]. 应用数学进展, 2024, 13(11): 5100-5105. https://doi.org/10.12677/aam.2024.1311492

1. 引言

目前,很多有重要价值的实际问题都属于概率约束优化问题,因而概率约束优化问题的研究具有重要的理论意义和应用价值。

如风险优化中的风险值计算问题,含新能源电力系统化调度问题,移动网络中的路线定位处理问题等均可建模为下述概率约束优化问题:

minf( x ) s.t.  Pr[ g( x )Y ]p,        xX, (PCOP)

其中 f: n g( x )=( g 1 ( x ),, g m ( x ) ) g i : n m ,是二次连续可微函数, X n 是一个闭凸集, Y m 是随机的,概率 p( 0,1 ) 是置信水平,Pr代表概率。

对于 p( 0,1 ) Y的分布函数的水平集为

L p ={ y R m :Pr[ Yy ]p } .

由分布函数的单调性和右连续性易知,集合 L p 是非空且闭的,问题(PCOP)可表示为

minf( x ) s.t.  g( x ) L p ,       xX. (1)

非线性Lagrange函数是经典的Lagrange函数的修正形式,它关于乘子向量或约束函数是非线性函数;基于非线性Lagrange函数建立的求解非线性优化问题的对偶方法即为非线性Lagrange方法。由于对偶方法对原始变量的可行性没有限制。因此非线性Lagrange方法在求解约束优化问题中扮演着重要的角色。

2. 概率约束优化问题(PCOP)的凸近似形式

对于 y m Y的分布函数为:

F Y ( y )=Pr[ Yy ] .

定义1 [1] 对于 p( 0,1 ) v m 被称为概率分布函数 F Y 的一个p-有效点,如果 F Y ( v )p ,并且不存在 yv yv ,使得 F Y ( y )p

对于 p( 0,1 ) ,记

={ v| v F Y ( y )p- } ,

对于 v j jJ ,定义

K j = v j + + m ,

这里的J是一个任意集合。

命题1 [1] L p = jJ K j

S m+1 表示 m+1 中的单纯形,即

S m+1 ={ α m+1 : i=1 m+1 α i =1, α i 0,i=1,,m+1 } ,

p-有效点集的凸包 co 表示如下:

co={ i=1 m+1 α i v j i :α S m+1 , j i J } .

命题2 [1] 对于每一个 p( 0,1 ) ,集合 co L p 是闭的。

定义2 S为非空凸集, xS ,若x不能用S中的两个不同点的凸组合表示,即不存在 x 1 S x 2 S x 1 x 2 ,使

x=α x 1 +( 1α ) x 2 , 0<α<1,

成立,则称xS的一个极点。

命题3 [1] 对于每个点 p( 0,1 ) ,有

co L p =co+ + m ,

co L p 的极点集 E ,且 Eco

对于任意 p( 0,1 ) L p co L p 有下界[1]

引理1 [2] co L p =coE+ + m

由此,问题(1)近似于如下问题:

minf( x ) s.t.  g( x )co L p ,       xX. (2)

3. 最优性条件

记问题(2)的可行域为:

Φ={ x| g( x )co L p ,xX } .

f( x ) fx处的梯度。gx处的Jacobian。

x ^ Φ ,则存在 ω ^ y ^ + m 使得 g( x ^ )= ω ^ + y ^ ,记

I 0 ( x ^ )={ i| y ^ i =0, 1im }

x ^ 处的积极约束, K X ( x ^ ) 是集合X x ^ X 处的可行方向锥,向量 δ K X ( x ^ ) 和一个p-有效点 ω i 0 的凸组合有如下关系:

i I 0 ( x ^ ) , g i ( x ^ )+ g i ( x ^ ),δ > ω i 0 . (3)

条件(3)等价于问题(2)在可行点 x ^ 处的Robinson’s约束规范条件。

命题4 [2] 在可行点 x ^ Φ 处的约束规范(3)条件下,记

T Φ ( x ^ )={ δ T X ( x ^ ):ω, β>0: g i ( x ^ )+ g i ( x ^ ),βδ ω i i I 0 ( x ^ ) }

为可行集 Φ x ^ 处的切锥。

定义 L( x,u )=f( x ) u,g( x ) 。记 N A ( z ) 为集合A zA 处的法锥。

定理1 [2] 假设 x ^ 是问题(2)的一个局部最优解,且在 x ^ 处满足条件(3),则存在一个向量 u ^ + m ,使得

x L( x ^ , u ^ ) N X ( x ^ ) , u ^ N co L p ( g( x ^ ) ) (4)

如果函数f是凸的,g是一个凹映射,存在某一向量 u ^ + m ,使得 x ^ Φ 满足条件(4),则 x ^ 是问题(2)的一个全局最优解。

Λ( x ^ )={ u ^ |0 x L( x ^ , u ^ )+ N co L p ( g( x ^ ) ) } .

记切锥

T X ( x ^ )= lim t0 sup Xx t .

定理2 [2] 假设 x ^ Φ 满足条件(3)和(4),对于 uΛ( x ^ ) ,以及对于每个满足条件

f( x ^ ),δ =0 u,g( x ^ )δ =0

的非零的 δ T X ( x ^ ) ,有

δ, x 2 L( x ^ ,u )δ >0 , (5)

x ^ 是问题(2)的一个局部极小解。

IJ 是问题(2)的p-有效点集的子集, | I | 表示它的基数。由引理1可知,

g( x )= jJ λ j v j + y i ,  v j , λ | I | ,  y i + m .

于是,问题(2)的近似问题如下:

min x,λ f( x ) s.t.   g( x ) jI λ j v j ,        xX,        λ S | I | . (6)

注意,当I = J时,问题(6)和(2)重合。

4. 求解问题(3)的对偶算法

考虑Polyak [3]在1992年提出的修正的Carroll函数:

C( x,u,k )={ f 0 ( x ) k 1 i=1 m u i [ 1 ( k f i ( x )+1 ) 1 ], xint Ω k , +,                                                   xint Ω k ,

其中k > 0是惩罚参数, Ω k ={ x|1+k f i ( x )0,i=1,,m } ,则问题(6)的修正的Carroll函数有如下形式:

F ρ ( x,λ,u )=f( x ) ρ 1 i=1 m u i [ 1 ( ρ( g i ( x ) jI λ j v i j )+1 ) 1 ] ,  xint Ω ρ ,

其中,

Ω ρ ={ x|1+ρ( g i ( x ) jI λ j v i j )0,i=1,,m } .

对偶算法

步0选择一个p-有效点 v 1 使得存在一点 x ˜ X 满足 g( x ˜ )> v 1

J 1 ={ v 1 } k=1 。且选择 u 1 0

步1 解决主问题

min x,λ F ρ,k ( x,λ, u k )        xX,λ S k ,

( x k , λ k ) 是这个问题的解。

步2 如果 k>1 u k u k1 <ε ,那么停止,否则继续步3。

步3 计算

u i k+1 = u i k 1 ρ( g i ( x ) jI λ j v i j )+1 .

步4 找到一个p-有效点 v k+1 作为如下问题的解:

min zco L p u k+1 ,z ,

J k+1 ={ v k+1 } J k

步5 令 kk+1 ,然后转步1。

接下来,我们做如下假设:

A1存在一个数 d>0 ,使得随机向量Y的两个实现间的距离大于d

A2集合X是凸的、紧致的。

定理3 [2]存在一个有限子集 IJ ,使得问题(2)的局部一阶最优性条件和问题(6)的等价。

定理4 假设A1和A2,且问题(2)的可行域非空,则对于参数 ρ>0 ,由对偶算法产生的序列 { x k } { u k } 的聚点 x ^ u ^ ,满足问题(2)的一阶最优性条件,此外,若 x ^ 满足条件(3)和(5),那么 x ^ 是问题(2)的一个局部极小解。

证明:由于在A1下,只存在许多有限的p-有效点,算法没有产生p-有效点的非有限序列。因此,在某次迭 k 0 后,没有新的p-有效点在步4中出现,当X紧致, { x k } 有一个收敛到子序列的聚点。由于g的连续性, { g( x k ) } kK 有一个聚点 g( x ^ ) 。我们记 z k = j J k λ j k v j 。由于有限个p-有效点存在,集合 是有界的且 { z k } kK co L p 中有一聚点,我们记作 z ^ 。相似地,序列 { λ k } 有聚点 λ ^ S k 0 z ^ = j J k λ ^ j k v j 。我们可以选择一个迭代序列 K{ 1,2,3, } 以至于这些聚点是相关子序列的极限。记 J={ i: z ^ <g( x ^ ) } 我们注意到对于足够大的 kK ρ 足够大的时候,我们得到 u i k =0 。而且,根据算法步3,对于 iJ ,有

u i k+1 = 1 ρ( g i ( x ) jI λ j v i j )+1 . (7)

我们将证明对于 iJ z ^ i = g i ( x ^ ) 。假设对于某个 iJ z ^ i > g i ( x ^ ) 成立,那么 lim k u i k = 。此外,k足够大时,修正的Carroll函数有如下形式:

F ρ ( x,λ,u )=f( x ) ρ 1 i=1 m u i [ 1 ( ρ( g i ( x ) jI λ j v i j )+1 ) 1 ] .

因此, lim k F ρ ( x k , λ k , u k )= 。另一方面,设 λ ˜ = ( 1,0,,0 ) Τ S J k ,我们得到 ( x ˜ , λ ˜ )X× S J k 。当k足够大时,

F ρ ( x ˜ , λ ˜ ,u )=f( x ˜ ) ρ 1 i=1 m u i [ 1 ( ρ( g i ( x ) jI λ ˜ j v i j )+1 ) 1 ] f( x ˜ )< F ρ,k ( x k , λ k , u k )

这和 ( x k , λ k ) 是步骤一中主问题的解的结论是矛盾的,因此 z ^ i g i ( x ^ ) ,这表明对于所有的 iJ z ^ i = g i ( x ^ ) 。结合(7)式得到, { u k } 有一个聚点 u ^ ,使得对于所有 i: u ^ >0 ,有 z ^ i = g i ( x ^ )

步1中主问题的最优性条件是:

对于足够大的 kK ,我们可以将步1中主问题的最优性条件写成

F( x k , u k+1 ) N X ( x k ) (8)

V J 0 Τ u k N S k 0 ( λ k ) (9)

条件(9)意味着

0 u k , V J 0 ( λ λ k ) = u k , V J 0 λ z k (10)

假设存在一点 ωco L p \co{ v j ,j J k } 使得 u k ,ω z k <0 ,应用这个假设和(10),我们得到

u k ,ω v k = u k ,ω z k + u k , z k v k > u k , z k v k 0 .

不等式 u k ,ω v k >0 和问题 min zco L p u k+1 ,z 的最优性条件是矛盾的,这说明 u k N co L p ( v k ) 。因此, u k N co L p ( z k ) ,结合(8),表明

F( x k , u k+1 ) N X ( x k ) (11)

u k+1 N co L p ( z k+1 ) (12)

k取极限,并将Ruszczynski [4]中的引理2.42应用到(11)-(12),我们得到

F( x ^ , u ^ ) N X ( x ^ ) , u ^ N co L p ( g( x ^ ) ) .

因此, x ^ 满足问题(2)的条件(4),根据定理2, x ^ 是问题(2)的一个局部极小解。证毕。

参考文献

[1] Dentcheva, D., Lai, B. and Ruszczyński, A. (2004) Dual Methods for Probabilistic Optimization Problems. Mathematical Methods of Operational Research, 60, 331-346.
https://doi.org/10.1007/s001860400371
[2] Dentcheva, D. and Martinez, G. (2011) Augmented Lagrangian Method for Probabilistic Optimization. Annals of Operations Research, 200, 109-130.
https://doi.org/10.1007/s10479-011-0884-5
[3] Polyak, R. (1992) Modified Barrier Functions (Theory and Methods). Mathematical Programming, 54, 177-222.
https://doi.org/10.1007/bf01586050
[4] Ruszczyński, A. (2006) Nonlinear Optimization. Princeton University Press.