决策依赖模糊集下的分布鲁棒优化的重构
Reconstruction of Distributed Robust Optimization under Decision-Dependent Ambiguity Set
摘要: 本文考虑一类分布鲁棒优化问题,其中随机变量的概率分布依赖于决策变量。模糊集由带有参数均值和协方差矩阵的集合定义,且不确定参数的均值与决策相关。当支撑集为全空间时,本文利用Lagrange对偶理论证明了原问题等价于半定规划问题,且可以转化成形式更简单的非光滑凸问题,进而可得到为更易处理的二阶锥优化问题。
Abstract: In this paper we consider a class of Distributionally Robust Optimization (DRO) Problems where the probability distribution of random variables depends on decision variables and the ambiguity set is defined through a set with parameter mean and covariance matrix, and the mean of uncertain pa-rameters is dependent on decision. Under the condition of the support set is the whole space, We demonstrate the original problem is equivalent to the semidefinite programming problem by using Lagrange duality theory. Moreover, it can be transformed into a simpler form of non-smooth convex problem, and we further obtain a more tractable second-order cone optimization.
文章引用:王奕菲, 杨妍娇, 张杰. 决策依赖模糊集下的分布鲁棒优化的重构[J]. 应用数学进展, 2023, 12(4): 1648-1654. https://doi.org/10.12677/AAM.2023.124170

1. 引言

考虑下述分布鲁棒优化问题

min x X max P U ( x ) Ε P [ f ( x , ξ ) ] (1.1)

其中X是 n 上的闭集, f : n × k 是连续函数, ξ : Ω Ξ 是定义在可测空间 ( Ω , F ) 上的随机变量,它的概率分布P以 Ξ k 为支撑。 U ( x ) 是包含随机变量 ξ 的真实概率分布P的随机分布集合,且该集合于决策相关, Ε P [ ] 表示关于 P U ( x ) 的数学期望。显然,这个模型中的关键是概率分布集 U ( x ) ,我们称之为模糊集。在早期的研究中,学者们普遍假设不能获得随机变量的真实概率分布,只能知道局部的矩条件,并且这些条件独立于决策变量,在此基础上,可以构建模糊集来解决优化问题。Bertsima,Popescu [1] 考虑了随机变量 ξ 的均值和协方差矩阵,以此建立模糊集:

U 1 = { P Γ | P ( ξ Ξ ) = 1 Ε P [ ξ ] = μ Ε P [ ( ξ μ ) ( ξ μ ) Τ ] = Σ } (1.2)

其中 Γ 表示 ( Ω , F ) 空间中所有概率测度的集合,但是他们也证明了在模糊集 U 1 下的模型是难以处理的。随后,Wiesemann,Kuhn,Sim [2] 等人将 U 1 中的 Σ 改为协方差的上界,得到了新的模糊集:

U 2 = { P Γ | P ( ξ Ξ ) = 1 Ε P [ ξ ] = μ Ε P [ ( ξ μ ) ( ξ μ ) Τ ] Σ } (1.3)

并证明了在模糊集 U 2 下的线性鲁棒优化问题是可处理的。Delage,Ye [3] 则在 U 1 的基础上进一步作出改进,令 r 1 0 , r 2 1 ,且 δ > 0 是已知的参数,则得到下列模糊集:

U 3 = { P Γ | P ( ξ Ξ ) = 1 ( Ε P [ ξ ] μ ) Τ Σ 1 ( Ε P [ ξ ] μ ) r 1 Ε P [ ( ξ μ ) ( ξ μ ) Τ ] r 2 Σ } (1.4)

并证明了在适当的条件下真概率测度 P 0 U 3 的置信度 α 1 δ 。刘强 [4] 以模糊集 U 3 为基础,讨论了基于一阶矩和二阶矩信息的不确定分布及的分布鲁棒优化问题,值得注意的是,支撑集 Ξ 在分布鲁棒优化的重构问题的可处理性上有着重要影响。

在以上这些工作中,概率测度的分布集合都与决策无关。但在实际问题中,往往需要考虑决策变量对模糊集的影响,Zhang等人 [5] 考虑了一类模糊集依赖于决策变量x的分布鲁棒优化模型,并对其进行定量稳定性分析。其中模糊集表示为:

U 4 ( x ) = { P Γ | Ε P [ Ψ ( x , ξ ) ] Κ } (1.5)

这里 Ψ 是具有可测随机分量的向量或矩阵的随机映射, Ψ 的取值依赖于x,K是闭凸锥;石楠 [6] 考虑了仅可估计参数均值的情况,并假设均值与决策相关,以此构建了决策相关的模糊集。这类问题在实际应用中非常广泛,例如,Basciftci等人 [7] 考虑到选址决策会影响客户需求,从而提出了一个需求不确定性下的分布鲁棒设施选址问题;Doan [8] 考虑了决策相关模糊集下的分布鲁棒优化及其在改造规划中的应用。

本文结合 U 3 U 4 ( x ) 两个集合,构造了一个全新的模糊集,它类似 U 3 且随机变量的概率分布与决策变量相关,该集合含如下矩信息:

U ( x ) = { P Γ | P ( ξ Ξ ) = 1 Ε P [ ξ ] [ A m × n x , B m × n x ] Ε P [ ξ ξ Τ ] Σ } (1.6)

其中 Ξ m 上的闭凸集, A m × n , B m × n m × n 阶矩阵。

本文的剩余部分如下,第2章讨论了在(1.6)的条件下,问题(1.1)的等价形式,使原问题更易处理;第3章考虑了当支撑集 Ξ 是全空间时,原问题可转化为半定规划;第4章在第3章的条件下进一步证明了半定规划可转化为二阶锥规划。

2. 原问题的重新表示

本章给出了问题(1.1)在模糊集(1.6)的条件下的重新表示。首先,我们给定 f ( x , ξ ) 的具体表达,定义 f ( x , ξ ) = c Τ x + ( E m × n x ) Τ ξ ,令:

h ( x , α 0 , α , Y ) = sup ξ Ε { f ( x , ξ ) α 0 α Τ ξ ξ Τ Y ξ } . (2.1)

我们可以得到问题(1.1)的重新表示:

命题2.1:问题(1.1)可以重新表示为下面的约束优化问题

min α 0 + ( A m × n x ) Τ α + ( B m × n x A m × n x ) Τ α + + Σ , Y s .t . h ( x , α 0 , α , Y ) 0 , x X , Y 0. (2.2)

其中 α + = max { α , 0 }

证明:定义问题(1.1)的内极大问题 p ( x ) = max P U ( x ) Ε P [ f ( x , ξ ) ] ,令

U ( μ ( x ) ) = { P Γ | P ( ξ Ξ ) = 1 , Ε P [ ξ ] = μ ( x ) , Ε P [ ξ ξ Τ ] Σ } ,

Ψ ( x , μ ( x ) ) = max P U ( μ ( x ) ) Ε P [ f ( x , ξ ) ] .

故而

p ( x ) = max { Ψ ( x , μ ( x ) ) : μ ( x ) [ A m × n x , B m × n x ] } . (2.3)

由模糊集(1.6)的结构,可以写出下述内极大问题,即

max d P ( ξ ) 0 Ξ f ( x , ξ ) d P ( ξ ) s .t . Ξ d P ( ξ ) = 1 , Ξ ξ d P ( ξ ) = μ ( x ) , Ξ ξ ξ Τ d P ( ξ ) Σ . (2.4)

Ψ ( x , μ ( x ) ) 是问题(2.4)的最优值。进一步,(2.4)的Lagrange函数为

L ( d P , α 0 , α , Y ) = Ξ f ( x , ξ ) d P ( ξ ) α 0 ( Ξ d P ( ξ ) 1 ) ( Ξ ξ d P ( ξ ) μ ( x ) ) Τ α ( Ξ ξ ξ Τ d P ( ξ ) Σ ) Τ Y = α 0 + μ ( x ) Τ α + Σ , Y + Ξ [ f ( x , ξ ) α 0 α Τ ξ ξ Τ Y ξ ] d P ( ξ ) .

其中 α 0 , α , Y 分别为对应的Lagrange乘子。由Shapiro [9] 对偶理论可得,

Ψ ( x , μ ( x ) ) = min α 0 , α , Y 0 max P ( ξ ) 0 L ( d P , α 0 , α , Y ) = min α 0 , α , Y 0 α 0 + μ ( x ) Τ α + Σ , Y s .t . f ( x , ξ ) α 0 α Τ ξ ξ Τ Y ξ 0 , ξ Ξ . (2.5)

再由 h ( x , α 0 , α , Y ) 的定义可知,

p ( x ) = max Ψ ( x , μ ( x ) ) = max μ ( x ) min α 0 , α , Y 0 { α 0 + μ ( x ) Τ α + Σ , Y : h ( x , α 0 , α , Y ) 0 , μ ( x ) [ A m × n x , B m × n x ] } = min α 0 , α , Y 0 max μ ( x ) { α 0 + μ ( x ) Τ α + Σ , Y : h ( x , α 0 , α , Y ) 0 } = min α 0 , α , Y 0 { α 0 + ( A m × n x ) Τ α + ( B m × n x A m × n x ) Τ α + + Σ , Y : h ( x , α 0 , α , Y ) 0 } .

所以问题(1.1)等价于 min x X p ( x ) ,即原问题等价于约束优化问题(2.2)。

3. 原问题等价于半定规划问题

在这一章中,我们考虑当支撑集 Ξ 是全空间时的情况,可以证明,当 Ξ = m 时,原问题可以转化成一个半定规划问题,令

G ( x , α 0 , α , Y ) = ( c Τ x α 0 ( E m × n x α ) Τ 2 E m × n x α 2 Y ) , (3.1)

可以得到下面的定理:

定理3.1:令 f ( x , ξ ) = c Τ x + ( E m × n x ) Τ ξ ,则问题(1.1)可以转化成如下半定规划问题:

min x , α 0 , α , Y α 0 + ( A m × n x ) Τ α + ( B m × n x A m × n x ) Τ α + + Σ , Y s .t . G ( x , α 0 , α , Y ) 0 , x X , Y 0. (3.2)

证明:由(2.5)可知, Ψ ( x , μ ( x ) ) 的约束条件是 f ( x , ξ ) α 0 α Τ ξ ξ Τ Y ξ 0 , ξ Ξ 。它可以等价地写成与 G ( x , α 0 , α , Y ) 相关的不等式,即

( 1 ξ ) Τ ( c Τ x α 0 ( E m × n x α ) Τ 2 E m × n x α 2 Y ) ( 1 ξ ) 0 , ξ Ξ .

这恰好等价于 G ( x , α 0 , α , Y ) 0 ,证毕。

4. 原问题等价于二阶锥规划问题

接下来,我们将问题(3.2)转化成更简单的非光滑凸问题,进而转化为二阶锥规划问题。

定理4.1:假设X是 n 上的非空紧集,则(3.2)等价于下述非光滑凸问题:

min x , α c Τ x + ( A m × n x ) Τ α + ( B m × n x A m × n x ) Τ α + + Σ 1 2 ( α E m × n x ) s .t . x X . (4.1)

证明:问题(3.2)的Lagrange函数是

L ( x , α 0 , α , Y , Ω ) = α 0 + ( A m × n x ) Τ α + ( B m × n x A m × n x ) Τ α + + Σ , Y + Ω , G ( x , α 0 , α , Y ) ,

其中 Ω = ( z 0 z Τ z Μ ) , z 0 , z m , Μ S m × m 。故 L ( x , α 0 , α , Y , Ω ) 可以表示成如下形式:

L ( x , α 0 , α , Y , Ω ) = α 0 + ( A m × n x ) Τ α + ( B m × n x A m × n x ) Τ α + + z 0 ( c Τ x α 0 ) + z Τ ( E m × n x α ) + Σ Μ , Y ,

整理后得,

L ( x , α 0 , α , Y , Ω ) = α 0 ( 1 z 0 ) + [ ( A m × n x ) Τ α + ( B m × n x A m × n x ) Τ α + z Τ α ] + z 0 c Τ x + z Τ ( E m × n x ) + Σ Μ , Y ,

考虑到问题(3.2)满足Slater条件,则其解必然满足下列KKT条件:

{ 0 A m × n Τ α + ( B m × n A m × n ) Τ α + + c Τ z 0 + z Τ E m × n , 0 A m × n x + ( B m × n x A m × n x ) α + z , 1 z 0 = 0 , Σ Μ = 0 , 0 Ω G ( x , α 0 , α , Y ) 0 , (4.2)

通过(4.2)第三个条件和第四个条件,可以得到 Ω 的具体表达形式:

Ω = ( 1 z Τ z Σ ) ,

0 Ω G ( x , α 0 , α , Y ) 0 ,可知 G ( x , α 0 , α , Y ) 是零矩阵或秩为1的半正定矩阵,下面分情况讨论:

1) 若 G ( x , α 0 , α , Y ) 是零矩阵,则 c Τ x = α 0 E m × n x = α Y = 0

2) 若 G ( x , α 0 , α , Y ) 是秩为1的半正定矩阵,则存在 r 0 r m ,使得 ( r 0 r Τ ) 0

G ( x , α 0 , α , Y ) = ( r 0 r ) ( r 0 r Τ ) . (4.3)

假设 r 0 = 0 ,则 G ( x , α 0 , α , Y ) = ( r 0 r 0 r 0 r Τ r 0 r r r Τ ) = ( 0 0 0 r r Τ ) ,结合(3.1)可得 Y = r r Τ 。又 G ( x , α 0 , α , Y ) , Ω = 0 ,故 r Τ Σ r = 0 ,则 r = 0 ,与 ( r 0 r Τ ) 0 矛盾,故 r 0 0 。现将(3.1)代入到(4.3)中,可以得到下述等式关系:

{ r 0 r 0 = α 0 c Τ x , r = α E m × n x 2 r 0 , r r 0 = Y .

因此,

Σ , Y = r 0 2 + c Τ x + r Τ Σ r = c Τ x + r 0 2 + ( α E m × n x ) Τ Σ ( α E m × n x ) 4 r 0 2 c Τ x + Σ 1 2 ( α E m × n x ) .

综上所述,问题(3.2)可以转化为问题(4.1),且 α 0 = c Τ x ,证毕。

根据上述定理,我们显然可以将问题(4.1)等价地表示为一个二阶锥规划问题:

min c Τ x + ( A m × n x ) Τ α + 1 m q + t s .t . ( B m × n x A m × n x ) Τ α q 0 , ( Σ 1 2 ( α E m × n x ) , t ) K m + 1 , q 0. (4.4)

其中 K m + 1 m + 1 是二阶锥,定义为 K m + 1 = { ( ω , ω 0 ) m + 1 : ω ω 0 }

5. 结论

本文研究了一类带有依赖决策矩约束的分布鲁棒优化的重构问题,利用Lagrange对偶理论将其转化为半定规划,进而得到了易于求解的二阶锥规划问题,该问题可以利用神经网络等算法求解,具有较高的理论价值和现实意义。

NOTES

*通讯作者。

参考文献

[1] Bertsimas, D. and Popescu, I. (2005) Optimal Inequalities in Probability Theory: A Convex Optimization Approach. SIAM Journal on Optimization, 15, 780-804.
https://doi.org/10.1137/S1052623401399903
[2] Wiesemann, W., Kuhn, D. and Sim, M. (2014) Distributionally Robust Convex Optimization. Operations Research, 62, 1358-1376.
https://doi.org/10.1287/opre.2014.1314
[3] Delage, E. and Ye, Y. (2010) Distributionally Robust Optimization under Moment Uncertainty with Application to Data-Driven Problems. Operations Research, 58, 595-612.
https://doi.org/10.1287/opre.1090.0741
[4] 刘强. 分布鲁棒优化的模型与稳定性研究[D]: [博士学位论文]. 大连: 大连理工大学, 2018.
[5] Zhang, J., Xu, H. and Zhang, L. (2016) Quantitative Stability Analysis for Distribu-tionally Robust Optimization with Moment Constraints. SIAM Journal on Optimization, 26, 1855-1882.
https://doi.org/10.1137/15M1038529
[6] 石楠. 求解一类分布鲁棒优化问题的算法及应用[D]: [硕士学位论文]. 大连: 辽宁师范大学, 2019.
[7] Basciftci, B., Ahmed, S. and Shen, S. (2019) Distributionally Robust Facility Location Problem under Decision-Dependent Stochastic Demand. European Journal of Operational Research, 292, 548-561.
https://doi.org/10.1016/j.ejor.2020.11.002
[8] Doan, X.V. (2022) Distributionally Robust Optimization under Endogenous Uncertainty with an Application in Retrofitting Planning. European Journal of Operational Research, 300, 73-84.
https://doi.org/10.1016/j.ejor.2021.07.013
[9] Shapiro, A. (2001) On Duality Theory of Conic Linear Problems. In: Goberna, M.Á., López, M.A., Eds., Semi-Infinite Programming. Nonconvex Optimization and Its Applica-tions, vol 57. Springer, Boston.
https://doi.org/10.1007/978-1-4757-3403-4_7