一种解决半定规划问题的投影神经网络方法

doi:10.12677/csa.2025.1510263

期刊菜单

一种解决半定规划问题的投影神经网络方法
A Projection Neural Network Method for Solving Semidefinite Programming Problems

DOI: 10.12677/csa.2025.1510263, PDF, HTML, XML,
作者: 张柯冕, 张杰, 杨嘉妮：辽宁师范大学数学学院，辽宁大连
关键词: 半定规划；投影神经网络；平衡点；Semidefinite Programming； Projection Neural Network； Equilibrium Point

摘要: 本文研究了半定规划(SDP)问题的神经网络方法。首先提出了一种基于投影算子的神经网络方法，然后，建立了神经网络平衡点与半定规划问题最优解之间的等价性，并证明了平衡点具有Lyapunov稳定性。数值模拟进一步证明了该网络的有效性。通过利用投影映射和SDP问题的结构，该神经网络方法可以有效地解决优化任务，为解决各种半定规划问题提供了一个实用的计算框架。

Abstract: This paper studies the neural network method for semidefinite programming (SDP) problems. Firstly, a neural network method based on projection operator is proposed. Then, the equivalence between the equilibrium point of the neural network and the optimal solution of the semidefinite programming problem is established, and it is proved that the equilibrium point has Lyapunov stability. Numerical simulation further proves the effectiveness of the network. By using the structure of projection mapping and SDP problem, the neural network method can effectively solve the optimization task, and provides a practical computational framework for solving various semidefinite programming problems.

文章引用：张柯冕, 张杰, 杨嘉妮. 一种解决半定规划问题的投影神经网络方法[J]. 计算机科学与应用, 2025, 15(10): 232-239. https://doi.org/10.12677/csa.2025.1510263

1. 引言

近年来，由于半定规划(SDP)问题在工程和组合优化中的广泛应用，已引起了广泛关注。半定规划问题包含线性规划、最小–最大特征值问题、最大行列式问题以及对数切比雪夫逼近问题等多个重要优化问题作为特例[1]，这类问题在控制理论、图论、统计学、结构优化、组合优化以及其他学科领域频繁出现[2] [3]。

神经网络方法特别适用于实时优化问题，具备多项显著优势。其类似电路的结构易于通过模拟电路或专用硬件实现，支持低功耗、高并行运算，满足高实时性需求。通过设计能量函数，该方法将约束优化转化为动态系统平衡点求解，简化了传统内点法中复杂的障碍函数设计。此外，连续时间神经网络可直接借助动态系统理论和常微分方程数值方法有效求解约束优化问题，并具有快速收敛能力，适用于实时计算场景。

本文旨在提出一种新的基于投影算子的神经网络来解决半定规划问题。首先，我们回顾了半定规划问题和神经网络的定义。然后，构建了投影神经网络，分析了所提神经网络的平衡点和半定规划问题的解是等价的，并证明了平衡点是Lyapunov稳定的，最后通过数值实验展示了所提方法的有效性。

通过本文的研究，我们希望能够为解决半定规划问题的方法研究提供新的思路。

2. 预备知识

2.1. 半定规划问题

我们考虑半定规划问题[4]：

$\begin{array}{l} (P) min 〈 C, X 〉 \\ s .t . 〈 A_{i}, X 〉 = b_{i}, i = 1, 2, \dots, m, X \geq 0, \end{array}$ (1)

和其对偶问题：

$\begin{array}{l} (D) max b^{T} y \\ s .t . \sum_{i = 1}^{m} y_{i} A_{i} + S = C, S \geq 0, \end{array}$ (2)

其中， $C, A_{i}, X, S$ 是 $n$ 阶矩阵，并且 $X, S$ 是对称矩阵， $b, y \in R^{m}$ ， $〈 C, X 〉, 〈 A_{i}, X 〉$ 是矩阵的迹积， $\geq$ 表示半正定，也就是对于实对称矩阵 $A$ 和 $B$ ， $A \geq B$ 表示 $A - B$ 是半正定的。

半定规划问题和对偶半定规划问题的解满足最优性条件[5]：

${\begin{cases} 〈 A_{i}, X 〉 = b_{i}, i = 1, 2, \dots, m, X \geq 0, \\ \sum_{i = 1}^{m} y_{i} A_{i} + S = C, S \geq 0, \\ 〈 X, S 〉 = 0. \end{cases}$ (3)

令 $x = v e c (X)$ 并且定义 $u = {(x^{T}, y^{T})}^{T}$ 。如果 $X^{*}$ 和 $y^{*}$ 满足(3)中的最优性条件，那么称 $u^{*} = {(x^{*}^{T}, y^{*}^{T})}^{T}$ 是半定规划问题的一组解。

2.2. 一阶微分方程

一阶微分方程基本形式为

$\dot{y} (t) = ℱ (y (t)), y (t_{0}) = y_{0} \in ℝ^{n},$ (4)

这里 $ℱ : ℝ^{n} \to ℝ^{n}$ 是一个映射。

定义1. 若点 $y^{*} = y (t^{*})$ 满足 $ℱ (y^{*}) = 0$ ，则称 $y^{*}$ 为微分方程(4)的平衡点。若存在 $y^{*}$ 的一个领域 $Ω^{*} \subset ℝ^{n}$ ，使得 $ℱ (y^{*}) = 0$ ，且对所有 $y \in Ω^{*} \ {y^{*}}$ ，都有 $ℱ (y) \neq 0$ ，则称 $y^{*}$ 为孤立平衡点。

2.3. 投影算子

设 $P_{Ω} : ℝ^{n} \to Ω$ 是一个投影算子，定义为 $P_{Ω} (u) = \arg \min_{v \in Ω} ‖ u - v ‖$ 。若 $Ω = Ω_{1} \times ℝ^{m}$ ，其中 $\times$ 表示笛卡尔积， $Ω_{1} \in ℝ^{n^{2}}$ ，则对任意 $u = {(x^{T}, y^{T})}^{T} \in ℝ^{n^{2} + m}$ ，有 $P_{Ω} = (\begin{matrix} P_{Ω_{1}} (x) \\ y \end{matrix})$ 。

引理1. [6]对于任意的 $(A, B) \in S_{+}^{m} \times S_{+}^{m}$ ，其中 $S_{+}^{m}$ 为所有 $m \times m$ 实对称半正定矩阵的集合，我们有 $〈 A, B 〉 = 0$ 当且仅当 $A = P_{S_{+}^{m}} (A - B)$ 。

命题1. 设 $S_{+}^{n}$ 为所有 $n \times n$ 实对称半正定矩阵的集合，有以下等式成立：

$v e c (P_{S_{+}^{n}} (X)) = P_{v e c (S_{+}^{n})} (v e c (X))$

命题2. 如果 $Ω$ 是一个 $ℝ^{n}$ 上的闭凸子集，那么在闭凸集上的投影的一个基本性质是

${[u - P_{Ω} (u)]}^{T} [P_{Ω} (u) - v] \geq 0, \forall u \in ℝ^{n}, v \in Ω$ (5)

3. 投影神经网络

接下来，我们介绍所提出的投影神经网络模型

$\begin{array}{l} \frac{d u}{d t} = P_{Ω} [u - β (M u + q)] - u, \\ u (t_{0}) = u_{0}, β > 0, \end{array}$ (6)

其中 $Ω = v e c (S_{+}^{n}) \times ℝ^{m}$ ，

$M = (\begin{matrix} 0 & - {\bar{A}}^{T} \\ \bar{A} & 0 \end{matrix}), \bar{A} = {(a^{1}, a^{2}, \dots, a^{m})}^{T}, a^{i} = v e c (A_{i}), (i = 1, 2, \dots, m),$

$q = (\begin{matrix} c \\ - b \end{matrix}), c = v e c (C), u_{0} \in {u = {(x^{T}, y^{T})}^{T} \in ℝ^{n^{2} + m} | x \in v e c (S_{+}^{n}), y \in ℝ^{m}},$

$β$ 是尺度参数，用以表征神经网络的收敛速率。为了便于我们的分析：

定理1. 设 $u^{*} = {(x^{*}^{T}, y^{*}^{T})}^{T}$ 是神经网络(6)的一个平衡点，则 $u^{*}$ 满足半定规划问题的最优性条件(3)。反之，若 $X^{*} \in S_{+}^{n}$ 是半定规划问题(1)的一个最优解，则存在 $y^{*} \in ℝ^{m}$ ，使得 $u^{*} = {(v e c {(X^{*})}^{T}, y^{*}^{T})}^{T}$ 是神经网络(6)的一个平衡点。

证明：假设 $u^{*} = {(x^{*}^{T}, y^{*}^{T})}^{T}$ 是神经网络(6)的一个平衡点，那么 $P_{Ω} [u^{*} - β (M u^{*} + q)] - u^{*} = 0$ ，因此

$\begin{array}{l} u^{*} - P_{Ω} [u^{*} - β (M u^{*} + q)] \\ = (\begin{matrix} x^{*} \\ y^{*} \end{matrix}) - P_{Ω} [(\begin{matrix} x^{*} \\ y^{*} \end{matrix}) - β (\begin{matrix} \begin{array}{l} - v e c (\sum_{i = 1}^{m} y_{i}^{*} A_{i}) + c \\ 〈 A_{1}, X^{*} 〉 - b_{1} \\ ⋮ \end{array} \\ 〈 A_{m}, X^{*} 〉 - b_{m} \end{matrix})] \\ = (\begin{matrix} x^{*} \\ y^{*} \end{matrix}) - P_{Ω} [(\begin{matrix} \begin{array}{l} x^{*} - β (c - v e c (\sum_{i = 1}^{m} y_{i}^{*} A_{i})) \\ y_{1}^{*} - β (〈 A_{1}, X^{*} 〉 - b_{1}) \end{array} \\ \begin{array}{l} ⋮ \\ y_{m}^{*} - β (〈 A_{m}, X^{*} 〉 - b_{m}) \end{array} \end{matrix})] \\ = (\begin{matrix} x^{*} \\ y^{*} \end{matrix}) - (\begin{matrix} P_{v e c (S_{+}^{n})} [x^{*} - β (c - v e c (\sum_{i = 1}^{m} y_{i}^{*} A_{i}))] \\ \begin{array}{l} y_{1}^{*} - β (〈 A_{i}, X^{*} 〉 - b_{1}) \\ ⋮ \\ y_{m}^{*} - β (〈 A_{m}, X^{*} 〉 - b_{m}) \end{array} \end{matrix}) \end{array}$

根据命题1，得出

$P_{v e c (S_{+}^{n})} [x^{*} - β (c - v e c (\sum_{i = 1}^{m} y_{i}^{*} A_{i}))] = v e c [P_{S_{+}^{n}} [X^{*} - β (C - \sum_{i = 1}^{m} y_{i}^{*} A_{i})]]$

代入原式得

$\begin{array}{l} u^{*} - P_{Ω} [u^{*} - β (M u^{*} + q)] \\ = (\begin{matrix} x^{*} - v e c [P_{S_{+}^{n}} [X^{*} - β (C - \sum_{i = 1}^{m} y_{i}^{*} A_{i})]] \\ \begin{array}{l} β (〈 A_{i}, X^{*} 〉 - b_{1}) \\ ⋮ \\ β (〈 A_{m}, X^{*} 〉 - b_{m}) \end{array} \end{matrix}) \\ = 0 \end{array}$

我们有

${\begin{cases} X^{*} = P_{S_{+}^{n}} [X^{*} - β (C - \sum_{i = 1}^{m} y_{i}^{*} A_{i})] \\ 〈 A_{i}, X^{*} 〉 = b_{i}, i = 1, 2, 3, \dots, m . \end{cases}$

将 $A = X^{*}, B = β (C - \sum_{i = 1}^{m} y_{i}^{*} A_{i})$ 代入到引理1中，我们得到

${\begin{cases} 〈 A_{i}, X^{*} 〉 = b_{i}, i = 1, 2, 3, \dots, m, \\ C - \sum_{i = 1}^{m} y_{i}^{*} A_{i} \underline{≻} 0, X \underline{≻} 0, \\ 〈 X^{*}, C - \sum_{i = 1}^{m} y_{i}^{*} A_{i} 〉 = 0. \end{cases}$

这与(3)是等价的，即 $u^{*} = {(x^{*}^{T}, y^{*}^{T})}^{T}$ 满足半定规划问题的最优性条件。反之亦然。

证毕。

定理2. 神经网络(6)的平衡点 $u^{*} = {(x^{*}^{T}, y^{*}^{T})}^{T}$ 在Lyapunov意义上是稳定的。

证明：令 $u^{*} = {(x^{*}^{T}, y^{*}^{T})}^{T}$ 是神经网络(6)的一个平衡点，我们有

$u^{*} = P_{Ω} [u^{*} - β (M u^{*} + q)] - u^{*}$

考虑以下函数：

$V (u) = β {[F (u)]}^{T} [u - P_{Ω} [u - β F (u)]] - \frac{1}{2} {‖ u - P_{Ω} [u - β F (u)] ‖}^{2} + \frac{1}{2} {‖ u - u^{*} ‖}^{2}, u \in Ω$

这里 $F (u) = M u + q$ 。显然， $F (u)$ 是连续可微的，并且 $V (u^{*}) = 0$ 。

将 $Ω = v e c (S_{+}^{n}) \times ℝ^{m}$ (它是 $ℝ^{n^{2} + m}$ 的一个闭凸子集)、 $u - β F (u) \in ℝ^{n^{2} + m}$ 、 $u \in Ω$ 代入(5)，我们有

${[u - β F (u) - P_{Ω} [u - β F (u)]]}^{T} [P_{Ω} [u - β F (u)] - u] \geq 0,$

那么

$β {[F (u)]}^{T} [u - P_{Ω} [u - β F (u)]] \geq {‖ u - P_{Ω} [u - β F (u)] ‖}^{2} .$

因此

$V (u) \geq \frac{1}{2} {‖ u - P_{Ω} [u - β F (u)] ‖}^{2} + \frac{1}{2} {‖ u - u^{*} ‖}^{2} \geq 0, \forall u \in Ω,$

且显然有

$V (u) > 0, \forall u \in Ω, u \neq u^{*} .$

与文献[7]中定理3.2的证明类似，我们可知：

$\nabla V (u) = β F (u) + (β \nabla F (u) - I_{n}) [u - P_{Ω} [u - β F (u)]] + u - u^{*},$

其中， $I_{n}$ 是 $n$ 阶单位矩阵。因此，沿着神经网络(6)的轨迹 $u = u (t, u_{0}) (t \geq 0)$ ，我们有

$\begin{matrix} \frac{d V [u (t)]}{d t} = {[\nabla V (u)]}^{T} \frac{d u}{d t} \\ = - {[u - u^{*} + β F (u)]}^{T} [u - P_{Ω} [u - β F (u)]] + {‖ u - P_{Ω} [u - β F (u)] ‖}^{2} \\ - β {[u - P_{Ω} [u - β F (u)]]}^{T} \nabla F (u) [u - P_{Ω} [u - β F (u)]] . \end{matrix}$

因为 $F$ 是可微的，并且

$\nabla F (u) = M = (\begin{matrix} 0 & - {\bar{A}}^{T} \\ \bar{A} & 0 \end{matrix}),$

这是一个反对称矩阵，因此

$β {[u - P_{Ω} [u - β F (u)]]}^{T} \nabla F (u) [u - P_{Ω} [u - β F (u)]] = 0.$

将 $u - β F (u) \in R^{n^{2} + m}, u^{*} \in Ω$ 代入(3)中，我们得到

$\begin{array}{l} {[u - β F (u) - P_{Ω} [u - β F (u)]]}^{T} [P_{Ω} [u - β F (u)] - u^{*}] \\ = {[u - β F (u) - P_{Ω} [u - β F (u)]]}^{T} [P_{Ω} [u - β F (u)] - u + u - u^{*}] \\ = {[u - P_{Ω} [u - β F (u)]]}^{T} [β F (u) + u - u^{*}] - {‖ u - P_{Ω} [u - β F (u)] ‖}^{2} - β F {(u)}^{T} (u - u^{*}) \\ = {[β F (u) + u - u^{*}]}^{T} [u - P_{Ω} [u - β F (u)]] - {‖ u - P_{Ω} [u - β F (u)] ‖}^{2} - β {(u - u^{*})}^{T} F (u) \\ \geq 0. \end{array}$

这意味着，

${[β F (u) + u - u^{*}]}^{T} [u - P_{Ω} [u - β F (u)]] \geq {‖ u - P_{Ω} [u - β F (u)] ‖}^{2} + β {(u - u^{*})}^{T} F (u) .$

因此

$\frac{d V [u (t)]}{d t} \leq - β {(u - u^{*})}^{T} F (u) .$ (7)

对于任意的 $u \in Ω$ ，我们有

${(u - u^{*})}^{T} F (u) = {(u - u^{*})}^{T} [F (u) - F (u^{*})] + u^{T} F (u^{*}) - u^{*}^{T} F (u^{*}) .$

由神经网络(6)和最优性条件(3)，我们得到

$\begin{matrix} u^{*}^{T} F (u^{*}) = (x^{*}^{T}, y^{*}^{T}) (\begin{matrix} - v e c (\sum_{i = 1}^{m} y_{i}^{*} A_{i}) + c \\ 〈 A_{1}, X^{*} 〉 - b_{1} \\ ⋮ \\ 〈 A_{m}, X^{*} 〉 - b_{m} \end{matrix}) \\ = (x^{*}^{T}, y^{*}^{T}) (\begin{matrix} - v e c (\sum_{i = 1}^{m} y_{i}^{*} A_{i}) + c \\ 0 \\ ⋮ \\ 0 \end{matrix}) \\ = 〈 X^{*}, C - \sum_{i = 1}^{m} y_{i}^{*} A_{i} 〉 \\ = 0. \end{matrix}$

因此

$\begin{array}{l} {(u - u^{*})}^{T} F (u) \\ = {(u - u^{*})}^{T} [F (u) - F (u^{*})] + u^{T} F (u^{*}) \\ = {(u - u^{*})}^{T} M (u - u^{*}) + (x^{T}, y^{T}) (\begin{matrix} - v e c (\sum_{i = 1}^{m} y_{i}^{*} A_{i}) + c \\ 0 \\ ⋮ \\ 0 \end{matrix}) \\ = {(u - u^{*})}^{T} M (u - u^{*}) + 〈 X, C - \sum_{i = 1}^{m} y_{i}^{*} A_{i} 〉 . \end{array}$

上式结合反对称矩阵 $M, X \in S_{+}^{n}, C - \sum_{i = 1}^{m} y_{i}^{*} A_{i} \in S_{+}^{n}, β > 0$ 以及(7)，得到

$\frac{d V [u (t)]}{d t} \leq - β {(u - u^{*})}^{T} F (u) \leq - β 〈 X, C - \sum_{i = 1}^{m} y_{i}^{*} A_{i} 〉 \leq 0$

这意味着神经网络(6)的平衡点在Lyapunov意义上是稳定的。

证毕。

4. 数值实验

下面的例子是根据文献[8]，经过适当修改而改编的。

考虑半定规划问题(1)和其对偶问题(2)，令 $n = 3, m = 2$ ，

$A_{1} = (\begin{matrix} - 1 & 0 & 0 & 0 \\ 0 & - 2 & 0 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 4 \end{matrix}), A_{2} = (\begin{matrix} 3 & 0 & 0 & 0 \\ 0 & - 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & - 1 \end{matrix}),$

$b = (\begin{matrix} - 3 \\ 1 \end{matrix}), C = (\begin{matrix} 3 & 0 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 8 & 0 \\ 0 & 0 & 0 & 16 \end{matrix}) .$

实验在MATLAB R2022上进行，所使用的常微分方程求解器为ode45。图1展示了基于神经网络(6)的 $y (t)$ 的轨迹，参数取 $β = 100$ ，初始点取 $X_{0} = I_{4}$ 和 $y_{0} = (\begin{matrix} 1 \\ 1 \end{matrix})$ 。

Figure 1. $y (t)$ trajectory based on neural network (6)

图1. 基于神经网络(6)的 $y (t)$ 轨迹

5. 结论

本文提出了一种新的基于投影算子的神经网络来解决半定规划问题。

致谢

本人衷心感谢张杰老师在学术道路上的悉心指导。

参考文献

[1]	Vandenberghe, L. and Boyd, S. (1996) Semidefinite Programming. SIAM Review, 38, 49-95. [Google Scholar] [CrossRef]
[2]	Boyd, S., El Ghaoui, L., Feron, E. and Balakrishnan, V. (1994) Linear Matrix Inequalities in System and Control Theory. Society for Industrial and Applied Mathematics. [Google Scholar] [CrossRef]
[3]	Mohar, B. and Poljak, S. (1993) Eigenvalues in Combinatorial Optimization. In: Brualdi, R.A., Friedland, S. and Klee, V., Eds., Combinatorial and Graph-Theoretical Problems in Linear Algebra, Springer, 107-151. [Google Scholar] [CrossRef]
[4]	Alizadeh, F. (1995) Interior Point Methods in Semidefinite Programming with Applications to Combinatorial Optimization. SIAM Journal on Optimization, 5, 13-51. [Google Scholar] [CrossRef]
[5]	Bi, H., Zhao, X. and Ren, J. (2022) A New Projection Contraction Algorithm for Semidefinite Programming. Procedia Computer Science, 208, 627-634. [Google Scholar] [CrossRef]
[6]	Tseng, P. (1998) Merit Functions for Semi-Definite Complemetarity Problems. Mathematical Programming, 83, 159-185. [Google Scholar] [CrossRef]
[7]	Fukushima, M. (1992) Equivalent Differentiable Optimization Problems and Descent Methods for Asymmetric Variational Inequality Problems. Mathematical Programming, 53, 99-110. [Google Scholar] [CrossRef]
[8]	Bazaraa, M.S., Jarvis, J.J. and Sherali, H.D. (2011) Linear Programming and Network Flows. John Wiley & Sons.

为你推荐

友情链接