二阶锥规划基于SOC函数的新光滑牛顿算法

doi:10.12677/AAM.2019.84067

期刊菜单

二阶锥规划基于SOC函数的新光滑牛顿算法
A New Smoothing Newton Method for Se-cond-Order Cone Optimization Based on SOC Function

DOI: 10.12677/AAM.2019.84067, PDF, HTML, XML, 国家自然科学基金支持
作者: 梁晓娟, 曾友芳：广西大学数学与信息科学学院，广西南宁
关键词: 二阶锥规划；光滑牛顿法；全局收敛；局部二次收敛；Second-Order Cone Programming； Smoothing Newton Method； Global Convergence； Quadratical Convergence

摘要: 本文在向量值Fischer-Burmeister (FB)函数和向量值Natural-Residual (NR)函数的基础上，提出一种求解二阶锥规划(SOCP)问题的光滑函数。用一个带扰动的牛顿方程组去获得搜索方向，在适当假设下，分析了算法的全局收敛和局部收敛速度，给出了数值实验结果。

Abstract: Based on the Fischer-Burmeister function and the Natural-Residual function, a new smoothing Newton method is proposed for solving the second-order cone programming. This algorithm adopts a Newton equation with disturbance to gain the search direction. Under suitable assumptions, we prove that the proposed method is globally and locally quadratically convergent. Finally, some numerical results are given.

文章引用：梁晓娟, 曾友芳. 二阶锥规划基于SOC函数的新光滑牛顿算法[J]. 应用数学进展, 2019, 8(4): 602-612. https://doi.org/10.12677/AAM.2019.84067

1. 引言

本文主要考虑以下线性二阶锥规划问题：

$\begin{array}{l} \min \sum_{i}^{r} c_{i}^{T} x_{i} \\ s .t . \sum_{i}^{r} A_{i} x_{i} = b ， \\ x_{i} \underline{≻} {}_{K^{n_{i}}}0, i \in I = {1, 2, \dots, r} \end{array}$ (1.1)

其中， $b \in R^{m}, c_{i} \in R^{n_{i}}, A_{i} \in R^{m \times n_{i}_{,}}$ 是已知量， $x_{i} \underline{≻} {}_{K^{n_{i}}}0 (i \in I)$ 表示 $x_{i} \in K^{n_{i}}$ 是变量。 $K^{n_{i}}$ 是维数为 $n_{i}$ 的二阶锥，即

$K^{n_{i}} = {x_{i} = (x_{i 0}; {\bar{x}}_{i}) \in R^{n_{i}} | x_{i 0} \geq ‖ {\bar{x}}_{i} ‖},$

这里 $‖ . ‖$ 为向量的欧几里得范数。易知 $K^{n_{i}}$ 是自对偶的，即 $K^{n_{i}} = {(K^{n_{i}})}^{*} = {s_{i} \in R_{i}^{n} | x_{i}^{T} s_{i} \geq 0, \forall x_{i} \in K^{n_{i}}}$ 其对偶规划为：

$\begin{array}{l} \max b^{T} y \\ s .t . A_{i}^{T} y + s_{i} = c_{i}, i \in I, \\ s_{i} \underline{≻} {}_{K^{n_{i}}}0, i \in I . \end{array}$ (1.2)

其中 $y \in R^{m}, s_{i} \in K^{n_{i}}, I = {1, 2, \dots, r}$ 。为便于问题的描述，使用如下记号：

$\begin{array}{l} n ≜ \sum_{i = 1}^{r} n_{i}, K = K^{n_{i}} \times K^{n_{i}} \times \dots \times K^{n_{i}}, A = (A_{1}, A_{2}, \dots, A_{r}) \in R^{m \times n}, \\ c = (c_{1}, c_{2}, \dots, c_{r}) \in R^{n}, x = (x_{1}; x_{2}; \dots; x_{r}) \in K, s = (s_{1}; s_{2}; \dots; s_{r}) \in K . \end{array}$

这里用 $R^{n}$ 表示n维实列向量，且将 $R^{n_{1}} \times R^{n_{2}} \times \dots \times R^{n_{r}}$ 定义为 $R^{n_{1} + n_{2} + \dots + n_{r}}$ ，因此 $(x_{1}; x_{2}; \dots; x_{r}) \in K$ 是 $R^{n_{1} + n_{2} + \dots + n_{r}}$ 中的列向量。则上面(1.1)和(1.2)式可转化为如下简洁形式：

$\min {c^{T} x | A x = b, x \in K} .$ (1.3)

其对偶问题：

$\max {b^{T} y | A^{T} y + s = c, s \in K, y \in R^{m}} .$ (1.4)

二阶锥规划是一类非光滑凸规划问题，它是在仿射空间与有限个二阶锥的笛卡尔积的交集上极小化或极大化一个线性函数。在现实生活中有着广泛的应用：许多工程，力学，投资组合，线线阵列等都可以转化为二阶锥问题求解。此外，许多数学问题也可转化为二阶锥求解，如线性规划，二次规划，凸二次约束二次规划，范数极小化，因而研究二阶锥规划具有重要的理论与现实意义。本文在向量值FB函数和向量值NR函数的基础上进行改进，得到了一个新的光滑函数，利用得到的光滑函数，把二阶锥互补函数转化为一个非线性方程组问题，并给出求解二阶锥问题的一个光滑化算法，在无严格互补条件的假设下，证明算法全局收敛和局部二次收敛。

2. 基础知识

二阶锥规划建立在与二阶锥相伴的代数基础上，为了更好地研究二阶锥规划，下面将简要介绍与二阶锥相伴的欧几里得若当代数的基本概念和与之相关的重要结论，二阶锥规划的对偶理论和最优性条件等。先介绍一些记号，其中U表示反射矩阵， $E_{n - 1}$ 表示 $(n - 1)$ 阶单位阵， $A r w (x)$ 表示一个箭形矩阵，本文用相应的大写字母表示箭形矩阵， $X = A r w (x)$ ， $S = A r w (s)$ ， $W = A r w (w)$ 。

$U ≜ (\begin{matrix} 1 & 0^{T} \\ 0 & - E_{n - 1} \end{matrix}) \in R^{n \times n}, A r w (x) ≜ (\begin{matrix} x_{1} & {\bar{x}}_{}^{T} \\ \bar{x} & x_{0} E_{n - 1} \end{matrix}), e ≜ (1; 0) \in R^{n} .$

对于 $\forall x = (x_{0}; \bar{x}) \in R \times R^{n - 1}, s = (s_{0}; \bar{s}) \in R \times R^{n - 1}$ ，定义如下若当积：

$x \circ s ≜ (\begin{matrix} x^{T} s \\ x_{0} \bar{s} + s_{0} \bar{x} \end{matrix}) = A r w (x) s = A r w (x) A r w (s) e = X S e .$

记 $x^{2} ≜ x \circ x$ ， $x + y$ 表示通常的向量的向量加法。

定理2.1：(谱分解定理) (文 [1] )

对向量x定义与二阶锥有关的谱分解为： $x = λ_{1} c_{1} + λ_{2} c_{2}$ ，其中x的谱值 $λ_{i}$ 和与之对应的谱向量 $c_{i}$ 如下：

$\begin{array}{l} λ_{i} = x_{0} + {(- 1)}^{i + 1} ‖ \bar{x} ‖, i = 1, 2. \\ c_{i} = {\begin{cases} \frac{1}{2} (1; {(- 1)}^{i + 1} \frac{\bar{x}}{‖ \bar{x} ‖}), \bar{x} \neq 0; \\ \frac{1}{2} (1; {(- 1)}^{i + 1} ω), \bar{x} = 0; \end{cases} i = 1, 2 \end{array}$ 。 $ω \in R^{n - 1}$ 是满足 $‖ ω ‖ = 1$ 的任意向量。

关于谱值，谱向量的相关性质归纳如下：

1) $x \in K \Leftrightarrow λ_{2} \geq λ_{1} \geq 0, x \in K^{0} \Leftrightarrow λ_{2} \geq λ_{1} > 0$ ，

2) 对任意的 $x \in R^{n}$ ， $x^{2} = λ_{1}^{2} c_{1} + λ_{2}^{2} c_{2} \in K$ ，

3) 对任意的 $x \in K$ ， $\sqrt{x} = \sqrt{λ_{1}} c_{1} + \sqrt{λ_{2}} c_{2} \in K$ 。

在线性规划中，互补性条件为：若 $x \geq 0, s \geq 0$ ，则 $x^{T} s = 0$ 当且仅当 $x_{i} s_{i} = 0, i = 1, \dots, r$ ，二阶锥规划有着类似于线性规划的互补性条件。

引理2.1：(互补性条件)设 $x, s \in K$ ，即 $x_{i}, s_{i} \in K_{i}, i = 1, \dots, r$ ，则 $x^{T} s = 0$ 当且仅当 $x_{i} \circ s_{i} = 0$ 。

在线性规划中，若原问题与对偶问题任意一个存在最优解，则另一个也存在最优解，且原问题与对偶问题最优值相等，但二阶锥规划不具有这种性质，若要二阶锥规划的强对偶理论成立，必须使得原问题与对偶问题同时存在严格可行解。因此二阶锥规划的最优性条件为：

定理2.2：(最优性条件) (文 [2] )如果(1.3)和(1.4)都有严格可行解，则 $(x, (y, s))$ 是(1.3)和(1.4)的最优解对当且仅当

${\begin{cases} A x = b, x \in K, \\ A^{T} y + s = c, s \in K, \\ x \circ s = 0 . \end{cases}$ (2.1)

对二阶锥规划，其二阶锥互补函数定义如下：

定义2.1：(文 [3] )如果向量值函数 $ϕ^{soc} : R^{n} \times R^{n} \to R^{n}$ 满足

$ϕ^{soc} (x, s) = 0 \Leftrightarrow x \circ s = 0, x \in K, s \in K .$ (2.2)

则称 $ϕ^{soc}$ 为二阶锥互补函数。

结合问题(1.3)和(1.4)的最优性条件，定义函数 $H (x, y, s) : R^{n + m + n} \to R^{m + n + n}$ 如下：

$H (x, y, s) = (\begin{matrix} b - A x \\ c - A^{T} y - s \\ ϕ^{soc} (x - s) \end{matrix}) ，$ (2.3)

其中 $ϕ^{soc} (x - s)$ 是任意的二阶锥互补函数。易见 $H (x, y, s) = 0$ 是与最优性条件等价的方程组，由此可知， $H (x, y, s) = 0$ 的解 $(x^{*}, y^{*}, s^{*})$ 满足最优性条件，是问题(1.3)和(1.4)的最优解对。由上易知，求解此方程组的关键在于构造合适的二阶锥互补函数。由于常见的二阶锥互补函数在(0,0) 点不可微(即非光滑)，例如向量值FB函数，向量值NR函数等，不能直接用牛顿法求解为了进一步研究，先给出光滑化的概念。

定义2.2：(文 [4] )对于不可微函数 $h : R^{n} \to R^{m}$ ，考虑带有参数 $μ > 0$ 的函数 $h_{μ} : R^{n} \to R^{m}$ ，如果它具备如下性质：

1) 对于任意的 $μ > 0$ ， $h_{μ}$ 是光滑的；

2) $\lim_{μ \to 0} h_{μ} (x) = h (x), \forall x \in R^{n}$ ，

则称 $h_{μ}$ 是h的光滑函数。

3. 一个新的光滑函数及其性质

光滑函数在二阶锥规划光滑算法研究中起着重要作用(文 [5] [6] [7] [8] [9] )。由于向量值FB函数和向量值NR函数并不处处连续可微，大大影响了其实际应用。本文通过光滑化对称扰动得到一个新的向量值函数 $ϕ (μ, x, s) : R_{+} \times R^{n} \times R^{n} \to R^{n}$ ：

$ϕ (μ, x, s) = x + s - \sqrt{μ {(x - s)}^{2} + (1 - μ) (x^{2} + s^{2}) + 2 μ^{2} e}$ (3.1)

为了减少变量的个数，使证明简单，令 $z = (μ, x, y)$ ，定义函数 $H (z)$ 如下：

$H (z) = (\begin{matrix} e^{μ} - 1 \\ b - A x \\ ϕ (μ, x, c - A^{T} y) \end{matrix}) ，$ (3.2)

显然，若 $(0, x^{*}, y^{*})$ 是 $H (z) = 0$ 的解，则 $(x^{*}, y^{*}, c - A^{T} y^{*})$ 是原问题(1.3)及其对偶问题(1.4)的最优解。因此，可考虑用牛顿法求解 $H (z) = 0$ ，但对于所构造的 $H (z)$ ，其雅可比矩阵必须是非奇异的。在讨论 $H (z)$ 的性质之前先介绍相关结论。

引理3.1：(文 [3] )对于任意的 $a^{1}, \dots, a^{p} \in R^{n}$ ，令 $χ (a^{1}, \dots, a^{p}) = \sqrt{\sum_{i = 1}^{p} {(a^{i})}^{2}}$ 。则 $χ$ 是全局利普希茨连续的；若 $v_{0} \neq ‖ \bar{v} ‖$ ，其中 $v = (v_{0}; \bar{v}) \in R \times R^{n - 1}$ 且 $v = \sum_{i = 1}^{p} {(a^{i})}^{2}$ ，则 $χ$ 在 $(a^{1}, \dots, a^{p})$ 的任意邻域是连续可微的。

定理3.1：设函数 $H (z)$ 由(3.2)定义，令 $ω = \sqrt{μ {(x - s)}^{2} + (1 - μ) (x^{2} + s^{2}) + 2 μ^{2} e}, μ \in (0, 1)$ ，则对任意的 $ϕ (μ, x, s) \in R_{+} \times R^{n} \times R^{n}$ ，有以下结论：

1) $ϕ (μ, x, s)$ 是全局利普希茨连续的处处光滑函数，且在任意 $(μ, x, s)$ 处连续可微，有

${ϕ^{'}}_{μ} (μ, x, s) = - W^{- 1} (x \circ s + 2 μ e),$ (3.3)

${ϕ^{'}}_{x} (μ, x, s) = E_{n} - W^{- 1} (X - μ S),$ (3.4)

${ϕ^{'}}_{s} (μ, x, s) = E_{n} - W^{- 1} (S - μ X) .$ (3.5)

2) $ϕ (μ, x, s)$ 在 $μ = 0$ 处是光滑的。

证明：1) 由引理3.1可知 $ϕ (μ, x, s)$ 是全局利普希茨连续且在任意 $(μ, x, s)$ 处连续可微。由 ${ω^{'}}_{μ} (μ, x, s) = W^{- 1} (x \circ s + 2 μ e)$ ，知

${ϕ^{'}}_{μ} (μ, x, s) = - W^{- 1} (x \circ s + 2 μ e),$ (3.6)

同理可得：

$\begin{array}{l} {ω^{'}}_{x} (μ, x, s) = W^{- 1} (X - μ S), \\ {ω^{'}}_{s} = W^{- 1} (S - μ X) . \end{array}$

由此可得：

${ϕ^{'}}_{x} (μ, x, s) = E_{n} - W^{- 1} (X - μ S),$ (3.7)

${ϕ^{'}}_{s} (μ, x, s) = E_{n} - W^{- 1} (S - μ X) .$ (3.8)

2) 对于任意的 $x = (x_{0}; \bar{x}), s = (s_{0}; \bar{s}) \in R \times R^{n - 1}$ ，由谱分解定理有

$ω^{2} = λ_{1} (μ) u_{1} (μ) + λ_{2} (μ) u_{2} (μ),$

因此

$ϕ (μ, x, s) = x + s - (\sqrt{λ_{1} (μ)} u_{1} (μ) + \sqrt{λ_{2} (μ)} u_{2} (μ)),$

其中

$λ_{i} (μ) = μ {(x - s)}^{2} + (1 - μ) (x^{2} + s^{2}) + 2 μ^{2} + 2 {(- 1)}^{i + 1} ‖ v (μ) ‖, i = 1, 2.$

$u_{i} (μ) = {\begin{cases} \frac{1}{2} (1; {(- 1)}^{i + 1} \frac{v (μ)}{‖ v (μ) ‖}), v (μ) \neq 0; \\ \frac{1}{2} (1; {(- 1)}^{i + 1} w), v (μ) = 0 . \end{cases} i = 1, 2.$

其中 $v (μ) = μ (x_{0} - s_{0}) (\bar{x} - \bar{s}) + (1 - μ) (x_{0} \bar{x} + s_{0} \bar{s})$ ， $ω \in R^{n - 1}$ 是满足 $‖ ω ‖ = 1$ 的任意向量。同理有 $ϕ (0, x, s) = x + s - (\sqrt{λ_{1}} u_{1} + \sqrt{λ_{2}} u_{2})$ ，其中 $λ_{i} = {‖ x ‖}^{2} + {‖ s ‖}^{2} + 2 {(- 1)}^{i + 1} ‖ v ‖, i = 1, 2$ 。

$u_{i} = {\begin{cases} \frac{1}{2} (1; {(- 1)}^{i + 1} \frac{v}{‖ v ‖}), v \neq 0; \\ \frac{1}{2} (1; {(- 1)}^{i + 1} w), v = 0 . \end{cases} i = 1, 2.$

其中 $v = x_{0} s_{0} + \bar{x} \bar{s}$ ， $ω \in R^{n - 1}$ 是满足 $‖ ω ‖ = 1$ 的任意向量。

不失一般性，取 $ω \in R^{n - 1}$ 和 $v (μ)$ 中的一致，显然 $\lim_{μ \to 0} v (μ) = v$ ，于是 $\lim_{μ \to 0} λ_{i} (μ) = λ_{i}, \lim_{μ \to 0} u_{i} (μ) = u_{i}$ ，因此 $\lim_{μ \to 0} ϕ (μ, x, s) = ϕ (0, x, s)$ ，结合 $ϕ (μ, x, s)$ 在任意 $(μ, x, s)$ 处连续可微，知 $ϕ (μ, x, s)$ 是光滑的，因此由光滑函数的定义知 $ϕ (μ, x, s)$ 是 $ϕ (0, x, s)$ 的一个光滑函数。

4. 算法的描述

记 $z (μ, x, y) : R_{+} \times R^{n} \times R^{n}, θ (z) = {‖ H (z) ‖}^{2}, η = \sqrt{θ (z)} + 1$ ，令 $γ \in (0, 1)$ ，当 $H (z) \neq 0$ 时，定义函数 $β, \bar{β} : R^{n + m + 1} \to R_{+} : β (z) = e^{μ} γ \min {1, θ (z)}, \bar{β} (z) = γ \min {1, θ (z)}$ 。在矩阵A行满秩的假设下，可证明算法是适定的。

算法4.1：(二阶锥规划的一个光滑型牛顿法)

步骤0：给出常数 $δ, σ, μ_{0} \in (0, 1), γ \in (0, 1)$ 满足 $γ μ_{0} < \frac{1}{2}, γ η < \frac{1}{2}$ ，任取 $(x^{0}, y^{0}) \in R^{n} \times R^{m}$ ， $z^{0} = (μ_{0}, x^{0}, y^{0}), \bar{z} = (μ_{0}, 0, 0)$ ，令 $k : = 0$ 。

步骤1：若 $H (z^{k}) = 0$ ，停止，其中 $ϕ (z^{k})$ 及 $H (z^{k})$ 分别由(2.5)和(2.6)式所定义，否则令 $β_{k} : = β (z^{k})$ 。

步骤2：(确定搜索方向)解线性方程组 $H (z^{k}) + H^{'} (z^{k}) Δ z^{k} = β_{k} \bar{z}$ 得到搜索方向 $Δ z^{k}$ 。

步骤3：(确定步长)记 $α_{k}$ 是满足下式的最小非负整数 $α$ ：

$θ (z^{k} + δ^{α} Δ z^{k}) \leq [1 - σ (1 - 2 γ μ_{0} η) δ^{α}] θ (z^{k}),$

令步长 $t_{k} = δ^{α_{k}}$ 。

步骤4：令 $z^{k + 1} = z^{k} + t_{k} Δ z^{k}, k : = k + 1$ ，返回步骤1。

在证明算法的适定性之前，先介绍相关性质。

引理4.1：(文 [10] ) 对任意 $μ > 0$ ，

$- μ \leq \frac{1 - e^{μ}}{e^{μ}} \leq - μ e^{- μ} .$ (4.1)

引理4.2：(文 [11] )对于任意的 $x, y \in R$ 和 $ω ≻ {}_{K^{n}}0$ ，如果 $ω^{2} ≻ {}_{K^{n}}x^{2} + y^{2}$ ，则

$[A r w (ω) - A r w (x)] [A r w (ω) - A r w (y)] ≻ 0$ ， $A r w (ω) - A r w (x) ≻ 0$ ， $A r w (ω) - A r w (y) ≻ 0$ ，且当 $≻$ 变为 $\underline{≻}$ 时，上述结论仍然成立。

定理4.1：令 $z = (μ, x, y) \in R_{+} \times R^{n} \times R^{m}$ ， $H (z) : R^{1 + n + m} \to R^{1 + m + n}$ 由(3.2)定义，则有以下结论成立：

1) 在任意点 $z = (μ, x, y)$ 处， $H (z)$ 全局利普希茨连续，并且连续可微，其雅克比矩阵表示为：

$H^{'} (z) = (\begin{matrix} e^{μ} & 0 & 0 \\ 0 & - A & 0 \\ {ϕ^{'}}_{μ} (z) & {ϕ^{'}}_{x} (z) & - {ϕ^{'}}_{s} (z) A^{T} \end{matrix}),$ (4.2)

2) 对任意的 $μ > 0$ ， $H^{'} (z)$ 非奇异。

证明：由定理3.1知(1)成立。下证(2)成立，对任意给定的 $μ > 0$ ，要证 $H^{'} (z)$ 非奇异，只需证明方程组 $H^{'} (z) Δ z = 0$ 只有零解，即 $Δ z = (Δ μ, Δ x, Δ y) = 0$ 。将(4.2)式代入 $H^{'} (z) Δ z = 0$ 中可知

$Δ μ = 0, A Δ x = 0, {ϕ^{'}}_{x} (z) Δ x - {ϕ^{'}}_{s} (z) A^{T} Δ y = 0$ (4.3)

将(3.7)，(3.8)式中的 ${ϕ^{'}}_{x} (z)$ ， ${ϕ^{'}}_{x} (z)$ 代入(4.3)式并将等式左右的两端同时左乘以W，得：

$[W - (X - μ S) Δ x] - [W - (S - μ X)] A^{T} Δ y = 0.$ (4.4)

因 $w^{2} - μ {(x - s)}^{2} - (1 - μ) (x^{2} + s^{2}) = 2 μ^{2} e \in K^{0}$ ，由引理4.2可知：矩阵 $W - (S - μ X)$ 正定，从而 $W - (S - μ X)$ 可逆。将方程(4.4)左乘 $Δ x^{T} {[W - (S - μ X)]}^{- 1}$ ，结合 $A Δ x = 0$ ，得： $Δ x^{T} {[W - (S - μ X)]}^{- 1} [W - (X - μ S)] Δ x - Δ x^{T} {[W - (S - μ X)]}^{- 1} [W - (S - μ X)] A^{T} Δ y = 0 .$ 令 $Δ \tilde{x} {[W - (S - μ X)]}^{- 1} Δ x ，$ 则

$Δ {\tilde{x}}^{T} [W - (X - μ S)] [W - (S - μ X)] Δ \tilde{x} = 0 .$ (4.5)

由引理4.2可知矩阵 $[W - (X - μ S)] [W - (S - μ X)]$ 正定。因此 $Δ \tilde{x} = 0$ ，进而 $Δ x = 0$ 。结合矩阵A行满秩的假设和(4.4)式，知 $Δ y = 0$ 。这就说明 $H^{'} (z) Δ z = 0$ 只有零解，故 $H^{'} (z)$ 非奇异。

定理4.2：设矩阵A行满秩，如果 $μ_{k} > 0$ ，则算法4.1是适定的。

证明：因为矩阵A行满秩且 $μ_{k} > 0$ ，由定理4.1知 $H^{'} (z)$ 非奇异，所以算法4.1的步骤2是适定的。令 $Δ z^{k} = (Δ μ_{k}, Δ x^{k}, Δ y^{k}) \in R \times R^{n} \times R^{m}$ 是步骤2中方程组的解，则对任意的 $t \in (0, 1]$ ，有

$μ_{k + 1} = μ_{k} + t Δ μ_{k} = μ_{k} + t (\frac{1 - e^{μ_{k}}}{e^{μ_{k}}} + \frac{β_{k} μ_{0}}{e^{μ_{k}}}) \geq (1 - t) μ_{k} + t μ_{0} \frac{β_{k}}{e^{μ_{k}}} > 0.$ (4.6)

由 $β (z)$ 的定义有 $β (z) \leq e^{μ} γ \sqrt{θ (z)}$ ，

$\begin{matrix} e^{μ_{k} + t Δ μ_{k}} - 1 = e^{μ_{k}} e^{t Δ μ_{k}} - 1 \\ = e^{μ_{k}} (1 + t Δ μ_{k} + O (t^{2})) - 1 \\ = e^{μ_{k}} - 1 + t (1 - e^{μ_{k}}) + t β_{k} μ_{0} + O (t^{2}) \\ = (1 - t) (e^{μ_{k}} - 1) + t β_{k} μ_{0} + O (t2) \end{matrix}$

从而

$\begin{matrix} {(e^{μ_{k} + t Δ μ_{k}} - 1)}^{2} = {(1 - t)}^{2} {(e^{μ_{k}} - 1)}^{2} + 2 t (1 - t) β_{k} (e^{μ_{k}} - 1) μ_{0} + t^{2} β_{k} μ_{0} + O (t^{2}) \\ \leq (1 - 2 t)) {(e^{μ_{k}} - 1)}^{2} + 2 t e^{μ_{k}} γ \sqrt{θ (z^{k})} (e^{μ_{k}} - 1) μ_{0} + O (t^{2}) \\ \leq (1 - 2 t) {(e^{μ_{k}} - 1)}^{2} + 2 t γ μ_{0} η θ (z^{k}) . \end{matrix}$

在上述最后一个不等式利用 $e^{μ_{k}} - 1 \leq \sqrt{θ (z^{k})}, e^{μ_{k}} \leq η$ 可得。

令 $φ (z^{k}) = (\begin{array}{l} b - A x^{k} \\ ϕ (z^{k}) \end{array}),$ 并记 $Φ (z^{k}) = {‖ ϕ (z^{k}) ‖}^{2},$ 可得 ${(Φ^{'} (z^{k}))}^{T} Δ z^{k} = - 2 {‖ ϕ (z^{k}) ‖}^{2} = - 2 Φ (z^{k})$ ，

从而

$\begin{matrix} Φ (z^{k} + t Δ z^{k}) = Φ (z^{k}) + t {(Φ^{'} (z^{k}))}^{T} Δ z^{k} + ο (t) \\ = Φ (z^{k}) - 2 t Φ (z^{k}) + ο (t) \\ = (1 - 2 t) Φ (z^{k}) + ο (t) . \end{matrix}$

因此

$\begin{matrix} θ (z^{k} + t Δ z^{k}) = {‖ H (z^{k} + t Δ z^{k}) ‖}^{2} \\ \leq (1 - 2 t) {(e^{μ_{k}} - 1)}^{2} + 2 t γ μ_{0} η θ (z^{k}) + (1 - 2 t) Φ (z^{k}) + ο (t) \\ \leq (1 - 2 t) θ (z^{k}) + 2 t γ μ_{0} η θ (z^{k}) + ο (t) \\ \leq [1 - (1 - 2 γ μ_{0} η) t] θ (z^{k}) + ο (t) . \end{matrix}$

因为 $γ μ_{0} η < 1$ ，所以存在一个常数 $\bar{t} \in (0, 1]$ ，使得对任意的 $t \in (0, \bar{t}]$ ，有

$θ (z^{k} + t Δ z^{k}) \leq [1 - σ (1 - 2 γ μ_{0} η) t] θ (z^{k}),$ (4.7)

即步骤3可在有限步终止，故步骤3是适定的。综上可知，算法4.1是适定的。

5. 收敛性分析

定理5.1：1) 设矩阵A行满秩且 ${z^{k} : = (μ_{k}, x^{k}, y^{k})}$ 是算法4.1生成的无穷迭代点列，则对 $\forall k \geq 0$ ，若 $μ_{k} > 0, z^{k} \in Λ, θ (z^{k}) \leq θ (z^{0})$ ，则 $z^{k + 1} \in Λ$ ，其中

$Λ : = {z : = (μ, x, y) \in R_{+} \times R^{n} \times R^{m} | μ \geq β (z) μ_{0}},$ (5.1)

2) (全局收敛性) ${z^{k}}$ 的任意聚点 $z^{*} = (μ^{*}, x^{*}, y^{*})$ 都是 $H (z^{k}) = 0$ 的解。

证明：1) 根据 $β (z)$ 的定义分两种情况讨论：

i) 若 $θ (z^{k}) \leq 1$ ，则 $β_{k} = γ e^{μ_{k}} ‖ θ (z^{k}) ‖$ 。对任意的 $t \in (0, 1]$ ，从(4.7)式知

$θ (z^{k} + t Δ z^{k}) \leq [1 - σ (1 - 2 γ μ_{0} η) t] θ (z^{k})$ ，故 $\bar{β} (z^{k} + t Δ z_{k}) = γ θ (z^{k} + t Δ z_{k}) .$ 。由于 $z^{k} \in Λ$ ，可得

$\begin{array}{l} μ_{k} + t Δ μ_{k} - \bar{β} (z^{k} + t Δ z^{k}) μ_{0} \\ \geq (1 - t) μ_{k} + t γ μ_{0} θ (z^{k}) - \bar{β} (z^{k} + t Δ z^{k}) μ_{0} \\ \geq (1 - t) {\bar{β}}_{k} μ_{0} + t γ μ_{0} θ (z^{k}) - γ θ (z^{k} + t Δ z^{k}) μ_{0} \\ \geq (1 - t) γ θ (z^{k}) μ_{0} + t γ μ_{0} θ (z^{k}) - γ [1 - σ (1 - 2 γ μ_{0} η) t] θ (z^{k}) μ_{0} \\ = 2 γ σ (1 - γ μ_{0} η) t θ (z^{k}) μ_{0} \geq 0. \end{array}$

ii) 若 $θ (z^{k}) > 1$ ，则 $β_{k} = γ e^{μ_{k}}, {\bar{β}}_{k} : = \bar{β} (z^{k}) = γ$ 。对任意的 $z \in R^{2 n + 1}$ ，有 $\bar{β} (z) \leq γ$ ，从而对任意的 $t \in (0, 1]$ ，有

$\begin{array}{l} μ_{k} + t Δ μ_{k} - \bar{β} (z^{k} + t Δ z^{k}) μ_{0} \\ = μ_{k} + t (\frac{1 - e^{μ_{k}}}{e^{μ_{k}}} + \frac{β_{k} μ_{0}}{e^{μ_{k}}}) - \bar{β} {(z^{k} + t Δ z)}^{k} μ_{0} \\ \geq (1 - t) μ_{k} + t γ μ_{0} - γ μ_{0} \geq (1 - t) {\bar{β}}_{k} μ_{0} + t γ μ_{0} - γ μ_{0} \\ = (1 - t) γ μ_{0} + t γ μ_{0} - γ μ_{0} = 0. \end{array}$

从而 $z^{k + 1} \in Λ$ 。

2) 不失一般性，设 $z^{*}$ 是点列 ${z^{k}}$ 的任意聚点，要证 $H (z^{*}) = 0$ ，用反证法。假设 $‖ H (z^{*}) ‖ > 0$ ，由算法4.1的步骤3知 ${‖ H (z^{k}) ‖}$ 单调下降且有界，结合 $H (z^{k})$ 的连续性，有 $\lim_{k \to + \infty} ‖ H (z^{k}) ‖ = ‖ H (z^{*}) ‖$ 。由 $β (\cdot)$ 的定义知 $β (z^{k})$ 单调下降且趋于 $β (z^{*}) : β_{*} = β (z^{*}) = e^{μ_{*}} γ \min {1, θ (z^{*})} > 0$ 。另外，由(5.1)和(4.6)式得到：

$\begin{matrix} 0 < μ_{k + 1} = μ_{k} + t Δ μ_{k} \\ = μ_{k} + t (\frac{1 - e^{μ_{k}}}{e^{μ_{k}}} + \frac{β_{k} μ_{0}}{e^{μ_{k}}}) \\ \leq μ_{k} + t (- μ_{k} e^{μ_{k}} + \frac{e^{μ_{k}} {\bar{β}}_{k} μ_{0}}{e^{μ_{k}}}) \\ \leq μ_{k} + t (- μ_{k} e^{μ_{k}} + μ_{k}) \leq μ_{k} . \end{matrix}$

即 $μ_{k}$ 是单调下降的，则 $\lim_{k \to + \infty} μ_{k} = μ_{*}$ 。对 $μ_{k} \geq β_{k} μ_{0}$ 两边取极限，有 $μ_{*} \geq β_{*} μ_{0} > 0$ 。由定理4.1知 $H^{'} (z^{*})$ 存在且非奇异。由引理4.1知：存在 $z^{*}$ 的一个闭邻域 $N (z^{*})$ 和正数 $\bar{t} \in (0, 1]$ ，使得对于任意的 $z = (μ, x, y) \in N (z^{*})$ 和所有的 $t \in [0, \bar{t}]$ ，都有 $μ > 0$ ， $H^{'} (z)$ 非奇异且

$θ (z^{k} + t Δ z^{k}) \leq [1 - σ (1 - 2 γ μ_{0} η) t] θ (z^{k}) .$

可以找到一个非负整数 $τ$ ，使得 $δ^{τ} \in [0, \bar{t}]$ ，当k充分大时，有

$θ (z^{k + 1}) \leq [1 - σ (1 - 2 γ μ_{0} η) t] θ (z^{k}) .$

由步骤3知，对于充分大的k，步长 $t_{k} = δ^{α_{k}} \geq δ^{τ}$ ，因此有

$θ (z^{k + 1}) \leq [1 - σ (1 - 2 γ μ_{0} η) t_{k}] θ (z^{k}) \leq [1 - σ (1 - 2 γ μ_{0} η) δ^{τ}] θ (z^{k}) .$

这与序列 ${θ (z^{k})}$ 的极限 $θ (z^{*}) > 0$ 矛盾，故 $θ (z^{*}) = 0$ ，即 $H (z^{*}) = 0$ ，因此算法4.1是全局收敛的。

接下来证明算法的一个局部收敛性，在证明之前先介绍相关引理。

引理5.1 (文 [12] )：如果 $V \in \partial F (z^{*})$ 都是非奇异的，那么存在 $z^{*}$ 的一个邻域 $N (z^{*})$ 和一个常数 $C > 0$ ，使得对于任意的 $z^{k} \in N z^{*}$ 和任意的 $V \in \partial F (z^{k})$ 。V非奇异且 $‖ V^{- 1} ‖ \leq C$ 。

定理5.2 (局部二次收敛)：设矩阵A行满秩且 $z^{*}$ 是算法4.1产生的迭代点列 ${z^{k}}$ 的任意聚点，则当k充分大时， ${z^{k}}$ 二阶收敛到 $z^{*}$ ，即 $‖ z^{k + 1} - z^{*} ‖ = O ({‖ z^{k} - z^{*} ‖}^{2})$ ，且 $μ_{k + 1} = O (μ_{k}^{2})$ 。

证明：由定理5.1的(2)知 $H (z^{*}) = 0$ ，又由定理4.1知 $H^{'} (z^{*})$ 存在且非奇异。故由引理5.1知，存在一个常数 $C > 0$ ，对于充分接近 $z^{*}$ 的所有点 $z^{k}$ ，有 $‖ {(H^{'} (z^{k}))}^{- 1} ‖ \leq C$ 。由定理3.1和定理4.1知 $H (z)$ 在 $z^{k}$ 处是全局利普希茨连续的强半光滑函数，因为 $H (x + Δ x) - H (x) - V (Δ x) = O ({‖ Δ x ‖}^{1 + p})$ ，当 $z^{k}$ 充分接近 $z^{*}$ 时，由半光滑函数的定义知，当 $z^{k}$ 充分接近点 $z^{*}$ 时，有

$‖ H (z^{k}) ‖ = ‖ H (z^{k}) - H (z^{*}) ‖ = O (‖ z^{k} - z^{*} ‖)$

和

$H (z^{*}) - H (z^{k}) - H^{'} (z^{k}) (z^{*} - z^{k}) = O ({‖ z^{k} - z^{*} ‖}^{2}) .$

又 $β_{k} = e^{μ_{k}} γ \min {1, {‖ H (z^{k}) ‖}^{2}} \leq {‖ H (z^{k}) ‖}^{2}$ ，即 $β_{k} = O ({‖ H (z^{k}) ‖}^{2}) = O ({‖ z^{k} - z^{*} ‖}^{2})$ 。因此，

$\begin{matrix} ‖ z^{k} + Δ z^{k} - z^{*} ‖ = ‖ z^{k} + {(H^{'} (z^{k}))}^{- 1} (β_{k} \bar{z} - H (z^{k})) - z^{*} ‖ \\ = ‖ {(H^{'} (z^{k}))}^{- 1} [H^{'} (z^{k}) (z^{k} - z^{*}) + β_{k} \bar{z} - H (z^{k})] ‖ \\ \leq ‖ {(H^{'} (z^{k}))}^{- 1} ‖ ‖ H (z^{*}) - H (z^{k}) - H^{'} (z^{k}) (z^{*} - z^{k}) + β_{k} \bar{z} ‖ \\ \leq C [‖ H (z^{*}) - H (z^{k}) - H^{'} (z^{k}) (z^{*} - z^{k}) ‖ + β_{k} μ_{0}] \\ = O ({‖ z^{k} - z^{*} ‖}^{2}) . \end{matrix}$ (5.2)

进一步有

$‖ H (z^{k} + Δ z^{k}) ‖ = O (‖ z^{k} + Δ z^{k} - z^{*} ‖) = O ({‖ z^{k} - z^{*} ‖}^{2}) = O ({‖ H (z^{k}) ‖}^{2})$ (5.3)

即当 $z^{k}$ 充分接近 $z^{*}$ 时，有 $z^{k + 1} = z^{k} + Δ z^{k}$ 。由(4.5)知

$‖ z^{k + 1} - z^{*} ‖ = O ({‖ z^{k} - z^{*} ‖}^{2})$ (5.4)

即算法4.1是二次收敛的，其次，当k充分大时， $H (z^{k})$ 单调减少趋向于 $H (z^{*})$ ，即 $H (z^{k}) \to 0$ ，所以 $β_{k} = e^{μ_{k}} γ {‖ H (z^{k}) ‖}^{2}$ ，又因为 $z^{k + 1} = z^{k} + Δ z^{k}$ ，所以当k充分大时有

$μ_{k + 1} = μ_{k} + Δ μ_{k} = \frac{β_{k} μ_{0}}{e^{μ_{k}}} = γ {‖ H (z^{k}) ‖}^{2} μ_{0} .$ (5.5)

结合(5.3)式知，当 $z^{k}$ 充分接近 $z^{*}$ 时，有

$\frac{μ_{k + 1}}{μ_{k}} = \frac{{‖ H (z^{k}) ‖}^{2}}{{‖ H (z^{k - 1}) ‖}^{2}} = \frac{O ({‖ H (z^{k - 1}) ‖}^{4})}{{‖ H (z^{k - 1}) ‖}^{2}} = O ({‖ H (z^{k - 1}) ‖}^{2}) = O (μ_{k}),$

即 $μ_{k + 1} = O (μ_{k}^{2})$ 。

6. 数值试验

为了检验算法4.1的有效性，本文用Matlab 2014a编程，在Inter (R) Pentium (R) 4CPU，3.40 GHz，2 GB内存，Windows 7操作系统的电脑上做数值试验。测试问题是随机生成的规模n = 2 m从20到800维不等且r = 1的二阶锥规划问题。具体步骤为：首先生成随机的行满秩矩阵 $A \in R^{m \times n}$ 和随机向量 $x, s \in K_{0}$ ，然后令 $b = A x, c = A^{T} y + s,$ ，则得到的二阶锥规划的原问题和对偶问题都存在最优解且最优值相等。在测试问题过程中，初始点选取 $x^{0} = e \in R^{n}, y^{0} = 0 \in R^{m}$ 。参数取值为： $μ_{0} = 0.01, δ = 0.65, σ = 0.35, γ = 0.90$ 。终止准则为 $‖ H (z^{k}) ‖ \leq 10^{- 6}$ 。计算结果列于表1，其中IT和CPU(s)表示每个测试问题进行10次所求得最优解时所用的平均迭代次数和平均时间。

Table 1. The numerical experiment results of the algorithm

表1. 算法的数值实验结果

由表1可以看出，算法是有效的，并且可以求解大规模的二阶锥规划问题，它只需较少的CPU时间就可以得到满足终止条件的解。并且本文中的算法4.1求解问题所用时间大部分比文献 [13] 所用时间少。

基金项目

国家自然科学基金(11561005)。

参考文献

[1]	Faraut, J. and Koranyi, A. (1994) Analysis on Symmetric Cone. Clarendon Press, Oxford.
[2]	Alizadeh, F. and Goldfarb, D. (2003) Second-Order Cone Programming. Mathematical Programming: Series B, 95, 3-51.
[3]	Sun, D.F. (2005) Strong Semismoothness of the Fischer-Burmeister SDC and SOC Complentarity Functions. Mathematical Pro-gramming, 103, 575-581. https://doi.org/10.1007/s10107-005-0577-4
[4]	Hayashi, S., Yamashita, N. and Fuku-shima, M. (2005) A Combined Smoothing and Regularization Method for Monotone Second-Order Cone Complemen-tarity Problems. SIAM Journal on Optimization, 15, 593-615. https://doi.org/10.1137/S1052623403421516
[5]	Chi, X.N. and Liu, S.Y. (2009) A One-Step Smoothing Newton Method for Second-Order Cone Programming. Journal of Computational and Applied Mathematics, 223, 114-123. https://doi.org/10.1016/j.cam.2007.12.023
[6]	Chi, X.N. and Liu, S.Y. (2009) A Non-Interior Continuation Method for Second Cone Optimization. Optimization, 58, 965-979. https://doi.org/10.1080/02331930701763421
[7]	Tang, J.Y., Dong, L., Fang, L. and Zhou, J.C. (2014) Smoothing Newton Algorithm for the Second-Order Cone Programming with a Nonmonotone Line Search. Optimization Letters, 8, 1753-1771. https://doi.org/10.1007/s11590-013-0699-1
[8]	Tang, J.Y., He, G.P., Dong, L., Fang, L. and Zhou, J.C. (2015) A Globally and Quadratically Convergent Smoothing Newton Method for Solving Second-Order Cone Optimization. Ap-plied Mathematical Modelling, 39, 2180-2193. https://doi.org/10.1016/j.apm.2014.10.027
[9]	Fang, L. and Feng, Z.Z. (2011) A Smoothing Newton-Type Method for Second-Order Cone Programming Problems Based on a New Smoothing Fischer-Burmeister Function. Computational & Applied Mathematics, 30, 569-588. https://doi.org/10.1590/S1807-03022011000300005
[10]	Jiang, H. (1997) Smoothed Fischer-Burmeister Equation Methods for the Complementarity Problem. Technical Report. Department of Mathematics, The University of Melbourne, Parville, Victoria, Australia.
[11]	Fukushima, M., Luo, Z.Q. and Tseng, P. (2001) Smoothing Functions for Second-Order Cone Complementarity Problems. SIAM Journal on Optimization, 12, 436-460. https://doi.org/10.1137/S1052623400380365
[12]	Qi, L.Q. and Sun, J. (1993) A Nonsmooth Version of Newton’s Method. Mathematical Programming, 58, 353-367. https://doi.org/10.1007/BF01581275
[13]	汤京永, 贺国平. 二阶锥规划的一步光滑牛顿法[J]. 数学物理学报, 2012, 32(4): 768-778.

为你推荐

友情链接