1. 引言
锥特征值互补问题在工程与经济学领域中具有广泛的应用背景,涵盖结构动力学系统分析、振动声学建模、电路仿真以及接触力学等多个重要方向[1]-[3]。目前,关于此问题的已有研究主要集中于对称锥情形,包括帕累托锥[4]-[10]和二阶锥[11]-[14]。然而,在许多实际建模中,非对称锥的情形亦不可忽视。
椭圆锥作为一类重要的非对称锥,其定义如下:
(1.1)
其中
为非奇异对称矩阵,具有
个正特征值和一个负特征值,该负特征值对应的特征向量记为
,
表示定义在
上的标准欧几里得内积。通过选取不同的
和
,上述椭圆锥可以退化为二阶锥、圆锥和正椭圆锥[15]。椭圆锥特征值互补问题具有下述形式:
其中
是给定矩阵,
,
是用于避免平凡解的正则化条件,
表示椭圆锥的对偶锥,即
基于椭圆锥与二阶锥、圆锥和正椭圆锥的关系(见下文式(2.4)),对于问题
和
的讨论一方面可以统一关于二阶锥特征值互补问题、圆锥特征值互补问题和正椭圆锥特征值互补问题的认识;另一方面可以将锥特征值互补问题的研究扩展至非对称锥领域。关于上述问题的可解性,由于文献[16]-[18]已对一般情况下的锥特征值互补问题进行了系统研究,所得结果自然可以涵盖问题
和
这两类模型,因此本文重点讨论上述两类模型的等价重构,以便于使用已有算法包求解。进一步,通过引入附加变量,不难发现上述两类模型可以归结为下面一类椭圆锥平衡模型:
(1.2)
其中
分别称为原始变量和对偶变量,
为外生变量,
,
,
是
维零向量。非线性系统(1.2)中最后一个方程通常表示对原始变量的正则化条件或结构约束。
本文旨在讨论上述椭圆锥平衡模型,重点分析其解的存在条件和类型特征,并建立椭圆锥特征值互补问题
和
的等价重构,以期为相关问题的算法研究提供理论支持。
2. 预备知识
本节将回顾关于椭圆锥的基本背景知识,包括椭圆锥的内部与边界、对称矩阵
的正交分解以及后续分析中用到的一个技术性引理,更多细节见文献[15]。
根据式(1.1)椭圆锥的定义,其内部与边界为
(2.1)
(2.2)
考虑对称矩阵
具有下述正交分解
其中正交矩阵
,对角矩阵
,
的特征对
满足
(2.3)
作为一个基本闭凸锥,椭圆锥
推广了若干重要锥体,包括二阶锥[19] [20]、圆锥[21] [22]及正椭圆锥[23],它们可以通过设置不同的
和
获得:
(1) 当
且
时,
退化为二阶锥;
(2) 当
且
时,
退化为圆锥
;
(3) 当
且
时,
退化为正椭圆锥,
上述锥满足以下包含关系[15]:
(2.4)
其中
,
表示
的欧几里得范数,
以及
是非奇异矩阵。
下述引理刻画了椭圆锥与二阶锥之间的转换关系,该引理的证明可以参见文献[15]中的定理2.1和定理2.2。
引理2.1 设
和
分别为椭圆锥和二阶锥,其定义如上所述。则下面结论成立:
(1)
且
;
(2)
且
;
(3)
,
其中
,
,
的特征对
满足条件(2.3)。
3. 椭圆锥平衡模型
3.1. 模型转化
为了进一步研究椭圆锥平衡模型(1.2),需要对该模型进行转化。文献[24]指出,二阶锥可以表示为
,其中
是
上的二元运算,定义如下:
,
其中
,
,
且
,因此有
(3.1)
根据引理2.1,
和
。不妨设
,
,即
和
。基于上述观察,椭圆锥平衡模型(1.2)可以重述为
(3.2)
又因为
进一步,非线性系统(3.2)等价于
(3.3)
3.2. 平凡解与非平凡解
定义3.1 称椭圆锥平衡模型(1.2)的解
是平凡的,如果
;否则,它是非平凡的。
为了保证椭圆锥平衡模型(1.2)的平凡解是有意义的,基于其等价刻画(3.3)的描述,需要在
或函数
完全缺失的情况下进行讨论。由于平凡解
的分量必须为零,且
,这意味着
,非线性系统(3.3)退化为
对于非平凡解情况,我们首先假设
(3.4)
这意味着
,从而
,这确保(1.2)的每个解都是非平凡的。
引理3.1 设
,
,其中
如式(3.1)定义。假设(3.4)成立,当且仅当出现以下情况之一时,三元组
是椭圆锥平衡模型(1.2)的解。
(1)
且
是下述系统的解:
(3.5)
其中
(2)
,且
满足
(3.6)
证明 正交条件
等价于
即
根据柯西–施瓦茨不等式,上式等价于
(3.7)
(3.8)
(3.9)
因此,
是椭圆锥平衡模型(1.2)的解当且仅当
满足(3.7)~(3.9)和
对于
值有下述两种不同的情况:
(1) 若
,由式(3.8)可以推出
,这能够使式(3.7)成立。基于上述分析,
是椭圆锥平衡模型(1.2)的解当且仅当
是系统(3.5)的解。
(2) 若
,由假设(3.4)可以推出
,从而式(3.7)~(3.9)等价于
。基于上述分析,
是椭圆锥平衡模型(1.2)的解当且仅当
是系统(3.6)的解。
基于引理2.1及椭圆锥与圆锥和正椭圆锥的关系,类似得到关于圆锥平衡模型和正椭圆锥平衡模型非平凡解的相关推论。
推论3.1 考虑下述圆锥平衡模型
(3.10)
其中
,
,
是
维零向量。在假设
的前提下,当且仅当出现以下情况之一时,三元组
是圆锥平衡模型(3.10)的解。
(1)
且
是系统(3.5)的解,此时
(2)
,且
满足
(3.11)
推论3.2 考虑下述正椭圆锥平衡模型
(3.12)
其中
,
,
是
维零向量。在假设
的前提下,当且仅当出现以下情况之一时,三元组
是正椭圆锥平衡模型(3.12)的解。
(1)
且
是系统(3.5)的解,此时
其中
为
阶矩阵
特征值分解中的正交矩阵,
是对应的
阶对角矩阵,它具有下述形式
(2)
,且
满足
(3.13)
3.3. 边界型解与内部型解
本节讨论椭圆锥平衡模型(1.2)的边界型解与内部型解的分类。
定义3.2 称椭圆锥平衡模型(1.2)的解
是边界型(内部型)的,如果它是非平凡的且
属于
的边界(内部)。
为了给出椭圆锥平衡模型(1.2)的边界型解与内部型解的等价描述,我们需要证明下述结论。
定理3.1 假设(3.4)成立,当且仅当出现以下情况之一时,三元组
是椭圆锥平衡模型(1.2)的解。
(1)
,
,
是系统(3.6)的解。
(2)
,
,
是下述系统的解
(3.14)
其中
(3)
,
,
是下述系统的解
(3.15)
其中
证明 设
,
,其中变量
如式(3.1)定义。由
和式(3.8),可以推出
。令
,则有
,因此可以得到
(3.16)
以及
。由于
,可得
,其中
是下述系统的解:
(3.17)
(3.18)
(3.19)
注意等式(3.17)成立的条件是
或
。下面分类讨论:
(1) 若
,将其代入(3.16)和(3.18)~(3.19),可以得到情况(2)成立。
(2) 若
,将其代入(3.16)和(3.18)~(3.19),可以得到情况(3)成立。
另外,如果
,由引理3.1的第2部分结论,可以得到情况(1)成立。
基于定理3.1及椭圆锥与圆锥和正椭圆锥的关系,关于非线性系统(3.10)和(3.12)可以得到下述推论。
推论3.3 考虑圆锥平衡模型(3.10),假设
成立,当且仅当出现以下情况之一时,三元组
是圆锥平衡模型(3.10)的解。
(1)
,
,
是系统(3.11)的解。
(2)
,
,
是系统(3.14)的解,此时
(3)
,
,
是系统(3.15)的解,此时
推论3.4 考虑正椭圆锥平衡模型(3.12),假设
成立,当且仅当出现以下情况之一时,三元组
是正椭圆锥平衡模型(3.12)的解。
(1)
,
,
是系统(3.13)的解。
(2)
,
,
是系统(3.14)的解,此时
(3)
,
,
是系统(3.15)的解,此时
本节最后给出关于椭圆锥平衡模型解的完整分类,下述定理的主要价值在于为解的类型提供了清晰的特征描述。
定理3.2 假设(3.4)成立,则有如下结论成立:
(1)
是椭圆锥平衡模型(1.2)的边界型解当且仅当定理3.1中的情况(2)出现。
(2)
是椭圆锥平衡模型(1.2)的内部型解当且仅当定理3.1中的情况(1)或(3)出现且
。
证明 (1) 如果定理3.1中的情况(2)出现,有
且
,于是
这是由于(3.14)中的最后一个方程,并且
,满足式(2.2),那么
是椭圆锥平衡模型(1.2)的边界型解。
反之,假设
是椭圆锥平衡模型(1.2)的一个边界型的解,
如(3.1)定义,则有
。这是因为如果
,则有
,此时,
(3.20)
由式(2.1),有
,这与定义3.2矛盾。因此,可以如(3.16)中那样重写
。由于
且
,可以推断出
但这等价于说
,即
。基于上述讨论,可以得到定理3.1中的情况(2)成立。
(2) 如果定理3.1中的情况(1)出现,此时
,由式(3.20)可知,
。如果定理3.1中的情况(3)出现且
,
,则
。
反之,设
是椭圆锥平衡模型(1.2)的一个内部型的解,可以排除定理3.1中的情况(2)。因此,要么情况(1)成立,要么情况(3)成立,且必有
。
基于定理3.2、推论3.3和推论3.4,下面推论给出了圆锥平衡模型(3.10)和正椭圆锥平衡模型(3.12)的边界型解和内部型解的等价刻画。
推论3.5 考虑圆锥平衡模型(3.10),假设
成立,则有如下结论成立:
(1)
是圆锥平衡模型(3.10)的边界型解当且仅当推论3.3中的情况(2)出现。
(2)
是圆锥平衡模型(3.10)的内部型解当且仅当推论3.3中的情况(1)或(3)出现且
。
推论3.6 考虑正椭圆锥平衡模型(3.12),假设
成立,则有如下结论成立:
(1)
是正椭圆锥平衡模型(3.12)的边界型解当且仅当推论3.4中的情况(2)出现。
(2)
是正椭圆锥平衡模型(3.12)的内部型解当且仅当推论3.4中的情况(1)或(3)出现且
。
4. 椭圆锥特征值互补问题的等价重构
本节将建立椭圆锥特征值互补问题
和
的等价重构。
根据引理2.1,存在
和
使得
和
可以转化为
(4.1)
(4.2)
其中
的定义与引理2.1中一致。不难发现,系统(4.1)和(4.2)均为带有二阶锥互补约束的非线性系统,因此可以考虑将它们重述为非线性二阶锥互补问题
和二阶锥线性互补问题
其中
是连续可微映射,向量
,矩阵
。
首先,我们考虑下述二阶锥线性互补问题
(4.3)
其中。对于
,定义函数
和
具有下述形式
(4.4)
(4.5)
对应函数
和
的非线性二阶锥互补问题定义如下:
(4.6)
(4.7)
下一个定理总结了椭圆锥特征值互补问题(4.1)与非线性二阶锥互补问题(4.6)、(4.7)及二阶锥线性互补问题(4.3)之间的关系。
定理4.1 设
和
的定义如(4.4)和(4.5)所示。则有下述结论成立:
(1) 若
是模型(4.1)的解且
,则
是模型(4.6)的解。
(2) 若
是模型(4.1)的解且
,则
是模型(4.7)的解。
(3) 若
是模型(4.1)的解且
,则
是模型(4.3)的解。
(4) 若
且
是模型(4.6)的解,则
是模型(4.1)的解。
(5) 若
且
是模型(4.7)的解,则
是模型(4.1)的解。
(6) 若
是模型(4.3)的解且
,则是模型(4.1)的解。
证明 若
是模型(4.1)的解,则有
(1) 若
,则
,
且
这说明
是模型(4.6)的解。
(2) 若
,则
,
且
因此,
是模型(4.7)的解。
(3) 若
,则
,
且。因此,
是模型(4.3)的解。
(4) 若
且
是模型(4.6)的解,则有
对任意
,由
的定义和柯西-施瓦茨不等式可得
(4.8)
由(4.8)可得,且。因此,
是模型(4.1)的解。
(5) 若
且
是模型(4.7)的解,则有
由(4.8)可得,且。因此,
是模型(4.1)的解。
(6) 若
是模型(4.3)的解且
,则是模型(4.1)的解。
接下来,为了重新表述模型(4.2),需要定义其他函数。对于
,定义函数
和
如下:
(4.9)
(4.10)
其中。考虑对应函数
和
的非线性二阶锥互补问题
(4.11)
(4.12)
以及下述二阶锥线性互补问题
(4.13)
下述定理总结了椭圆锥特征值互补问题(4.2)与非线性二阶锥互补问题(4.11)、(4.12)及二阶锥线性互补问题(4.13)之间的关系。
定理4.2 设
和
的定义如(4.9)和(4.10)所示。则有下述结论成立:
(1) 若
是模型(4.2)的解且
,则
是模型(4.11)的解。
(2) 若
是模型(4.2)的解且
,则
是模型(4.12)的解。
(3) 若
是模型(4.2)的解且
,则
是模型(4.13)的解。
(4) 若
且
是模型(4.11)的解,则
是模型(4.2)的解。
(5) 若
且
是模型(4.12)的解,则
是模型(4.2)的解。
(6) 若
是模型(4.13)的解且
,则是模型(4.2)的解。
证明 该定理的证明与定理4.1的证明非常相似。但为了完整性,我们给出详细证明过程。若
是模型(4.2)的解,则有
(1) 若
,则
,
且
因此,
是模型(4.11)的解。
(2) 若
,则
,
且
因此,
是模型(4.12)的解。
(3)若
,则
,
且。因此,
是模型(4.13)的解。
(4) 若
且
是模型(4.11)的解,则有
由(4.8)可得,且。 因此,
是模型(4.2)的解。
(5) 若
且
是模型(4.12)的解,则有
由(4.8)可得,且。因此,
是模型(4.2)的解。
(6) 若
是模型(4.13)的解且
,则是模型(4.2)的解。
5. 数值实验
本节中将采用半光滑牛顿法求解转化后的椭圆锥特征值互补问题(4.1),即求解非线性二阶锥互补问题(4.6)、(4.7)及二阶锥线性互补问题(4.3)。回想一下,若映射
满足如下等价关系:
则称其为与
相关的互补函数。自然残差函数是一类常见的二阶锥互补函数,它的定义如下:
文献[25]已证明该函数具有全局Lipschitz连续性和强半光滑性。利用二阶锥互补函数
,我们可以将系统(4.3)、(4.6)及(4.7)重新表述为下述方程组
(5.1)
(5.2)
其中是用于避免平凡解的正则化条件,这里取
。另外,由于函数
和
的结构极其相似,只是关于
的符号发生了改变,因此,我们这里仅展示对系统(5.1)和(5.2)应用半光滑牛顿法进行数值实验的结果。所有数值实验代码采用MATLAB语言编写,实验环境配置Intel(R) Core(TM) Ultra 5 125H 3.60 GHz和32.0 GB内存。
在数值实验中,设置
,此时椭圆锥退化为圆锥,
。对于系统(5.1),设置初始点
,其中
,每个元素
在区间
内均匀分布,
。对于系统(5.2),设置初始点
,其中
,每个元素
在区间
内均匀分布,
终止准则采用
,算法允许的最大迭代步数为1000。设矩阵
是一个随机矩阵,其每个元素服从区间
上的均匀分布。我们安排了下述两组实验:
在第一组实验中,取
,即
的非对称形式。针对
和
两种情形测试半光滑牛顿法在求解系统(5.1)和(5.2)时的数值性能,见表1和表2。
在第二组实验中,取
,即
的对称化形式。针对
和
两种情形测试半光滑牛顿法在求解系统(5.1)和(5.2)时的数值性能,见表3和表4。
Table 1. Convergence percentage and average iteration count for solving system (5.1) under asymmetric matrices
表1. 非对称矩阵下求解系统(5.1)的收敛百分比及平均迭代次数
旋转角度θ |
维度n |
收敛百分比 |
平均迭代次数 |
平均CPU时间(s) |
θ = π/6 |
50 |
99.0 |
50.2 |
0.011 |
100 |
98.8 |
52.4 |
0.027 |
150 |
98.6 |
53.5 |
0.065 |
200 |
97.3 |
54.6 |
0.126 |
θ = π/3 |
50 |
99.1 |
55.7 |
0.012 |
100 |
98.7 |
56.4 |
0.028 |
150 |
98.2 |
56.9 |
0.062 |
200 |
97.4 |
58.1 |
0.135 |
Table 2. Convergence percentage and average iteration count for solving system (5.2) under asymmetric matrices
表2. 非对称矩阵下求解系统(5.2)的收敛百分比及平均迭代次数
旋转角度θ |
维度n |
收敛百分比 |
平均迭代次数 |
平均CPU时间(s) |
θ = π/6 |
50 |
99.4 |
44.6 |
0.008 |
100 |
98.2 |
71.9 |
0.041 |
150 |
97.6 |
96.3 |
0.148 |
200 |
95.6 |
132.8 |
0.470 |
θ = π/3 |
50 |
60.3 |
197.7 |
0.036 |
100 |
55.8 |
254.8 |
0.145 |
150 |
48.0 |
318.9 |
0.676 |
200 |
42.6 |
360.1 |
1.858 |
表1和表2展示了矩阵
为非对称矩阵时,应用半光滑牛顿法求解系统(5.1)和(5.2)的数值实验结果,使用103对随机样本
估计求解上述两种系统的收敛百分比、平均迭代次数和平均CPU时间。可以得出如下结论:半光滑牛顿法求解二阶锥线性互补问题的成功收敛率几乎不受旋转角度
和问题维数的影响,平均迭代次数也不会随维数的增加而显著增加。但是半光滑牛顿法求解非线性二阶锥互补问题的性能受旋转角度
的影响较大,
取
时算法的成功收敛率及平均迭代次数远低于
取
时的算法结果。
Table 3. Convergence percentage and average iteration count for solving system (5.1) under symmetric matrices
表3. 对称矩阵下求解系统(5.1)的收敛百分比及平均迭代次数
旋转角度θ |
维度n |
收敛百分比 |
平均迭代次数 |
平均CPU时间(s) |
θ = π/6 |
50 |
99.5 |
58.3 |
0.014 |
100 |
98.3 |
60.1 |
0.027 |
150 |
97.6 |
63.9 |
0.189 |
200 |
96.1 |
65.9 |
0.208 |
θ = π/3 |
50 |
99.3 |
63.4 |
0.021 |
100 |
98.5 |
66.3 |
0.066 |
150 |
97.3 |
68.0 |
0.192 |
200 |
96.8 |
69.9 |
0.235 |
Table 4. Convergence percentage and average iteration count for solving system (5.2) under symmetric matrices
表4. 对称矩阵下求解系统(5.2)的收敛百分比及平均迭代次数
旋转角度θ |
维度n |
收敛百分比 |
平均迭代次数 |
平均CPU时间(s) |
θ = π/6 |
50 |
99.2 |
107.1 |
0.019 |
100 |
96.2 |
202.8 |
0.125 |
150 |
84.8 |
281.0 |
0.389 |
200 |
69.4 |
358.4 |
1.318 |
θ = π/3 |
50 |
54.2 |
237.0 |
0.042 |
100 |
50.6 |
306.4 |
0.818 |
150 |
48.0 |
377.6 |
1.531 |
200 |
45.5 |
410.7 |
2.358 |
表3和表4展示了矩阵
为对称矩阵时,采用半光滑牛顿法求解系统(5.1)和(5.2)的数值实验结果,大致结论与非对称情形相同。另外,通过观察可以发现半光滑牛顿法求解对称矩阵下非线性二阶锥互补问题的性能远不如非对称矩阵的情形。
对于转化后的椭圆锥特征值互补问题(4.2),即非线性二阶锥互补问题(4.11)、(4.12)及二阶锥线性互补问题(4.13),我们仍可以利用半光滑牛顿法进行数值求解,非线性二阶锥互补问题(4.11)、(4.12)中涉及到的变量
依然可以得到显示表达式,二阶锥线性互补问题(4.13)与之前所讨论的二阶锥线性互补问题(4.3)结构基本一致,只是涉及到的相关矩阵有所不同。由于具体实现流程与前述实验部分类似,此处不再展开详细的数值实验。
6. 总结
本文聚焦一类椭圆锥平衡模型,分析了该平衡模型解的存在条件,非平凡解及其边界型解与内部型解的等价刻画,这些结果可视为二阶锥平衡模型的自然推广。借助圆锥、正椭圆锥与椭圆锥之间的相互关系,上述结果推广至圆锥平衡模型与正椭圆锥平衡模型这两类非对称锥情形。另外,还讨论了该平衡模型在椭圆锥特征值互补问题中的应用。利用椭圆锥与二阶锥之间的转换关系,建立两类椭圆锥特征值互补问题基于二阶锥互补系统形式的等价重构,为数值求解提供了理论基础。文中采用半光滑牛顿法对所构建问题进行了数值实验,验证了所提模型与算法的可行性与有效性。关于上述模型求解算法的进一步理论分析及与其他数值方法的比较,可作为后续深入研究的方向。
NOTES
*通讯作者。