1. 引言
动态博弈论在工程、经济学、管理科学等领域的实际应用引起了研究的广泛关注 [1] - [7] 。此外,LQ Nash博弈在理论和应用中的重要性而成为这些研究的焦点。连续和离散时间系统的纳什对策得到众学者的广泛的研究,包括 [8] [9] 给出了一套保证具有马尔可夫跳跃的线性系统与无限时域LQ微分对策相关的代数黎卡提方程稳定解存在的充分条件。 [10] 给出了有限时域马尔可夫跳跃线性系统与LQ微分对策相关的黎卡提方程稳定解存在的充要条件。 [11] 给出了连续情况下马尔可夫跳跃系统的LQ微分对策相关的黎卡提方程稳定解存在的充要条件。
值得注意的是,许多关于纳什博弈的研究只关注于有限的马尔可夫切换。众所周知,具有无限马尔可夫切换的SDE的纳什对策问题仍未解决。但是具有无限马尔可夫跳跃过程可以对实际生产生活中发生的突变进行更精确的描述。 [12] [13] 表示,对于无限马尔可夫跳跃系统随机稳定性(SS)和条件指数均方稳定(EMSS-C)不再等价。因为具有有限马尔可夫切换的线性系统中两个稳定性概念是等价的。故深入研究无限马尔可夫切换系统是非常有必要的。
本文讨论了具有无限马尔可夫跳跃和
-独立噪声的SDEs的无限时域LQ Nash对策问题。主要贡献如下:首先,利用伪逆矩阵的性质,给出不定LQ控制的可达性与ICGARE解的存在性之间的等价条件。基于得到的不定LQ结果,在EMSS-C和强可检测性条件下,确定了无限马尔可夫跳跃系统的无限时域纳什对策。
本文组织结构如下:在第2节中,我们将介绍一些初步准备工作。第3节讨论不定LQ控制的达性,并给出了纳什均衡点存在的充要条件。第4节对本文内容进行总结。
为方便起见,我们采用了以下符号。
:所有非负实数的集合;
:n维实欧氏空间;
:
阶实矩阵所组成的线性空间;
:
的欧氏范数或
算子范数;
:
阶单位矩阵;
:A矩阵(或向量)的转置;
:矩阵A的伪逆;
:所有
阶对称矩阵的集合;
:A是正(半正)定;
:Kronecker函数;
,状态空间。
2. 模型介绍
给定完备概率空间
,考虑下列带有无限马尔可夫跳和
-独立噪声随机系统:
(1)
此处
,
,
,
分别为系统状态,外部干扰,控制输入和测量输出。
,是一个标准的r维布朗运动,且满足
,
。令
为齐次无穷马尔可夫链,且假设
和
相互独立。转移概率矩阵
,其中
。P为非退化矩阵,即满足对于所有
,
,
,
。
令
表示集
,此处H满足
。
为实巴拿赫空间,空间范数定义为
。由
阶矩阵序列组成的
子空间定义为
。而且
表示
的子空间,其元素满足,对所有的
,
当且仅当
。假设所考虑的系统系数均有一个有限范数
。
定义1 若对所有
,
,
,存在
且
使得
,则称带有无限马尔可夫跳SDE:
(2)
或
称为EMSS-C的。
定义2 若存在序列
,使得闭环系统
(3)
即
是EMSS-C,则称系统(1)
或
是指数稳定的,其中
。
定义3 若存在序列
,使得
(4)
或
是EMSS-C的,则称系统(1)
或
为强可检测的。
引理1 [13] 假设
,
,
,且
,定义
则有
1) 若
是强可检测的,则
也是强可检测的。
2)
是强可检测的,则
也是强可检测的。
引理2 [14] 若
也是强可检测的,则
是EMSS-C的当且仅当存在
,使得
(5)
引理3 [15] 令矩阵
和N为给定矩阵,则下列方程
有一个解X当且仅当
,而且此解可表示为
,此处S为适当维数矩阵。
3. 主要结果
考虑下列带有多重噪声的无限马尔可夫跳跃系统:
(6)
定义容许控制集
,
(7)
对于任意
,相关的二次耗散函数(6)为
(8)
其中,
和
为不定对称矩阵。
不定LQ最优控制是在容许控制集中取值,使代价函数
最小化,值函数V定义为
(9)
若容许控制
使J达到最小值
,则称为最优控制,
为最优耗散值。
定理1 若
是指数稳定的,则不定LQ控制(6)~(9)是可达的,当且仅当下列ICGARE:
(10)
有唯一稳定解
,最优值函数
,最优控制
(11)
其中,
,
,
证明:(充分性)设
上式对t从0到
求,结合(8)式
(12)
令
,由上,则(8)式可写为
(13)
取
,
.
由广义逆矩阵性质,有
,
,ICGARE(10)有唯一解
,则由配方法可得,
(14)
由此,在(11)给定的最优控制下,最优值函数则为
。
(必要性)首先证明ICGARE (10)有一个最大值解。
考虑下列对称矩阵凸集
(15)
因为不定LQ控制(6)~(7)是可达的,由 [16] 可知,值函数的二次形式为
,若
,令
为
中任意元素,由(12)则有
(16)
进一步则有
,可得
现证
,应用动态规划法 [17] 则有
(17)
利用(11),并令
,则有
(18)
由
和
的任意性,由上式可得
(19)
这表明
为
中最大元素,由Schur引理 [18] ,则有
(20)
再令
和
为最优控制和最优轨迹,类似(13)的证明,则有
(21)
又有
,由(20)和(21)有
(22)
(23)
由(22)可知
为ICGARE (10)的解,又由
的任意性,则
为ICGARE(10)的最大值解。
其次,证明
为稳定解,由
,由引理3可解
令
,
,则ICGARE (10)有稳定解。
最后证唯一性,令
和
为ICGARE (10)的两个解,由于
,所以
,证毕。
考虑下列关系两个二次性能指标的纳什博弈问题:
(24)
(25)
此处
为给定的扰动衰减水平。
定义3 若
(26)
(27)
则称策略对
为纳什均衡点。
接下来,在定理1的基础上,给出线性反馈纳什均衡点存在的充要条件。
定理2 对于系统(1),若
,
为强可检测的,则(26),(27)有一线性反馈纳什均衡点
,此为最优策略当且仅当
(28)
(29)
(30)
(31)
有一组解
,且对任意
,满足
,
。
其中,
证明 (充分性)因为ICGARE (28)~(31)有一组解
且
,
,设
,
,将
带入(1),则有
(32)
性能指标(24)可写作
(33)
注意到在(32)的约束下,对容许控制集下的(33)取最小值,这是不定LQ问题,其中控制加权矩阵
,
。由引理1,
为强可检测的,则
也为强可检测的,且(30)可写作
(34)
此处
与引理1中定义相同。根据引理2,
是EMSS-C的。基于定理1和(28),
,
为不定LQ问题的最优控制。这说明
。
同理,取
带入(1)中,得到
(35)
则在(35)得约束下,带有控制加权矩阵
和控制加权矩阵
的
取最小值为得标准LQ问题。由定理1和(30)可得到
,
使得
可取最小值,因此
。
(必要性)假设纳什博弈(26)~(27)有线性反馈纳什均衡点
,不定LQ控制是可达的,且
为指数稳定,则
是EMSS-C。结合(26)和(32)充分利用定理1,取
,
,则(28)有解
,
,
。
下证
。首先由
定义,可看出
.
进一步,对任意
,可推断
。若系统(1)中取
,则可得(35),由 [19] 定理4,可知存在
为(30)的稳定解。而且
,其中
。
4. 总结
本文研究了具有无限马尔可夫跳跃和
-独立噪声的SDEs的无限时域线性二次纳什对策。我们给出了所考虑系统的一个不定LQ纳什对策,在此基础上,用黎卡提方程的可解性提出了纳什均衡点存在的充要条件。可将此理论应用到H2/H∞控制研究中。
NOTES
*通讯作者。