带有无限马尔可夫跳跃的离散系统LQ纳什博弈

doi:10.12677/AAM.2023.129379

期刊菜单

带有无限马尔可夫跳跃的离散系统LQ纳什博弈
LQ Nash Games for Discrete Systems with Infinite Markov Jumps

DOI: 10.12677/AAM.2023.129379, PDF, HTML, XML,
作者: 张春梅^*, 贾亚琪, 赵红霞, 何鑫, 陈柏江, 杨路：重庆理工大学理学院，重庆
关键词: 耦合广义代数黎卡蒂方程；无限马尔可夫跳跃；纳什博弈；随机微分方程；强可检测性；Coupled Generalized Algebraic Riccati Equation； Infinite Markovian Jumps； Nash Games； Stochastic Differential Equations； Strong Detectability

摘要: 研究具有无限马尔可夫跳跃和(x,u,v)-独立噪声的随机微分方程(SDEs)的无限时域线性二次(LQ)纳什博弈问题。基于矩阵伪逆性质，算子理论，状态稳定性性质，给出不定LQ控制的可达性与ICGAREs解的存在性之间的等价条件。在此基础上，在EMSS-C和强可检测性条件下，确定了无限马尔可夫跳跃系统的无限时域纳什对策。

Abstract: In this paper, we consider infinite horizon linear-quadratic (LQ) Nash games for stochastic differen-tial equations (SDEs) with infinite Markovian jumps and (x,u,v) -dependent noise. Based on the pseudo-inverse property of matrix, operator theory and state stability property, the equivalent conditions between the reachability of indefinite LQ control and the existence of ICGAREs solution are given. On this basis, the infinite-domain Nash games for infinite Markov jump systems are de-termined under the conditions of EMSS-C and strong detectability.

文章引用：张春梅, 贾亚琪, 赵红霞, 何鑫, 陈柏江, 杨路. 带有无限马尔可夫跳跃的离散系统LQ纳什博弈[J]. 应用数学进展, 2023, 12(9): 3851-3859. https://doi.org/10.12677/AAM.2023.129379

1. 引言

动态博弈论在工程、经济学、管理科学等领域的实际应用引起了研究的广泛关注 [1] - [7] 。此外，LQ Nash博弈在理论和应用中的重要性而成为这些研究的焦点。连续和离散时间系统的纳什对策得到众学者的广泛的研究，包括 [8] [9] 给出了一套保证具有马尔可夫跳跃的线性系统与无限时域LQ微分对策相关的代数黎卡提方程稳定解存在的充分条件。 [10] 给出了有限时域马尔可夫跳跃线性系统与LQ微分对策相关的黎卡提方程稳定解存在的充要条件。 [11] 给出了连续情况下马尔可夫跳跃系统的LQ微分对策相关的黎卡提方程稳定解存在的充要条件。

值得注意的是，许多关于纳什博弈的研究只关注于有限的马尔可夫切换。众所周知，具有无限马尔可夫切换的SDE的纳什对策问题仍未解决。但是具有无限马尔可夫跳跃过程可以对实际生产生活中发生的突变进行更精确的描述。 [12] [13] 表示，对于无限马尔可夫跳跃系统随机稳定性(SS)和条件指数均方稳定(EMSS-C)不再等价。因为具有有限马尔可夫切换的线性系统中两个稳定性概念是等价的。故深入研究无限马尔可夫切换系统是非常有必要的。

本文讨论了具有无限马尔可夫跳跃和 $(x, u, v)$ -独立噪声的SDEs的无限时域LQ Nash对策问题。主要贡献如下：首先，利用伪逆矩阵的性质，给出不定LQ控制的可达性与ICGARE解的存在性之间的等价条件。基于得到的不定LQ结果，在EMSS-C和强可检测性条件下，确定了无限马尔可夫跳跃系统的无限时域纳什对策。

本文组织结构如下：在第2节中，我们将介绍一些初步准备工作。第3节讨论不定LQ控制的达性，并给出了纳什均衡点存在的充要条件。第4节对本文内容进行总结。

为方便起见，我们采用了以下符号。 $R_{+}$ ：所有非负实数的集合； $R^{n}$ ：n维实欧氏空间； $R^{m \times n}$ ： $m \times n$ 阶实矩阵所组成的线性空间； $‖ \cdot ‖$ : $R^{n}$ 的欧氏范数或 $R^{m \times n}$ 算子范数； $I_{n}$ ： $n \times n$ 阶单位矩阵； $A^{'}$ ：A矩阵(或向量)的转置； $A^{†}$ ：矩阵A的伪逆； $S_{n}$ ：所有 $n \times n$ 阶对称矩阵的集合； $A > 0 (\geq 0)$ ：A是正(半正)定； $δ_{(\cdot)}$ ：Kronecker函数； $D = {1, 2, \dots}$ ，状态空间。

2. 模型介绍

给定完备概率空间 $(Ω, F, P)$ ，考虑下列带有无限马尔可夫跳和 $(x, u, v)$ -独立噪声随机系统：

${\begin{cases} x (t + 1) = A_{0} (η_{t}) x (t) + B_{0} (η_{t}) v (t) + G_{0} (η_{t}) u (t) + \sum_{k = 1}^{r} {A_{k} (η_{t}) x (t) + B_{k} (η_{t}) v (t) + G_{k} (η_{t}) u (t)} ω_{k} (t) \\ z (t) = (\begin{array}{l} C (η_{t}) x (t) \\ D (η_{t}) u (t) \end{array}) D {(η_{t})}^{'} D (η_{t}) = I_{n^{u}} \\ x (0) = x_{0} \in R^{n} η (0) = η_{0} \in D t \in Z_{+} \end{cases}$ (1)

此处 $x (t) \in R^{n}$ ， $u (t) \in R^{n_{u}}$ ， $v (t) \in R^{n_{v}}$ ， $z (t) \in R^{n_{z}}$ 分别为系统状态，外部干扰，控制输入和测量输出。 $ω (t) = (ω_{1} (t), ω_{2} (t), \dots, ω_{r} (t))$ ，是一个标准的r维布朗运动，且满足 $E (ω (t)) = 0$ ， $E (ω_{k} (t) ω_{s} {(t)}^{'}) = I_{r} δ_{k s}$ 。令 ${η_{t}}_{t \in Z_{+}}$ 为齐次无穷马尔可夫链，且假设 ${η_{t}}_{t \in Z_{+}}$ 和 ${ω (t)}_{t \in Z_{+}}$ 相互独立。转移概率矩阵 $P = [p (i, j)]$ ，其中 $p (i, j) = p (η_{t + 1} = j | η_{t} = i)$ 。P为非退化矩阵，即满足对于所有 $i, j \in D$ ， $p (i, j) \geq 0$ ， $\sum_{j = 1}^{\infty} p (i, j) = 1$ ， $\sum_{k = 1}^{\infty} p (k, j) > 0$ 。

令 $ℍ_{\infty}^{m \times n}$ 表示集 ${H | H (1), H (2), \dots, H (N), H (i) \in R^{m \times n}}$ ，此处H满足 $\sum_{l = 1}^{\infty} ‖ H (l) ‖ < \infty$ 。 $ℍ_{\infty}^{m \times n}$ 为实巴拿赫空间，空间范数定义为 ${‖ H ‖}_{\infty} = \sup_{l \in D} ‖ H (l) ‖$ 。由 $n \times n$ 阶矩阵序列组成的 $ℍ_{\infty}^{m \times n}$ 子空间定义为 $ℍ_{\infty}^{n}$ 。而且 $ℍ_{\infty}^{n +}$ 表示 $ℍ_{\infty}^{n}$ 的子空间，其元素满足，对所有的 $i \in D$ ， $H \geq 0$ 当且仅当 $H (i) \geq 0$ 。假设所考虑的系统系数均有一个有限范数 ${‖ \cdot ‖}_{\infty}$ 。

定义1 若对所有 $t \in Z_{+}$ ， $i \in D$ ， $x_{0} \in R^{n}$ ，存在 $α > 0$ 且 $β \geq 1$ 使得 $E [{‖ x (t) ‖}^{2} | η_{0} = i] \leq β e^{- α t} {‖ x_{0} ‖}^{2}$ ，则称带有无限马尔可夫跳SDE：

$x (t + 1) = A_{0} (η_{t}) x (t) + \sum_{k = 1}^{r} {A_{k} (η_{t}) x (t)} ω_{k} (t) t \in Z_{+}$ (2)

或 $(A; P) (A = (A_{0}, \dots, A_{r}))$ 称为EMSS-C的。

定义2 若存在序列 ${K (η_{t})}_{t \in Z_{+}} \in ℍ_{\infty}^{n_{u} \times n}$ ，使得闭环系统

$x (t + 1) = (A_{0} (η_{t}) + G_{0} (η_{t}) K (η_{t})) x (t) + \sum_{k = 1}^{r} {(A_{k} (η_{t}) + G_{k} (η_{t}) K (η_{t})) x (t)} ω_{k} (t)$ (3)

即 $(A + G K; P)$ 是EMSS-C，则称系统(1) $(v (t) = 0)$ 或 $(A, G; P)$ 是指数稳定的，其中 $u (t) = K (η_{t}) x (t)$ 。

定义3 若存在序列 ${H (η_{t})}_{t \in Z_{+}} \in ℍ_{\infty}^{n \times n_{z}}$ ，使得

$x (t + 1) = {A_{0} (η_{t}) + H (η_{t}) C (η_{t})} x (t) + \sum_{k = 1}^{r} {A_{k} (η_{t}) x (t)} ω_{k} (t) t \in Z_{+}$ (4)

或 $(A_{0} + H C, \dots, A_{r}; P)$ 是EMSS-C的，则称系统(1) $(u (t) = 0, v (t) = 0)$ 或 $(A | C; P)$ 为强可检测的。

引理1 [13] 假设 $K_{1} (η_{t}) \in ℍ_{\infty}^{n_{v} \times n}$ ， $K_{2} (η_{t}) \in ℍ_{\infty}^{n_{u} \times n}$ ， $K_{3} (η_{t}) \in ℍ_{\infty}^{n \times n_{v}}$ ，且 $H_{1} (η_{t}) \in ℍ_{\infty}^{n_{v} +}$ ，定义

$C_{1} (η_{t}) = (\begin{matrix} C (η_{t}) \\ H_{1} {(η_{t})}^{\frac{1}{2}} K_{3} {(η_{t})}^{'} \\ K_{2} (η_{t}) \end{matrix}), C_{2} (η_{t}) = (\begin{matrix} C (η_{t}) \\ K_{2} (η_{t}) \end{matrix})$

则有

1) 若 $(A | C; P)$ 是强可检测的，则 $(A + G K_{2} | C_{2}; P)$ 也是强可检测的。

2) $(A + B K_{1} | C; P)$ 是强可检测的，则 $(A + B K_{1} + G K_{2} | C_{2}; P)$ 也是强可检测的。

引理2 [14] 若 $(A | C; P)$ 也是强可检测的，则 $(A; P)$ 是EMSS-C的当且仅当存在 $X \in ℍ_{\infty}^{n +}$ ，使得

$X (i) - \sum_{k = 0}^{r} A_{k} {(i)}^{'} ε_{i} (X (i)) A_{k} (i) = C {(i)}^{'} C (i) i \in D$ (5)

引理3 [15] 令矩阵 $L, M$ 和N为给定矩阵，则下列方程 $L X M = N$ 有一个解X当且仅当 $L L^{†} N M^{†} M = N$ ，而且此解可表示为 $X = L^{†} N M^{†} + S - L^{†} L S M M^{†}$ ，此处S为适当维数矩阵。

3. 主要结果

考虑下列带有多重噪声的无限马尔可夫跳跃系统：

${\begin{cases} x (t + 1) = A_{0} (η_{t}) x (t) + G_{0} (η_{t}) u (t) + \sum_{k = 1}^{r} {A_{k} (η_{t}) x (t) + G_{k} (η_{t}) u (t)} ω_{k} (t) \\ x (0) = x_{0} \in R^{n} η (0) = η_{0} \in D t \in Z_{+} \end{cases}$ (6)

定义容许控制集 $U_{a d} (x_{0}, i), (x_{0}, i) \in R^{n} \times D$ ，

$U_{a d} (x_{0}, i) = {u (\cdot) \in l^{2} (R_{+}; R^{n_{u}}) | u (\cdot) 是指数稳定的}$ (7)

对于任意 $(x_{0}, i, u (\cdot)) \in R^{n} \times D \times U_{a d} (x_{0}, i)$ ，相关的二次耗散函数(6)为

$J (x_{0}, i, u (\cdot)) = E {\sum_{t = 0}^{\infty} x {(t)}^{'} Q (η_{t}) x (t) + u {(t)}^{'} R (η_{t}) u (t) | η_{0} = i}$ (8)

其中， $Q (η_{t})$ 和 $R (η_{t})$ 为不定对称矩阵。

不定LQ最优控制是在容许控制集中取值，使代价函数 $J (x_{0}, i, u (\cdot))$ 最小化，值函数V定义为

$V (x_{0}) = \min_{u (\cdot) \in U_{a d} (x_{0}, i)} J (x_{0}, i, u (\cdot))$ (9)

若容许控制 $u^{*} (\cdot)$ 使J达到最小值 $V (x_{0})$ ，则称为最优控制， $V (x_{0})$ 为最优耗散值。

定理1 若 $(A, G; P)$ 是指数稳定的，则不定LQ控制(6)~(9)是可达的，当且仅当下列ICGARE：

${\begin{cases} Q (P (i)) - G (P (i)) R {(P (i))}^{†} G^{'} (P (i)) = 0 \\ {I - R {(P (i))}^{†} R (P (i))} G^{'} (P (i)) = 0 \\ R (P (i)) \geq 0 i \in D \end{cases}$ (10)

有唯一稳定解 $P = (P (1), P (2), \dots) \in ℍ_{\infty}^{n}$ ，最优值函数 $V (x_{0}) = {x^{'}}_{0} P (i) x_{0}$ ，最优控制

$u^{*} (\cdot) = - R {(P (i))}^{†} G^{'} (P (i)) + [I - R {(P (i))}^{†} R (P (i))] M (t) - [I - R {(P (i))}^{†} R (P (i))] m (t)$ (11)

其中， $M (\cdot) \in l^{2} (Z_{+}; R^{n_{u} \times n})$ ， $m (\cdot) \in l^{2} (Z_{+}; R^{n_{u}})$ ，

$\begin{array}{l} Q (P (i)) = \sum_{k = 0}^{r} A_{k} {(i)}^{'} ε_{i} (P) A_{k} (i) - P (i) + Q (i) \\ G (P (i)) = \sum_{k = 0}^{r} A_{k} {(i)}^{'} ε_{i} (P) G_{k} (i) \\ R (P (i)) = \sum_{k = 0}^{r} G_{k} {(i)}^{'} ε_{i} (P) G_{k} (i) + R ( i ) \end{array}$

$ε_{i} (P) = \sum_{j = 1}^{\infty} p (i, j) P ( j )$

证明：(充分性)设 $V (t, x (t), η_{t}) = x {(t)}^{'} P (η_{t}) x ( t )$

$\begin{array}{l} E [V (t + 1, x (t + 1), η_{t + 1}) - V (t, x (t), η_{t}) | η_{t} = i] \\ = E [x {(t)}^{'} (\sum_{k = 0}^{r} A_{k} {(i)}^{'} ε_{i} (P) A_{k} (i) - P (i)) x (t) + u {(t)}^{'} G_{k} {(i)}^{'} ε_{i} (P) A_{k} (i) x (t) \\ + u {(t)}^{'} G_{k} {(i)}^{'} ε_{i} (P) G_{k} (i) u (t) + x {(t)}^{'} A_{k} {(i)}^{'} ε_{i} (P) G_{k} (i) u (t)] \end{array}$

上式对t从0到 $T - 1$ 求，结合(8)式

$\begin{matrix} J^{T - 1} (x_{0}, i, u (\cdot)) = E {\sum_{t = 0}^{T - 1} x {(t)}^{'} Q (η_{t}) x (t) + u {(t)}^{'} R (η_{t}) u (t) | η_{0} = i} \\ = E [{x^{'}}_{0} P (i) x_{0} - x {(T)}^{'} P (η_{T}) x (T)] \\ + E \sum_{t = 0}^{T - 1} [x {(t)}^{'} (\sum_{k = 0}^{r} A_{k} {(i)}^{'} ε_{i} (P) A_{k} (i) - P (i) + Q (i)) x (t) \\ + 2 u {(t)}^{'} G_{k} {(i)}^{'} ε_{i} (P) A_{k} (i) x (t) + u {(t)}^{'} (G_{k} {(i)}^{'} ε_{i} (P) G_{k} (i) + R (i)) u (t)] \end{matrix}$ (12)

令 $T \to \infty$ ，由上，则(8)式可写为

$J (x_{0}, i, u (\cdot)) = {x^{'}}_{0} P (i) x_{0} + E [\sum_{t = 0}^{\infty} {(\begin{matrix} x (t) \\ u (t) \end{matrix})}^{'} (\begin{matrix} Q (P (i)) & G (P (i)) \\ G^{'} (P (i)) & R (P (i)) \end{matrix}) (\begin{matrix} x (t) \\ u (t) \end{matrix})]$ (13)

取 $S_{1} (t) = M (t) - R {(P (i))}^{†} R (P (i)) M (t)$ ， $S_{2} (t) = m (t) - R {(P (i))}^{†} R (P (i)) m (t)$ .

由广义逆矩阵性质，有 $R (P (i)) S_{i} (t) = R {(P (i))}^{†} S_{i} (t)$ ， $G (P (i)) S_{i} (t) = 0, i = 1, 2$ ，ICGARE(10)有唯一解 $P \in ℍ_{\infty}^{n}$ ，则由配方法可得，

$\begin{array}{l} J (x_{0}, i, u (\cdot)) = {x^{'}}_{0} P (i) x_{0} + E \sum_{t = 0}^{\infty} {u (t) + [R {(P (i))}^{†} G^{'} (P (i)) + S_{1} (t)] x (t) + S_{2} (t)}^{'} \\ R (P (i)) {u (t) + [R {(P (i))}^{†} G^{'} (P (i)) + S_{1} (t)] x (t) + S_{2} (t)} \end{array}$ (14)

由此，在(11)给定的最优控制下，最优值函数则为 ${x^{'}}_{0} P (i) x_{0}$ 。

(必要性)首先证明ICGARE (10)有一个最大值解。

考虑下列对称矩阵凸集

$P (i) = {P (i) \in S_{n} | (\begin{matrix} Q (P (i)) & G (P (i)) \\ G^{'} (P (i)) & R (P (i)) \end{matrix}) \geq 0, i \in D}$ (15)

因为不定LQ控制(6)~(7)是可达的，由 [16] 可知，值函数的二次形式为 $V (x_{0}) = {x^{'}}_{0} P (i) x_{0}$ ，若 $P (i) \neq ϕ$ ，令 $\bar{P} (i)$ 为 $P (i)$ 中任意元素，由(12)则有

$\begin{matrix} J (x_{0}, i, u (\cdot)) = {x^{'}}_{0} \bar{P} (i) x_{0} + E [\sum_{t = 0}^{\infty} {(\begin{matrix} x (t) \\ u (t) \end{matrix})}^{'} (\begin{matrix} Q (\bar{P} (i)) & G (\bar{P} (i)) \\ G^{'} (\bar{P} (i)) & R (\bar{P} (i)) \end{matrix}) (\begin{array}{l} x (t) \\ u (t) \end{array})] \\ \geq {x^{'}}_{0} \bar{P} (i) x_{0} \end{matrix}$ (16)

进一步则有 $V (x_{0}) = {x^{'}}_{0} P (i) x_{0} \geq {x^{'}}_{0} \bar{P} (i) x_{0}$ ，可得 $P (i) \geq \bar{P} (i), i \in D$

现证 $P (i) \in P (i)$ ，应用动态规划法 [17] 则有

${x^{'}}_{0} P (i) x_{0} \leq E {\sum_{t = 0}^{s - 1} x {(t)}^{'} Q (η_{t}) x (t) + u {(t)}^{'} R (η_{t}) u (t) + x {(s)}^{'} P (η_{s}) x (s)}$ (17)

利用(11)，并令 $s = 1$ ，则有

$E [{(\begin{matrix} x (0) \\ u (0) \end{matrix})}^{'} (\begin{matrix} Q (P (i)) & G (P (i)) \\ G^{'} (P (i)) & R (P (i)) \end{matrix}) (\begin{matrix} x (0) \\ u (0) \end{matrix})] \geq 0$ (18)

由 $x (0)$ 和 $u (0)$ 的任意性，由上式可得

$(\begin{matrix} Q (P (i)) & G (P (i)) \\ G^{'} (P (i)) & R (P (i)) \end{matrix}) \geq 0$ (19)

这表明 $P (i)$ 为 $P (i)$ 中最大元素，由Schur引理 [18] ，则有

${\begin{cases} Q (P (i)) - G (P (i)) R {(P (i))}^{†} G^{'} (P (i)) \geq 0 \\ {I - R {(P (i))}^{†} R (P (i))} G^{'} (P (i)) = 0 \\ R (P (i)) \geq 0 i \in D \end{cases}$ (20)

再令 $u^{*} (t)$ 和 $x^{*} (t)$ 为最优控制和最优轨迹，类似(13)的证明，则有

$\begin{matrix} V (x_{0}) = J (x_{0}, i, u^{*} (\cdot)) \\ = {x^{'}}_{0} P (i) x_{0} + E \sum_{t = 0}^{\infty} x^{*} {(t)}^{'} [Q (P (i)) - G (P (i)) R {(P (i))}^{†} G^{'} (P (i))] x^{*} (t) \\ + \sum_{t = 0}^{\infty} {[u^{*} (t) + R {(P (i))}^{†} G^{'} (P (i)) x^{*} (t)]}^{'} R (P (i)) [u^{*} (t) + R {(P (i))}^{†} G^{'} (P (i)) x^{*} (t)] \end{matrix}$ (21)

又有 $V (x_{0}) = {x^{'}}_{0} P (i) x_{0}$ ，由(20)和(21)有

$Q (P (i)) - G (P (i)) R {(P (i))}^{†} G^{'} (P (i)) = 0$ (22)

$R {(P (i))}^{\frac{1}{2}} [u^{*} (t) + R {(P (i))}^{†} G^{'} (P (i)) x^{*} (t)] = 0$ (23)

由(22)可知 $P (i)$ 为ICGARE (10)的解，又由 $\bar{P} (i)$ 的任意性，则 $P (i)$ 为ICGARE(10)的最大值解。

其次，证明 $P (i)$ 为稳定解，由 $R (P (i)) u^{*} (t) + G^{'} (P (i)) x^{*} (t) = 0$ ，由引理3可解 $u^{*} (t) = - R {(P (i))}^{†} G^{'} (P (i)) x^{*} (t) - [I - R {(P (i))}^{†} R (P (i))] m (t)$ 令 $M (t) = 0$ ， $S = - m (t)$ ，则ICGARE (10)有稳定解。

最后证唯一性，令 $P_{1} (i)$ 和 $P_{2} (i)$ 为ICGARE (10)的两个解，由于 $V (x_{0}) = {x^{'}}_{0} P_{1} (i) x_{0} = {x^{'}}_{0} P_{2} (i) x_{0}$ ，所以 $P_{1} (i) = P_{2} (i)$ ，证毕。

考虑下列关系两个二次性能指标的纳什博弈问题：

$J_{1} (x_{0}, i, u^{*} (\cdot), v (\cdot)) = E \sum_{t = 0}^{\infty} [γ^{2} {‖ v (t) ‖}^{2} - {‖ z (t) ‖}^{2} | η_{0} = i]$ (24)

$J_{2} (x_{0}, i, u (\cdot), v^{*} (\cdot)) = E \sum_{t = 0}^{\infty} [{‖ z (t) ‖}^{2} | η_{0} = i]$ (25)

此处 $γ > 0$ 为给定的扰动衰减水平。

定义3 若

$J_{1} (x_{0}, i, u^{*} (\cdot), v^{*} (\cdot)) \leq J_{1} (x_{0}, i, u^{*} (\cdot), v (\cdot))$ (26)

$J_{2} (x_{0}, i, u^{*} (\cdot), v^{*} (\cdot)) \leq J_{2} (x_{0}, i, u (\cdot), v^{*} (\cdot))$ (27)

则称策略对 $(u^{*} (\cdot), v^{*} (\cdot)) \in l^{2} (Z_{+}; R^{n_{u}}) \times l^{2} (Z_{+}; R^{n_{v}})$ 为纳什均衡点。

接下来，在定理1的基础上，给出线性反馈纳什均衡点存在的充要条件。

定理2 对于系统(1)，若 $(A | C; P)$ , $(A + B K_{1} | C; P)$ 为强可检测的，则(26)，(27)有一线性反馈纳什均衡点 $(u^{*} (\cdot), v^{*} (\cdot)) = (K_{2} (η_{t}) x (t), K_{1} (η_{t}) x (t))$ ，此为最优策略当且仅当

${\begin{cases} \sum_{k = 0}^{r} {[A_{k} (i) + G_{k} (i) K_{2} (i)]}^{'} P_{1} (i) [A_{k} (i) + G_{k} (i) K_{2} (i)] \\ - C {(i)}^{'} C (i) - K_{2} {(i)}^{'} K_{2} (i) - P_{1} (i) - L_{1} (i) Φ_{1} {(i)}^{†} L_{1} {(i)}^{'} = 0 \\ (I - Φ_{1} (i) Φ_{1} {(i)}^{†}) L_{1} (i) = 0 \\ Φ_{1} (i) \geq 0 \end{cases}$ (28)

$K_{1} (i) = - Φ_{1} {(i)}^{†} L_{1} {(i)}^{'}$ (29)

${\begin{cases} \sum_{k = 0}^{r} {[A_{k} (i) + B_{k} (i) K_{1} (i)]}^{'} P_{2} (i) [A_{k} (i) + B_{k} (i) K_{1} (i)] + C {(i)}^{'} C (i) - P_{2} (i) - L_{2} (i) Φ_{2} {(i)}^{- 1} L_{2} {(i)}^{'} = 0 \\ Φ_{2} (i) > 0 \end{cases}$ (30)

$K_{2} (i) = - Φ_{2} {(i)}^{- 1} L_{2} {(i)}^{'}$ (31)

有一组解 $(P_{1} (i), K_{1} (i), P_{2} (i), K_{2} (i))$ ，且对任意 $i \in D$ ，满足 $P_{1} (i) \leq 0$ ， $P_{2} (i) \geq 0$ 。

其中， $Φ_{1} (i) = γ^{2} I + \sum_{k = 0}^{r} B_{k} {(i)}^{'} P_{1} (i) B_{k} ( i )$

$Φ_{2} (i) = I + \sum_{k = 0}^{r} G_{k} {(i)}^{'} P_{2} (i) G_{k} ( i )$

$L_{1} (i) = \sum_{k = 0}^{r} {[A_{k} (i) + G_{k} (i) K_{2} (i)]}^{'} P_{1} (i) B_{k} ( i )$

$L_{2} (i) = \sum_{k = 0}^{r} {[A_{k} (i) + B_{k} (i) K_{1} (i)]}^{'} P_{2} (i) G_{k} ( i )$

证明 (充分性)因为ICGARE (28)~(31)有一组解 $(P_{1} (i), K_{1} (i), P_{2} (i), K_{2} (i))$ 且 $P_{1} (i) \leq 0$ ， $P_{2} (i) \geq 0$ ，设 $u^{*} (t) = K_{2} (η_{t}) x (t)$ ， $v^{*} (t) = K_{1} (η_{t}) x (t)$ ，将 $u^{*} (t)$ 带入(1)，则有

${\begin{cases} x (t + 1) = (A_{0} (η_{t}) + G_{0} (η_{t}) K_{2} (t)) x (t) + B_{0} (η_{t}) v (t) \\ + \sum_{k = 1}^{r} {(A_{k} (η_{t}) + G_{k} (η_{t}) K_{2} (t)) x (t) + B_{k} (η_{t}) v (t)} ω_{k} (t) \\ z (t) = (\begin{matrix} C (η_{t}) \\ D (η_{t}) K_{2} (t) \end{matrix}) x (t) D {(η_{t})}^{'} D (η_{t}) = I_{n_{u}} \\ x (0) = x_{0} \in R^{n} η (0) = η_{0} \in D t \in Z_{+} \end{cases}$ (32)

性能指标(24)可写作

$J_{1} (x_{0}, i, u^{*} (\cdot), v (\cdot)) = E \sum_{t = 0}^{\infty} [γ^{2} v {(t)}^{'} v (t) - x {(t)}^{'} (C {(η_{t})}^{'} C (η_{t}) + K_{2} {(t)}^{'} K_{2} (t)) x (t) | η_{0} = i]$ (33)

注意到在(32)的约束下，对容许控制集下的(33)取最小值，这是不定LQ问题，其中控制加权矩阵 $R (η_{t}) = γ^{2} I$ ， $Q (η_{t}) = - [C {(η_{t})}^{'} C (η_{t}) + K_{2} {(t)}^{'} K_{2} (t)]$ 。由引理1， $(A + B K_{1} | C; P)$ 为强可检测的，则 $(A + B K_{1} + G K_{2} | C_{2}; P)$ 也为强可检测的，且(30)可写作

$\sum_{k = 0}^{r} {[A_{k} (i) + B_{k} (i) K_{1} (i) + G_{k} (i) K_{2} (i)]}^{'} P_{2} (i) [A_{k} (i) + B_{k} (i) K_{1} (i) + G_{k} (i) K_{2} (i)] + C_{2} {(i)}^{'} C_{2} (i) - P_{2} (i) = 0$ (34)

此处 $C_{2} (i)$ 与引理1中定义相同。根据引理2， $(A + B K_{1} + G K_{2}; P)$ 是EMSS-C的。基于定理1和(28)， $v^{*} (t) = K_{1} (η_{t}) x (t)$ ， $K_{1} (i) = - Φ_{1} {(i)}^{†} L_{1} {(i)}^{'}$ 为不定LQ问题的最优控制。这说明 $J_{1} (x_{0}, i, u^{*} (\cdot), v^{*} (\cdot)) \leq J_{1} (x_{0}, i, u^{*} (\cdot), v (\cdot))$ 。

同理，取 $v (t) = v^{*} (t) = K_{1} (η_{t}) x (t)$ 带入(1)中，得到

${\begin{cases} x (t + 1) = (A_{0} (η_{t}) + B_{0} (η_{t}) K_{1} (t)) x (t) + G_{0} (η_{t}) u (t) \\ + \sum_{k = 1}^{r} {(A_{k} (η_{t}) + B_{k} (η_{t}) K_{1} (t)) x (t) + G_{k} (η_{t}) u (t)} ω_{k} (t) \\ z (t) = (\begin{matrix} C (η_{t}) x (t) \\ D (η_{t}) u (t) \end{matrix}) D {(η_{t})}^{'} D (η_{t}) = I_{n^{u}} \\ x (0) = x_{0} \in R^{n} η (0) = η_{0} \in D t \in Z_{+} \end{cases}$ (35)

则在(35)得约束下，带有控制加权矩阵 $R (η_{t}) = I$ 和控制加权矩阵 $Q (η_{t}) = C {(η_{t})}^{'} C (η_{t})$ 的 $J_{2} (x_{0}, i, u (\cdot), v^{*} (\cdot))$ 取最小值为得标准LQ问题。由定理1和(30)可得到 $u^{*} (\cdot) = K_{2} (η_{t}) x (t)$ ， $K_{2} (i) = - Φ_{2} {(i)}^{- 1} L_{2} {(i)}^{'}$ 使得 $J_{2} (x_{0}, i, u (\cdot), v^{*} (\cdot))$ 可取最小值，因此 $J_{2} (x_{0}, i, u^{*} (\cdot), v^{*} (\cdot)) \leq J_{2} (x_{0}, i, u (\cdot), v^{*} (\cdot))$ 。

(必要性)假设纳什博弈(26)~(27)有线性反馈纳什均衡点 $(u^{*} (\cdot), v^{*} (\cdot)) = (K_{2} (η_{t}) x (t), K_{1} (η_{t}) x (t))$ ，不定LQ控制是可达的，且 $v^{*} (\cdot)$ 为指数稳定，则 $(A + B K_{1} + G K_{2}; P)$ 是EMSS-C。结合(26)和(32)充分利用定理1，取 $R (η_{t}) = γ^{2} I$ ， $Q (η_{t}) = - [C {(η_{t})}^{'} C (η_{t}) + K_{2} {(t)}^{'} K_{2} (t)]$ ，则(28)有解 $P_{1} = (P_{1} (1), P_{1} (2), \dots) \in ℍ_{\infty}^{n}$ ，

$v^{*} (t) = K_{1} (η_{t}) x (t) = - Φ_{1} {(i)}^{- 1} L_{1} {(i)}^{'} x (t)$ ， $J_{1} (x_{0}, i, u^{*} (\cdot), v^{*} (\cdot)) = {x^{'}}_{0} P_{1} (i) x_{0}$ 。

下证 $P_{1} (i) \leq 0, P_{2} (i) \geq 0, i \in D$ 。首先由 $J_{1} (x_{0}, i, u (\cdot), v (\cdot))$ 定义，可看出

$\begin{matrix} {x^{'}}_{0} P_{1} (i) x_{0} = J_{1} (x_{0}, i, u^{*} (\cdot), v^{*} (\cdot)) \\ \leq J_{1} (x_{0}, i, u^{*} (\cdot), 0) \\ = E \sum_{t = 0}^{\infty} [- {‖ z (t) ‖}^{2} | η_{0} = i] \\ \leq 0 \end{matrix}$ .

进一步，对任意 $x_{0} \in R^{n}$ ，可推断 $P_{1} (i) \leq 0, i \in D$ 。若系统(1)中取 $v (t) = v^{*} (t) = K_{1} (η_{t}) x (t)$ ，则可得(35)，由 [19] 定理4，可知存在 $P_{2} = (P_{2} (1), P_{2} (2), \dots) \in ℍ_{\infty}^{n +}$ 为(30)的稳定解。而且 $J_{2} (x_{0}, i, u^{*} (\cdot), v^{*} (\cdot)) = {x^{'}}_{0} P_{2} (i) x_{0}$ ，其中 $u^{*} (\cdot) = K_{2} (η_{t}) x (t) = - Φ_{2} {(i)}^{- 1} L_{2} {(i)}^{'} x (t)$ 。

4. 总结

本文研究了具有无限马尔可夫跳跃和 $(x, u, v)$ -独立噪声的SDEs的无限时域线性二次纳什对策。我们给出了所考虑系统的一个不定LQ纳什对策，在此基础上，用黎卡提方程的可解性提出了纳什均衡点存在的充要条件。可将此理论应用到H₂/H_∞控制研究中。

NOTES

^*通讯作者。

参考文献

[1]	Dockner, E.J., Jørgensen, N.V. and Long, N.V. (2000) Differential Games in Economics and Management Science. Cambridge University Press, Cambridge. [Google Scholar] [CrossRef]
[2]	Chen, B.S., Tseng, C.S. and Uang, H.J. (2002) Fuzzy Differential Games for Nonlinear Stochastic Systems: Suboptimal Approach. IEEE Transactions on Fuzzy Systems, 10, 222-233. [Google Scholar] [CrossRef]
[3]	Wang, G. and Yu, Z. (2010) A Pontryagin’s Maximum Principle for Non-Zero Sum Differential Games of BSDEs with Applications. IEEE Transac-tions on Automatic Control, 55, 1742-1747. [Google Scholar] [CrossRef]
[4]	Wang, G. and Yu, Z. (2012) A Partial Information Non-Zero Sum Differential Game of Backward Stochastic Differential Equations with Ap-plications. Auto, 48, 342-352. [Google Scholar] [CrossRef]
[5]	Mao, W., Deng, F. and Wan, A. (2016) Robust H2∕H∞ Global Linearization Filter Design for Nonlinear Stochastic Time-Varying Delay Systems. Sci-ence China-Information Sciences, 59, Article No. 32204. [Google Scholar] [CrossRef]
[6]	Lin, Y., Zhang, T. and Zhang, W. (2018) Infinite Horizon Linear Quadratic Pareto Game of the Stochastic Singular Systems. Journal of the Franklin Institute, 355, 4436-4452. [Google Scholar] [CrossRef]
[7]	Ding, X., Li, H. and Alsaadi, F.E. (2020) Regulation of Game Result for n-Person Random Evolutionary Boolean Games. Asian Journal of Control, 22, 2353-2362.
[8]	Basar, T. and Olsder, G.J. (1999) Dynamic Noncooperative Game Theory. SIAM, Philadelphia. [Google Scholar] [CrossRef]
[9]	Dragan, V. and Ivanov, I.G. (2017) Sufficient Conditions for Nash Equilibrium Point in the Linear Quadratic Game for Markov Jump Positive Systems. IET Control Theory & Applications, 11, 2658-2667. [Google Scholar] [CrossRef]
[10]	Hou, T., Zhang, W. and Ma, H. (2013) A Game-Based Control De-sign for Discrete-Time Markov Jump Systems with Multiplicative Noise. IET Control Theory & Applications, 7, 773-783. [Google Scholar] [CrossRef]
[11]	Liu, Y. and Hou, T. (2020) Infinite Horizon LQ Nash Games for SDEs with Infinite Jumps. Asian Journal of Control, 23, 2431-2443. [Google Scholar] [CrossRef]
[12]	Dragan, V., Morozan, T. and Stoica, A.M. (2013) Mathematical Methods in Robust Control of Linear Stochastic Systems. 2nd Edition, Springer, New York. [Google Scholar] [CrossRef]
[13]	Liu, Y.Y., Hou, T. and Bai, X.Z. (2017) Infinite Horizon H2∕H∞ Optimal Control for Discrete-Time Infinite Markov Jump Systems with (x, u, v)-Dependent Noise. 2017 IEEE 36th Chi-nese Control Conference (CCC), Dalian, 26-28 July 2017, 1955-1960. [Google Scholar] [CrossRef]
[14]	Hou, T. and Ma, H. (2016) Exponential Stability for Dis-crete-Time Infinite Markov Jump Systems. IEEE Transactions on Automatic Control, 61, 4241-4246. [Google Scholar] [CrossRef]
[15]	Albert, A. (1969) Conditions for Positive and Nonnegative Defi-niteness in Terms of Pseudoinverses. SIAM Journal on Applied Mathematics, 17, 434-440. [Google Scholar] [CrossRef]
[16]	Anderson, B.D.O. and Moore, J.B. (1989) Optimal Control: Linear Quadratic Methods. Prentice-Hall, Englewood Cliffs.
[17]	周海英, 张成科, 朱怀念. 离散Markov切换系统的随机Nash博弈及H2/H∞控制[J]. 控制工程, 2016, 23(6): 828-833.
[18]	Ungureanu, V.M. (2014) Optimal Control for Infinite Di-mensional Stochastic Differential Equations with Infinite Markov Jumps and Multiplicative Noise. Journal of Mathemat-ical Analysis and Applications, 417, 694-718. [Google Scholar] [CrossRef]
[19]	Hou, T., Wang, J., Liu, Y., et al. (2017) Control for MJLS with Infinite Markov Chain. Mathematical Problems in Engineering, 2017, Article ID: 9038469. [Google Scholar] [CrossRef]

为你推荐

友情链接