一类二人微分博弈Nash均衡的本质连通区
Essential Component of Nash Equilibria for a Class of Two-Person Differential Games
DOI: 10.12677/ORF.2021.113031, PDF, HTML, XML, 下载: 392  浏览: 1,808  国家自然科学基金支持
作者: 计 伟:贵州建设职业技术学院信息管理学院,贵州 贵阳
关键词: 本质连通区极小本质集Nash均衡上半连续紧映射Essential Component Minimal Essential Set Nash Equilibria Upper Semi-Continuous with Compact Valued
摘要: 应用集值分析理论,证明了控制系统关于右端函数发生扰动时,一类二人微分博弈问题Nash均衡集存在极小本质集和本质连通区。
Abstract: By employing the set-valued analysis theory, we show that the existence of minimal essential set and essential component for Nash equilibrium point set of against the perturbation of the right-hand side function of control system for a class of two-person differential games.
文章引用:计伟. 一类二人微分博弈Nash均衡的本质连通区[J]. 运筹与模糊学, 2021, 11(3): 268-273. https://doi.org/10.12677/ORF.2021.113031

1. 引言

博弈论是自1944年 [1] John Von Neumann和Oskar Morgenstern合著出版《Theory of Games and Economic Behavior》一书而宣告诞生,该书主要介绍矩阵博弈、零和博弈、及合作博弈,同样他们的工作孕育着微分博弈的思想。微分博弈以R. Isaacs于1965年 [2] 的专著《Differential Games》为其主要标志,是指博弈参与人在进行博弈活动时,参与人从各自的控制集中选择控制策略,策略间的相互作用要通过的状态由微分方程(微分系统或状态方程)来描述的博弈。1971年 [3],A. Friedman在起其专著《Differential Games》中,应用离散近似序列的方法建立了微分博弈的值与鞍点的存在性,奠定了微分博弈的数学理论。

国内关于微分博弈的最早专著是1987年 [4],由科学出版社出版,东北大学张嗣瀛院士编著的《微分对策》。2000年 [5],由国防科技大学李登峰教授编著,国防工业出版社出版的《微分对策及其应用》,该专著是国内第一部从数学角度详细、系统介绍微分对策的概念、理论、方法及其应用的专著。

此外,2015年 [6],J. M. Yong编著的《Differential Games (A concise introduction)》,对近年来关于二人零和微分博弈、无界控制微分博弈、追逃微分博弈、线性二次微分博弈和切换系统微分博弈等的研究进行了详细阐述,并撰写了大量的研究评注以及列举了大量参考文献。

无论是一般非合作博弈,合作博弈,还是微分博弈的研究,其解的存在性和稳定性都是研究热点问题,也是基础问题。同时,我们也深知,相对存在性的研究,其稳定性研究更复杂、更本质。事实上,对一般博弈模型,我们不仅关心博弈均衡的存在性,因为对大多数博弈问题,Nash均衡是存在的,但通常不唯一,甚至许多博弈模型存在无穷多均衡解,这就给博弈参与人带来选择困难,甚有可能博弈的结果是非博弈均衡点。此外,当我们研究问题的环境或参数发生微小改变时,改变后的博弈问题是否还存在博弈均衡点?若存在,对其均衡点的影响是大还是小?这些就是稳定性问题。

事实上,关于稳定性研究,有许多专家学者已经做了大量富有成效的研究工作。1950年 [7],Fort为研究连续映射不动点的稳定性,引入了本质不动点的概念。1962年 [8],W. T. Wu和J. H. Jiang对有限N人非合作博弈首先引入了本质Nash平衡点的概念。1963年 [9],J. H. Jiang进一步对有限N人非合作博弈首先引入了Nash平衡点集本质连通区的概念,并证明了对任何有限N人非合作博弈,其Nash均衡集至少存在一个本质连通区。1986年 [10],Kohlberg和Mertens研究了均衡策略稳定性,他们应用代数几何的方法证明了每个有限博弈的Nash平衡点集由有限个连通区组成,而且其中至少有一个是本质的。之后,本质稳定性的概念被广泛用于最优化问题、不动点问题、向量优化问题、无限博弈Nash均衡问题等(见文献 [11] 及其相应的引用文献)。J. Yu和S. W. Xiang [12],以及J. Yu和H. Yang [13],应用集值分析方法,先后在1999年和2004年,分别证明了Nash均衡点集的本质连通区,以及集值映射均衡点集的本质连通区。

特别地,在2020年 [14],J. Yu和D. T. Peng讨论了非合作微分博弈平衡点集的通有稳定性,他们证明了微分博弈均衡点集形成一个稠密剩余集,并且任何一个微分博弈都可以通过一个稳定博弈任意逼近,也就是在Baire分类意义下,大多数微分博弈是通有稳定的。实质上,早在2014年 [15],J. Yu等人,也是基于集值映射理论,研究了经典最优控制关于状态方程右端函数扰动时的通有稳定性。受到 [15] 的启发,2015年 [16]、 [17],H. Y. Deng和W. Wei已先后基于集值映射理论,应用非线性方法,状态方程关于右端函数扰动时,分别研究了具有一阶等度连续的非线性最优控制的通有稳定性,以及半线性发展方程支配的目标泛函为二次型时,最优控制问题的通有稳定性。

受到以上文献的启发,应用文献 [18] 的存在性结果,我们构造一个完备度量空间,应用集值分析的方法,证明了一类微分博弈关于控制系统关于右端函数发生扰动时,对应的Nash均衡点集至少存在一个极小本质集,每个极小本质集都是连通的,以及本质连通区的存在性。

2. 模型和预备知识

我们考虑如下的控制系统支配的二人微分博弈模型。设 R p R q 是实Euclidean空间, U R p V R q 是度量空间,对任意的 0 s < t 1 ,

U * [ s , t ] = { u ( ) | u ( ) : [ s , t ] U } V * [ s , t ] = { v ( ) | v ( ) : [ s , t ] V }

函数 u ( ) U * [ s , t ] v ( ) V * [ s , t ] 分别叫做参与人1和2的控制过程,也即参与人1和2分别从控制选择集 U V 中选择控制。考虑如下的状态方程:

{ d x d t = A ( t ) X ( t ) + B ( t ) u ( t ) + C ( t ) v ( t ) , t [ 0 , 1 ] x ( 0 ) = x 0 (2.1)

为了度量控制过程 u ( ) v ( ) 的性能指标,我们引入如下的目标泛函:

P 1 ( u ( ) , v ( ) ) = 0 1 F 1 ( t ) u ( t ) d t + 0 1 G 1 ( t ) v ( t ) d t + H 1 ( x ) (2.2)

P 2 ( u ( ) , v ( ) ) = 0 1 F 2 ( t ) u ( t ) d t + 0 1 G 2 ( t ) v ( t ) d t + H 2 ( x ) (2.3)

我们定义如下的博弈问题。

博弈(DG):对任意的 ( u ( ) , v ( ) ) U * [ 0 , 1 ] × V * [ 0 , 1 ] ,若存在 ( u * ( ) , v * ( ) ) U * [ 0 , 1 ] × V * [ 0 , 1 ] ,使得下式成立:

P 1 ( u * ( ) , v * ( ) ) = sup u ( ) U * [ 0 , 1 ] P 1 ( u ( ) , v * ( ) ) P 2 ( u * ( ) , v * ( ) ) = sup v ( ) V * [ 0 , 1 ] P 2 ( u * ( ) , v ( ) )

则称 ( u * ( ) , v * ( ) ) 是Nash均衡点。

现在,我们引入如下假设。

[C1] 控制取值集 U V 分别是 R p R q 中的紧凸集。

[C2] A ( t ) , B ( t ) , C ( t ) 分别是定义在 [ 0 , 1 ] 上连续的 n × n n × p n × q 维矩阵。

[C3] F 1 G 1 F 2 G 2 均是定义在 [ 0 , 1 ] 上的连续函数。 H 1 H 2 则是定义在 C [ 0 , 1 ] 上的连续线性函数。

1975年 [18],T. Parthasarathy和T. E. Raghvan在以上假设条件下,证明了Nash均衡点的存在性结果。

引理2.1 [18] 假设[C1]~[C3]成立,给定初始对 ( 0 , x 0 ) ,则博弈(DG)存在Nash均衡点。

下面,为研究本质连通区的存在性,我们构造如下的问题空间。不妨设

f ( t , X ( t ) , u ( t ) , v ( t ) ) = A ( t ) X ( t ) + B ( t ) u ( t ) + C ( t ) v ( t )

M = { f | f [ C 2 ] }

f g M ,定义距离为:

d ( f , g ) = sup ( t , x , u , v ) [ 0 , 1 ] × R n × U × V f ( t , x , u , v ) g ( t , x , u , v )

则容易证明 ( M , d ) 是一个完备度量空间。

定义2.2:设

N ( f ) = { ( u * ( ) , v * ( ) ) | f M , ( u * ( ) , v * ( ) ) ( DG ) Nash }

N : f N ( f ) 定义了一个 M U × V 集值映射,记为 N : M 2 U × V

为研究其解集的本质连通区,根据文献 [11],我们引入如下必要的定义和引理。

定义2.3: f M N ( f ) 是一个非空集合,对 2 U × V 中的任意开集 G G N ( f ) ( G N ( f ) ) ,若存在 V 的任意开领域 O ( f ) ,使得 g O ( f ) ,有 O N ( f ) ( O N ( g ) ) ,称集值映射 N f 上半连续(下半连续)。若集值映射 N f 既上半连续,又下半连续,则称 N f 连续。若 f M ,集值映射 N f 上半连续(下半连续、连续),则称 N M 上半连续(下半连续、连续)。

定义2.4:若 f M N ( f ) 是一个非空紧集,且 N f 上半连续,则称 N 是一个上半连续紧映射(USCO)。

定义2.5:称 Graph N ( f ) = { ( f , u , v ) M × U × V | ( u , v ) N ( f ) } N 的图像,若 N 的图像 Graph N ( S ) 是闭的,则称集值映射 N 为闭映射。

引理2.4:设集值映射 N : M 2 U × V 是闭的,且 U × V 是紧集,则 N 是一个上半连续映射。

下面,我们给出一个关于集值映射 N 的结论。

定理2.1集值映射 N : M 2 U × V 是一个上半连续的紧映射(USCO)。

证明:因 U 是紧集,而 f M N ( f ) U × V ,所以再由引理2.1可知,我们只需证明集值映射 S 的图像 Graph ( S ) = { ( f , u , v ) M × U × V : u × v S ( f ) } 为闭即可。即证明 f n M , f n f , ( u n , v n ) S ( f n ) ( u n , v n ) ( u * , v * ) ,则 ( u * , v * ) S ( f )

( u n , v n ) S ( f n ) ,所以 ( u , v ) U × V ,我们得到: P 1 ( u n , v n ) P 1 ( u n , v ) P 2 ( u n , v n ) P 2 ( u , v n ) 。又因为 u ( ) v ( ) 连续,并且积分区间为有限区间。因此,通过假(C3),令 n ( u , v ) U × V ,我们可得到 P 1 ( u * , v * ) P 1 ( u * , v ) P 2 ( u * , v * ) P 2 ( u , v * ) 。因此, ( u * , v * ) S ( f ) 。即:集值映射 N 是一个上半连续的紧映射。

3. 本质连通区

这一节,我们将给出本质连通区和极小本质集的存在性结论。因此,我们先给出本质集、极小本质集、本质连通区的定义。

定义4.1: f M ,设 d ( f ) N ( f ) 中的非空闭子集,如果对 2 U × V 中任意开集 O O d ( f ) δ > 0 ,使得 f M ρ ( f , f ) < δ ,有 N ( f ) O ,则称 d ( f ) N ( f ) 中本质集。

定义4.2:设 m ( f ) N ( f ) 的本质集,且是 N ( f ) 中所有本质集按包含关系为序的极小元,则称 m ( f ) N ( f ) 极小本质集。显然若 N ( f ) 极小本质集存在,则它不一定是唯一的。

定义4.3:若 N ( f ) 可以分解为有限或无限个两两不相交的连通区的并集,即

N ( f ) = i I C i ( f )

其中 Ι 是一个指标集。若存在 N ( f ) 的一个连通区 C i ( f ) N ( f ) 本质集,则称 C i ( f ) N ( f ) 一个本质连通区。

定理4.1: f M N ( f ) 至少存在一个极小本质集。

证明:由定理2.3知道, 集值映射 N : M 2 U × V 是一个上半连续的紧映射,即对 U × V 的任意开集 O ,且 O N ( f ) ,则存在 δ > 0 ,使得 f M ,当 ρ ( f , f ) < δ 时, O N ( f ) 。因此, N ( f ) 是它本身的一个本质集。设 θ 是以包含关系为序,且由所有本质集组成的集合,且 θ 是一个半序集,且 θ ,下令 e ( f ) = i Ι e i ( f ) ,其中 { e i ( f ) : i Ι } θ 中的全序子集,不难验证 e ( f ) 为紧集, e ( f ) ,且 e ( f ) 显然是递减的。 θ 中任意全序子集 { e i ( f ) : i Ι } 必有下界 e ( f ) ,由Zorn引理, θ 必有极小元,因而极小元必是的 N ( f ) 的极小本质集。

定理4.2: f M N ( f ) 的每个极小本质集都是连通的。

证明:用反证法给予证明,设 m ( f ) N ( f ) 的极小本质集,而 m ( f ) 不是连通的,则存在两个非空闭集 C 1 ( f ) , C 2 ( f ) ,和两个开集 W 1 , W 2 ,使得 W 1 C 1 ( f ) , W 2 C 2 ( f ) m ( f ) = C 1 ( f ) C 2 ( f ) ,而 W 1 W 2 = 。因 m ( f ) 是极小本质集,故 C 1 ( f ) , C 2 ( f ) 都不是 N ( f ) 的本质集,所以存在两个开集 G 1 , G 2 G 1 C 1 ( f ) , G 2 C 2 ( f ) ,而 δ > 0 ρ ( f , f 1 ) < δ , ρ ( f , f 2 ) < δ ,而 N ( f 1 ) G 1 = N ( f 2 ) G 2 = ,记 U 1 = W 1 G 1 U 2 = W 2 G 2 ,则 U 1 , U 2 是开集,则 U 1 C 1 ( f ) , U 2 C 2 ( f ) ,且 U 1 U 2 = ,存在两个开集 V 1 , V 2 ,使得 C 1 ( f ) V 1 V ¯ 1 U 1 C 2 ( f ) V 2 V ¯ 2 U 2 ,显然 N ( f 1 ) V ¯ 1 = N ( f 2 ) V ¯ 2 = V ¯ 1 V ¯ 2

因此,存在 f ˜ M ,使得, ρ ( f ˜ , f 1 ) ρ ( f 1 , f 2 ) ρ ( f , f 1 ) + ρ ( f , f 2 ) < 2 δ ρ ( f ˜ , f 2 ) ρ ( f 1 , f 2 ) ρ ( f , f 1 ) + ρ ( f , f 2 ) < 2 δ ,而 N ( f ˜ ) ( V ¯ 1 V ¯ 2 ) = 。因 V 1 V 2 是开集,且 V 1 V 2 C 1 ( f ) C 2 ( f ) = m ( f ) ,而 ρ ( f ˜ , f ) ρ ( f , f 1 ) + ρ ( f ˜ , f 1 ) < 3 δ 。这显然与 N ( f ˜ ) ( V 1 V 2 ) = 矛盾。因此, m ( f ) N ( f ) 的极小本质集。

定理4.3: f M N ( f ) 至少存在一个本质连通区。

证明:由定理4.1和定理4.2, N ( f ) 至少有一个极小本质集 e ( f ) ,且 e ( f ) 是连通的,故 i Ι ,使 e ( f ) C i ( f ) ,对 U 中任意开集 O O C i ( f ) ,则 O e ( f ) ,因 e ( f ) 是本质的, δ > 0 ,使得 f M ρ ( f , f ) < δ ,有 N ( f ) O ,于是连通区 C i ( f ) 是本质的。

4. 结论

应用集值分析理论,文献 [14] [15] [16] [17] 开启了从整体上考虑问题对象发展扰动时,微分博弈的稳定性研究。本文基于集值映射理论,应用非线性方法,讨论了一类特殊的二人微分博弈控制系统关于右端函数发生扰动时,Nash均衡本质连通区和极小本质集的存在性。

基金项目

国家自然科学基金(11661020)。

参考文献

[1] Von Neumann, J. and Morgenstern, O. (1944) Theory of Games and Economic Behavior. Princeton University Press, Princeteon.
[2] Isaacs, R. (1965) Differential Games. New York, Wiley.
[3] Friedman, A. (1971) Differential Games. New York, Wiley.
[4] 张嗣瀛. 微分博弈[M]. 北京: 科学出版社, 1987.
[5] 李登峰. 微分博弈及其应用[M]. 北京: 国防工业出版社, 2000.
[6] Yong, J.M. (2015) Differential Games (A Concise Introduction). Word Scientific, USA.
https://doi.org/10.1142/9121
[7] Fort, M.K. (1950) Essential and Nonessential Fixed Points. American Journal of Mathematics, 72, 315-322.
https://doi.org/10.2307/2372035
[8] Wu, W.T. and Jiang, J.H. (1962) Essential Equilibrium Points of N-Person Noncooperative Games. Scientia Sincia, 11, 1307-1322.
[9] Jiang, J.H. (1963) Essential Component of the Set of Fixed Points of the Multi-Valued Maps and Its Applications to the Theory of Games. Scientia Sincia, 12, 951-964.
[10] Kohlberg, E. and Mertens, J.F. (1991) On the Strategic Stability of Equilibrium. Springer-Verlag, Berlin.
[11] 俞建. 博弈论与非线性分析[M]. 北京: 科学出版社, 2008.
[12] Yu, J. and Xiang, S.W. (1999) On Essential Components of the Nash Equilibrium Points. Nonlinear Analysis TMA, 38, 259-264.
https://doi.org/10.1016/S0362-546X(98)00193-X
[13] Yu, J. and Yang, H. (2004) The Essential Components of the Set of Equilibrium Points for Set-Valued Maps. Journal of Mathematical Analysis and Applications, 300, 334-342.
https://doi.org/10.1016/j.jmaa.2004.06.042
[14] Yu, J. and Peng, D.T. (2020) Generic Stability of Nash Equilibrium for Noncooperative Differential Games. Operations Research Letters, 48, 157-162.
https://doi.org/10.1016/j.orl.2020.02.001
[15] Yu, J., Liu, Z.X., Peng, D.T., Xu, D.Y. and Zhou, Y.H. (2014) Existence and Stability of Optimal Control. Optimal Control Applications and Methods, 35, 721-729.
https://doi.org/10.1002/oca.2096
[16] Deng, H.Y. and Wei, W. (2015) Existence and Stability for Nonlinear Optimal Control Problems with 1-Mean Equi-Continuous Controls. Journal of Industrial and Management Optimation, 11, 1409-1422.
https://doi.org/10.3934/jimo.2015.11.1409
[17] Deng, H.Y. and Wei, W. (2015) Stability Analysis for Optimal Control Problems Governed by Semilinear Evolution Equation. Advances in Difference Equations, 2015, Article No. 103.
https://doi.org/10.1186/s13662-015-0443-5
[18] Parthasarathy, T. and Raghavan, T.E.S. (1975) Existence of Saddle Points and Nash Equilibrium Points for Differential Games. SIAM Journal on Control, 5, 977-980.
https://doi.org/10.1137/0313060