1. 引言
微分博弈诞生于20世纪50~60年代,尤其以Isaacs [1] 于1965年出版的专著《Differential Games》为主要标志。Isaacs在其专著中指出:微分博弈是指博弈参与人在进行博弈活动时,参与人从各自的控制集中选择控制策略,而策略间的相互作用需要通过的状态是由控制系统来确定。Friedman [2] 于1971年出版的专著《Differential Games》奠定了微分博弈的数学理论,且该专著应用离散近似序列的方法建立了微分博弈的值与鞍点的存在性。张嗣瀛 [3] 于1987年出版的专著《微分对策》,是国内最早关于微分博弈的专著。李登峰 [4] 于2000年出版的专著《微分对策及其应用》,从数学角度详细、系统介绍了微分对策的概念、理论、方法及其应用。此外,华人学者雍炯敏 [5] 于2015年出版的专著《微分博弈简明教程》,对近年来关于二人零和微分博弈、无界控制微分博弈、追逃微分博弈、线性二次微分博弈和切换系统微分博弈等的研究进行了详细阐述。
无论是对一般微分博弈的研究,还是二人零和微分博弈的研究,不仅要研究平衡点的存在性,更要研究平衡点的稳定性。当我们获得解的存在性时,但其解不唯一时,我们就会面临解的选择性困惑。这就很难为决策者提供决策方案。甚至不同参与人选择不同平衡点时,就可能会得到非均衡点,更有可能走向新的博弈,博弈就变得永无止境。因此,对博弈稳定性的研究,变得更本质。
关于稳定性研究,一直以来备受关注,许多专家学者取得了大量研究成果。Fort [6] 于1950年,为研究连续映射不动点的稳定性,引入本质不动点概念。吴文俊和江嘉禾 [7] 于1962年,对有限N人非合作博弈首次引入本质Nash均衡点概念。江嘉禾 [8] 于1963年,进一步对有限N人非合作博弈引入了Nash平衡点集本质连通区概念,并证明了对任何有限N人非合作博弈,其Nash均衡集至少存在一个本质连通区。Kohlberg和Mertens [9] 于1986年,研究了均衡的策略稳定性,应用代数几何的方法证明了每个有限博弈的Nash平衡点集由有限个连通区组成,而且其中至少有一个是本质的。关于稳定性的研究还可参考俞建 [10] 于2008年出版的专著《博弈论与非线性分析》。
Kenderov [11] 于1984年,讨论了大多数优化问题具有唯一解。Ribarska和Kenderov [12] 于1988年,讨论了在Baire纲分类意义下,大多数二人零和微分博弈具有唯一解。陈国强等 [13] 于1995年,应用集值分析方法,讨论了一般二元函数鞍点具有通有唯一性,也就是在Baire纲分类意义下,大多数二元函数的鞍点具有唯一解。俞建等 [14] 于1998年,通过Baire纲定理讨论了微分包含解的通有唯一性,也就是在Baire纲分类意义下,大多数微分包含都具有唯一解。此外,2011年、2012年、2013年、2017年,俞建等应用集值映射理论,构造完备度量空间,在Baire纲分类意义下,分别在文献( [15] [16] [17] [18] )中讨论了均衡点的通有唯一性、一类向量Ky Fan不等式解的通有唯一性、通有唯一性定理及应用,以及大多数单调变分不等式具有唯一解。
特别地,近年来应用非线性分析理论研究微分博弈均衡点的稳定性,已取得了一些比较好的研究成果。俞建等 [19] 于2014年,研究了经典最优控制关于状态方程右端函数扰动时的通有稳定性。邓红勇等( [20] [21] )于2015年,先后研究了具有一阶等度连续的非线性最优控制的通有稳定性,以及半线性发展方程支配的目标泛函为二次型时,最优控制问题的通有稳定性。俞建等 [22] 于2020年,讨论了非合作微分博弈平衡点集的通有稳定性。
受到以上文献的启发,我们基于文献 [23] 证明了半线性发展方程支配的无限维微分博弈鞍点的存在性,通过对控制系统关于右端函数发生扰动时构造相应的问题空间,引入恰当度量,从而得到一个完备度量空间,在完备度量空间框架下,引入集值映射,并证明了集值映射是一个上半连续紧映射。然后,应用集值分析方法,在Baire纲分类意义下,证明了半线性发展方程支配的微分博弈的鞍点具有通有唯一性。
2. 模型和预备知识
根据文献 [23],我们构造如下的博弈模型。设状态空间E是Hilbert空间,参与人1和2的控制取值集U和V是紧度量空间,设
是E上的有界线性算子生成的
半群
。设
,
,
。
函数
和
分别叫做参与人1和2的控制过程。我们考虑如下的状态方程:
(1)
其中,
是给定的映射,
,
,
。显然,状态方程等价于如下形式的积分方程:
。(2)
下面,关于函数f和半群
,我们引入如下假设。
[A1]函数f是一致连续并且存在常数
,使得对任意的
,
和
,
,
,
。
[A2]半群
是紧并且是解析,存在常数
和
使得
。
显然,在假设[A1]下,对初始对
,
,
,状态方程(1)存在唯一解,不妨定义为
。
现在,我们定义参与人的控制策略。对时间区间
进行如下剖分,即设
,
且满足
。参与人1的策略定义为
,其中第n阶段的策略
是一个p元对
,且
,对
,
满足
。
同样,我们对时间区间
也可以进行如下剖分,即设
,
且满足
。参与人2的策略定义为
,其中第n阶段的策略
是一个q元对
,且
,对
,
满足
。
第n阶段策略对
按如下方式决定控制对
。设剖分
和
的细分为
,
控制对
和
分别由k元对
和
决定。其中
。
设
分别是
在区间上
的限制。在
上,设
和
。设
,若
,则在
上取
,
。
其中,l是使得
和
的最大整数。若
,则在
上取
,
。
其中,k是使得
和
的最大整数。这样,控制对
就称为策略对
在第n阶段的结果。
因为时间区域
是有限时间区域,并且在恰当条件下,Mayer型泛函、Lagrange型泛函和Bolza型泛函是相互等价的。因此,根据策略对
,我们定义如下的Mayer型的目标泛函:
。 (3)
并考虑如下的博弈问题。
博弈(DG):参与人1选择策略 极大化支付
,参与人2选择策略
极大化支付
,即:
,
。
定义2.1设
是给定的初始对,若对任意的策略
,下式成立
。
则称
是博弈(DG)的鞍点。
现在,为研究问题的需要,我们引入如下假设。
[A3]函数g是一致连续的。
[A4]对所有的
,下式成立,
。
引理2.1 ( [23] )假设[A1]-[A4]成立,初始对
给定,则博弈存在鞍点。
为研究通有唯一性,我们构造如下的问题空间。设
。
,定义距离为:
。
则容易证明
是一个完备度量空间。
定义2.2:设
。
则
定义了一个
集值映射,记为
。
引理2.2 ( [13] ):设
是微分博弈(DG)的鞍点,则
,
也是微分博弈(DG)的鞍点。
我们的目的是研究微分博弈(DG)的解集关于右端函数f扰动后,鞍点的通有唯一性。即:应用集值映射理论,在Baire纲分类意义下,讨论其解的通有唯一性。因此,为研究其解集的通有唯一性,我们引入如下必要的定义和引理。
定义2.3 ( [10] ):
,
是一个非空集合,对
中的任意开集G,
,若存在V的任意开领域
,使得
,有
,称集值映射S在f上半连续(下半连续)。若集值映射S在f既上半连续,又下半连续,则称S在f连续。若
,集值映射S在f上半连续(下半连续、连续),则称S在M上半连续(下半连续、连续)。
定义2.4 ( [10] ):若
,
是一个非空紧集,且S在f上半连续,则称S是一个上半连续紧映射(USCO)。
引理2.3 ( [10] ):若M是完备度量空间,则必是Baire空间。
定义2.5 ( [10] ):称
为S的图像,若S的图像
是闭的,则称集值映射S为闭映射。
引理2.4 ( [10] ):设集值映射
是闭的,且
是紧集,则S是一个上半连续映射。
定义2.6 ( [10] ):设
,若Q包含M中一列稠密开集的交,则称Q是M中剩余集。
引理2.5 (Fort):设M是一个完备度量空间,集值映射
是一个上半连续紧映射,则存在M中的一个稠密剩余集Q,使得
,
下半连续,从而连续。
3. 通有唯一性
定理3.1若假设[A1]~[A4]成立,则对任意的
,
。
注:根据引理2.1,结论显然成立。
定理3.2
,
是一个USCO映射。
证明:因为
是紧集,所以
是紧集,由引理2.4知,只需证明集值映射
是一个闭映射即可,也就是证明其图像:
,
是闭集。不妨设
,
,
,且
,则为证明其
的闭性,只需证明
。因为
,则
,下式成立
。
因
,所以由引理2及其推论有:
,
,
。
所以
,
。
因此
,这样我们证明了
是闭的,所以集值映射
是一个上半连续紧映射(USCO)。
定理3.3存在M中的一个稠密剩余集Q,使得
,
是一个单点集。
证明:因为M是一个完备度量空间,
是紧度量空间,而
是一个USCO映射,由引理2.5,存在M中的一个稠密剩余集Q,使得
,S在f下半连续。
,若
不是单点集,则存在
,
,而
,不妨设
,由引理2.2知,
,由凸集分离定理,存在E中的连续线性泛函h,使得
,定义
如下:
,
。
显然,g在紧集U上连续有界,
,
,且
,
,有
。
,
,定义
,
容易验证
连续,且
。
令
,是
中的开集,又因为
,有
,
,而集值映射S在f下半连续,当
充分小时,有
,取
,则有
,
有,
其中,
。
另一方面,因为
,并且
,所以
矛盾。所以,
,
是一个单点集。
4. 结论
众所周知,并非所有微分博弈都具有唯一鞍点解。同样,半线性发展方程支配的微分博弈也不一定具有唯一鞍点解,但是,定理3.3告知我们,当控制系统右端函数发生扰动时,在Baire纲分类意义下,大多数半线性发展方程支配的微分博弈具有唯一解。
参考文献