1. 引言
我们引入如下的最优控制问题。设
和
是一个非空的有界闭凸集。控制取值集定义为:
问题(D):对
,在控制集
求控制函数
使得
满足:
其中,
关于问题(D)的研究,有一个前置的基本假设是时间一致性。研究的经典方法是Bellman最优性原理和Pontryagin极大值原理。从20世纪初期开始至今,已经研究得比较成熟 [1] [2]。但是,社会生活实践并不是如此完美,往往表现为时间不一致性,时间不一致问题的数学模型可见 [3] [4]。
事实上,关于时间不一致问题的研究,其定性行为至少可以追溯到1739年Hume [5] 和1759年Smith [6] 的工作。但是,直至20世纪五十年代,Strotz [7] 才对其数学公式化,在这之后,时间不一致问题的研究主要包含实证研究和理论研究两个方面,吸引了大量数学家和金融学家的研究,取得了丰富的研究成果 [8] - [15]。
本文在第一节中,我们将引入常微分方程支配的时间不一致控制问题的数学模型,并给出文中所需要的必要的假设条件。在第二节中给出主要结果,以及相应的证明过程。最后,我们给出本文的总结。
2. 数学模型和预备知识
首先,我们引入时间不一致控制问题的数学模型。
问题(TIP):对
,在控制集
求控制函数
使得
满足:
其中,
注意到,因问题(TIP)的运行泛函
和终端泛函
显示依赖于初始时间,这意味着,随着控制的进行,目标泛函会因为时间的变化而变化,甚至导致控制系统已在变化。因此,问题(TIP)不同于问题(D)只是简单地优化一个问题,而是优化一族问题。
下面,我们引入如下假设条件:
(P1)映射
连续,并且存在一个常数
使得:
(P2)映射
和
连续。并且存在一个常数
使得:
3. 主要结果
现在,我们对时间区间
离散化,构造下列序列最优控制问题。设
首先,在时间区间
上构造问题(TIPN)。
问题(TIPN)对,
在控制集
求控制函数
使得
满足:
其中,
注意:这里
是为了记号的方便。
对给定的初始对
,这是一个经典的最优控制问题,可以利用Bellman最优性原理求得最优对
。进而可得相应的值函数:
其次,在时间区间
上构造问题(TIPN−1)。
问题(TIPN-1)对
,在控制集
求控制函数
使得
满足:
其中,
同样,对给定的初始对
,这也是一个经典的最优控制问题,可以利用Bellman最优性原理求得最优对
。进一步,可得值函数:
类似地,在时间区间
上构造问题(TIPi)。
问题(TIPi)对
,在控制集
求控制函数
使得
满足:
其中,
根据Bellman最优性原理,关于问题(TIPi),对给定的初始对
,可以求得最优对
及其相应的值函数:
综上,对时间区间
任意剖分
,对
,我们构造序列
,
和
。定义:
定理2.1. 设(P1)-(P2)成立。则对
及对时间区间
的任意剖分
,下式成立:
证明:设
,对
。
因此,当
时,
,即:
定理2.2. 设(P1)~(P2)成立。对时间区间
的任意剖分
,则有:
证明:任意取
的一个剖分
,对
和
,我们有:
显然,在假设条件下,当
时,
。
对
和
,存在
使得
则对
,
因此,
又因为
类似地,我们可得到
所以,当
时,
同样,当
时,我们可得:
综上,我们证明了
。
4. 结论
因时间不一致控制问题不满足Bellman最优性原理,不能运用经典方法予以求解。因此,我们对时间区间进行离散化,构造序列最优控制问题,获得了相应的值函数列,并证明了值函数列收敛于对应经典问题的值函数。
基金项目
国家自然科学基金资助项目(12061021)。