1. 引言
1930年,Lundberg-Gramer提出了经典的累积风险模型,该模型常用来研究保险公司的分红及破产概率。而为了使得描述的风险模型更加地贴近实际,1984年,Davis提出了更加一般的保险风险模型,他们称为逐段决定复合泊松风险模型。该模型是一般的模型,囊括了多种目前常见的风险模型。在本文中,我们假设保险公司的风险模型是保费依赖余额(逐段决定复合泊松风险)模型,即余额过程为逐段决定马氏过程(PDMP)。PDMP自提出以来就受到金融,保险,随机控制等多个领域的广泛关注,也涌现出了大量关于PDMP的文章。如 [1] - [6] 研究了PDMP的连续和脉冲控制,最优停时,在风险中的应用等。关于保险中PDMP的相关内容可以参考Schimidlli [7] 。随后,PDMP也被应用到最优分红问题的研究中。
最优分红问题最早可追溯到 [8] ,De Finetti在第15届国际精算学大会(纽约)上首次提出了破产前累积期望折现分红的概念,并对离散时间风险模型的最优分红问题进行了研究,并得到最优分红是barrier策略。通常,研究最优分红问题的方法为Schimidlli的经典方法和Muller [9] 的粘性解的方法(关于最优分红的问题可参考Muller [9] )。在2017年,Liu在 [10] 中提出了一种新的理论:测度值生成元理论。本文即运用该理论得出测度值动态规划方程,该方法不要求值函数是光滑的,则我们不需要讨论方程的粘性解。
本文结构如下:第1节建立保费依赖余额的保险风险模型,并给出相应的最优分红问题。第2节给出了值函数的基本性质。第3节通过测度值生成元理论给出了测度值动态规划方程(测度值DPE)。
2. 模型描述
首先给出完备的概率空间(
, F, P),
是所有右连续且有左极限的函数集合。在此空间内,将保险公司的余额X表示为
(1.1)
其中,
为初始余额,
表示到t时刻的索赔个数。索赔额序列
为一独立同分布的随机变量序列,其分布函数为
,并且
和
是相互独立的。索赔到达率
为常数,则下次索赔达到时刻的条件概率分布为
。
表示第n次索赔时刻,在两个连续的索赔时刻间的余额过程可表示为
定义推移算子
,满足
。
为从0时刻到t时刻的累计分红。给定分红策略L,受控的余额过程
可表示为
(1.2)
相应的破产时刻定义为
在任意时刻t,索赔到达率都为
,受控后的条件概率分布不变。
如果L满足下列条件,则称L为可行策略。
1)
是非降且关于自然流
是适应的;
2) 过程
满足
3) 方程(1.2)有唯一强解
。
定义
是所有以
为初始余额的可行策略集。
对每个分红策略
,累积期望折现分红
可表示为
其中
是折现因子。定义值函数
。
通常,当
时,
。
3. 值函数性质
引理2.1:值函数
是非降的,局部Lipschitz连续且满足
。
证明:取分红策略
使
。对任意的
,重新定义一个新策略
,该策略先将
作为分红一次性分给股东,之后有
,则有下列不等式成立
则
,同时可得V是非降的。
下证
。
令
,则有
由于g是单调递增的,有
,则不等式成立且V是局部Lipschitz连续的。
4. 动态规划原理(DPP)及动态规划方程(DPE)
定义
是可测函数
的集合,
满足下列条件:
,方程
有唯一解
;
,
。
下面我们给出马氏策略及马氏策略集合的定义。
定义4.1:如果受控后的余额过程
是强马氏过程,称
是马氏控制;如果
是时齐的强马氏过程,则称L为平稳的马氏控制。
定义
为可测函数
的集合,且
满足
1)
,
。
2) 对任意
,
,有
3) 当
时,
4) 方程
(4.1)
有唯一解
;
通过上述定义及 [10] 定理2.3可得集合
中的函数是马氏策略函数。
引理4.2:假设存在最优平稳马氏策略
及相应的函数
。值函数V满足
(4.2)
其中
。
证明:当最优策略
是平稳马氏策略时,可得
(4.3)
由于
是马氏策略,则等式右边第二部分可以写成
则(4.3)可写为
(4.4)
函数
。下面我们构造一个新的策略L:将
分红策略在第一次索赔到达前为一般策略L,在之后的索赔到达间隔之间为最优策略
。
在新的策略之下,值函数满足
(4.6)
由(4.4)和(4.6),可得(4.2)。
定理4.3:假设存在最优平稳马氏策略
及函数
,则值函数V(x)满足
(4.7)
其中
根据引理3.1, 有
运用分部积分,得
和
则
(4.8)
令
方程(4.8)可写为
。
,根据 [10] 定理2.3知:
,则有
,
。
因此
。
由上可得
关于t是非增的。对于任意
,可得
, (4.9)
其中
另一方面,假设存在最优平稳马氏策略
及相应的函数
。运用与(4.9)相同的推导方法,(4.3)可写为
(4.10)
由(4.9)和(4.10),可得
。
对固定的
,上述等式在
时取得最大值等价于
时取最大值。我们可改写(4.7),如下式:
(4.11)
其中
方程(4.11)是测度值方程,因此我们可以称之为测度值动态规划方程(测度值DPE)。