保费依赖盈余模型下值函数的迭代方法
Iterative Approach of Value for the Risk Model with Surplus-Dependent Premiums
DOI: 10.12677/AAM.2020.95078, PDF, HTML, XML, 下载: 745  浏览: 941 
作者: 刘笑颖:河北工业大学理学院,天津
关键词: 保费依赖盈余模型值函数迭代方法Surplus-Dependent Risk Model Value Function Iterative Approach
摘要: 最优分红问题是金融保险中研究较多的问题之一,根据目前已有文献可知,最优分红策略与值函数息息相关。本文主要研究保费依赖盈余模型下的值函数,以期通过值函数的迭代方法来解决保险公司保费依赖盈余的最优分红问题。
Abstract: The optimal dividend problem is one of the more studied problems in financial insurance. Ac-cording to the existing literature, the optimal dividend strategy is closely related to the value function. This paper mainly studies the value function for the Risk Model with Surplus-Dependent Premiums in order to pass the value function iteration approach to solve the optimal dividend problem of insurance company.
文章引用:刘笑颖. 保费依赖盈余模型下值函数的迭代方法[J]. 应用数学进展, 2020, 9(5): 662-667. https://doi.org/10.12677/AAM.2020.95078

1. 引言

风险理论的发展具有十分悠久的历史,其研究内容涵盖了破产概率、破产时刻、破产时刻赤字等一系列问题。保险风险中的最优分红问题首次取得开创性成果是在1957年第15界国际精算大会上,由De Finetti [1] 提出,他认为在保险公司不发生破产的前提下,应以破产前分红利益的最大化为目标,该提议于保险公司而言是更具有实际意义的准则,也是更有价值的度量。同时他还提出可以用累积折现期望来表示最优分红问题。之后,关于最优分红问题的研究文献大量涌出。人们最初开始研究分红问题是基于Cramer- Lundberg模型,该模型最早在1903年由Lundberg [2] 提出,而后在1930年,Cramer [3] 描述了保险公司的盈余过程,因此经典的累积风险模型也被称为Cramer-Lundberg模型。该模型在最初主要用来研究保险公司的破产概率,随着研究的深入发展,许多学者在此基础之上,将研究范围进行了拓展,开始研究不同模型条件下的破产和分红问题。如Davis [4] 提出了更加一般的逐段决定复合泊松模型,该模型是一种较为常见的模型,许多学者对该类模型都有研究。之后又有许多模型逐渐进入大家的视线。如Gerber和Hans [5] 提出了复合二项模型,Albrecher和Hartinger [6] 研究了Sparre-Anderson模型下的最优分红问题。

本文主要研究在Surplus-Dependent模型下值函数的迭代方法。目的是通过值函数的迭代来得到HJB 方程的最小粘性解,使得累积折现分红达到最大。在Azcue和Muler (2017) [7] 中曾利用迭代算法来讨论过二维模型下的分红问题,该算法在刘国欣和侯振挺的马尔可夫骨架过程及应用中也曾提到,我们以此为依据来研究Surplus-Dependent模型下的迭代算法。除此之外,本文还用到刘国欣和刘兆阳 [8] 的逐段决定马氏过程与半动力系统可加泛函。

2. 模型介绍

假设初始准备金为x的保险公司盈余为:

X t = x + 0 t g ( X s ) d s i = 1 N t U i , t 0. (1)

其中x表示初始准备金,g表示正的保费收入率函数,Nt表示索赔到达强度为 λ > 0 的泊松计数过程,Ui是一列独立同分布的随机变量序列,Ui表示第i次索赔的大小,其共同的分布函数为F。假设Ui和Nt是相互独立的。当公司盈余为负时,公司破产。

假设保费收入率函数g是正的,单调的,局部Lipschitz的,则

0 e δ t g ( ϕ x ( t ) ) d t a x + b . (2)

其中a、b均为大于等于零的常数,函数 ϕ x ( t ) 满足:

ϕ x ( t ) = x + 0 t g ( ϕ x ( s ) ) d s . (3)

保险公司将其部分余额作为分红分给各位股东,分红策略 L = { L t , t 0 } 表示到t时刻为止的累积折现分红,假设τn为第n次索赔到达时刻,则初始盈余为x的受控的盈余过程为

X t L = x + 0 t g ( X s ) d s i = 1 N t U i L t . (4)

定义 τ ¯ 为保险公司的破产时刻,则有

τ ¯ = inf { t 0 , X t L < 0 } . (5)

t τ ¯ 时,受控盈余过程为 X t L ,若分红策略满足下列条件,则可认为是可行策略,

·Lt是非降的;

·Lt是左连右极的;

·Lt是可料的;

·Lt是关于自然流 ( F t ) t 0 是适应的;

·满足 L t X t L t τ ¯

最后一个条件表明,保险公司支付的分红最多不得超过公司盈余。

定义Πx是初始盈余为x的可行分红策略的集合,我们的目的是实现破产前的折现分红的最大化。因此,对于任意的初始准备金 x 0 ,定义值函数为

V ( x ) = sup L Π x V L ( x ) . (6)

当分红策略 L Π x 时,累积期望折现分红VL(x)可表示为:

V L ( x ) = E x [ 0 τ ¯ e δ s d L s ] . (7)

其中, δ > 0 为折现因子。当 x < 0 时,通常认为 V ( x ) = 0

3. 值函数的迭代

在本节,我们主要用一列递增的值函数序列来逼近(2.3)中定义的值函数,在此主要通过迭代算法来寻进行值函数的逼近。

假设对 n 1 ,定义值函数Vn为:

V n ( x ) = sup L Π x V L n ( x ) , (8)

其中,

V L n ( x ) = E x [ 0 τ 1 e δ s d L s + e δ τ 1 V n 1 ( X τ 1 L ) 1 { τ 1 τ } ] . (9)

此时 V 0 = 0 ,在此用1{.}表示示性函数。

在上述表达式中,我们仅考虑当 t τ 1 时的可行策略 L Π x , x R + 。此时DPP成立。

定理3.1:值函数序列满足 V 0 V 1 V 2 V n V

证明:下面用归纳法证明该结论。

1).由可行分红策略的特征可知:

V 1 ( x ) = sup L Π x ( E x [ 0 τ 1 e δ s d L s ] ) .

2) 假设 V n 2 V n 1 ,则

V n ( x ) sup L Π x ( E x [ 0 τ 1 e δ s d L s + e δ τ 1 V n 2 ( X τ 1 L ) 1 { τ 1 τ } ] ) = V n 1 ( x ) .

定理3.1得证。

现定义Vn的HJB方程为:

max { L n V n ( x ) , 1 V x n ( x ) } = 0 , (10)

其中,

L n V n ( x ) = g ( x ) V x n ( x ) ( λ + δ ) V n ( x ) + λ G V n 1 ( x ) .

且有 G W ( x ) = 0 x W ( x y ) d F y

定义3.2:若存在常数 k > 0 ,使得 u ( x ) x + k 对所有 s R + 成立,则连续函数具有增长条件(A1)。

定理3.3:满足增长条件(A1)的最优值函数Vn在R+是递增的、局部Lipschitz的,且有

h V ( x + h ) V ( x ) ( e ( λ + δ ) h / g ( 0 ) 1 ) V ( x ) .

证明:首先证明不等式的第一部分。给定任意 ε > 0 ,存在可行策略,使得 V L n ( x ) V n ( x ) ε 。定义可行策略 L 1 Π x + h , h > 0 。支付h作为公司分红后,返回策略L。此时有

V L 1 n ( x + h ) = V L n ( x ) + h .

因此可以得到 L Π x

V n ( x + h ) V L n ( x ) + h V n ( x ) + h ε .

下面证明不等式的另一部分。索赔发生之前,余额由x变成x+h的概率为 e λ t 。因此有

V ( x + h ) V ( x ) ( e ( λ + δ ) t 1 ) V ( x ) .

因为g是正的、单调递增的,因此 t h / g ( 0 ) 。因此定理3.3得证。

定理3.4:最优值函数是满足增长条件(A1)的最小粘性上解。

证明:令u是(10)式的非负粘性解,且满足增长条件(A1), L Π x 为任意可行策略, X t L 是初始盈余为x的受控盈余过程。由文献 [9] 引理5.1可知,un是连续可微的,且 u n 1 ,因此有

e δ ( t τ 1 ) u n ( X t τ 1 L ) u n ( x ) 0 t τ 1 L n ( u n ) ( X s L ) e δ s d s + M t τ 1 ( 0 t τ 1 e δ s d L s + e δ ( t τ 1 ) u n ( X t τ 1 L ) 1 { t τ 1 < τ } ) .

其中 M t τ 1 是零期望鞅。若 x < 0 ,则 u n ( x ) = 0 。对上式取期望可得

E x [ e δ ( t τ 1 ) u n ( X t τ 1 L ) ] u n ( x ) E x [ 0 t τ 1 L n ( u n ) ( X s L ) e δ s d s ] E x [ 0 t τ 1 e δ s d L s + e δ ( t τ 1 ) u n ( X t τ 1 L ) 1 { t τ 1 < τ } ] .

因为Lt为非降过程,由极限收敛定理可知

lim t E x [ 0 t τ 1 e δ s d L s + e δ ( t τ 1 ) u n ( X t τ 1 L ) 1 { t τ 1 < τ } ] = V L n .

同时,由边界收敛定理可知

lim t E x [ 0 t τ 1 L n ( u n ) ( X s L ) e δ s d s ] = E x [ 0 τ 1 L n ( u n ) ( X s L ) e δ s d s ]

下面证明

lim t sup E x [ 0 τ 1 L n ( u n ) ( X s L ) e δ s d s ] 0.

对任意 ε > 0 ,存在T使得对任意 n 1

T L n ( u n ) ( X s L ) e δ s d s ε 2 .

由文献 [9] 引理5.1可知,存在足够大的n0,使得对任意 n > n 0

0 T L n ( u n ) ( X s L ) e δ s d s c n δ ε 2 .

由增长条件(A1)可知,存在K使得

E x [ e δ ( t τ 1 ) u n ( X t τ 1 L ) ] = E x [ e δ ( t τ 1 ) u n ( X t τ 1 L ) 1 { t < τ 1 } ] + E x [ e δ ( t τ 1 ) u n ( X t τ 1 L ) 1 { t τ 1 } ] = E x [ e δ ( t τ 1 ) u n ( X t τ 1 L ) 1 { t < τ 1 } ] ( x + K ) e δ t .

因此可得

lim t E x [ e δ ( t τ 1 ) u n ( X t τ 1 L ) e δ t ] = 0.

综上所述可得

u ( x ) = lim n u n ( x ) V L n .

因此有

u ( x ) sup L Π x V L n = V n .

定理3.5:当n趋近于 时, V n V

证明:通过文献 [9] 引理5.1可知,是V递增的且满足条件(A1),因此存在 T > 0 使得

e δ t V ( ϕ x ( t ) ) ε 3 , t T .

定义 k = V ( ϕ x ( t ) ) > 0 ,取 n 0 > 0 ,使得

P ( τ n 0 T ) 1 ε 3 k .

现存在可行策略 L Π x ,使得

V ( x ) V L ( x ) ε 3 .

因此

V ( x ) V L ( x ) + ε 3 V n ( x ) + ε .

定理3.5得证。

参考文献

参考文献

[1] De Finetti, B. (1957) Su un’impostazione alternativa della teoria collettiva del rischio. Transactions XVth Congress of Actuaries, Vol. 2, Mallon, New York, 433-443.
[2] Lundberg, F. (1903) Approximerad Framstifillning av Sannol-ikhetsfunktionen. Aterfifirsikring av Kollektivrisker. Akad. Afhandling. Almqvist o. Wiksell, Uppsala.
[3] Cramer, H. (1930) On the Mathemtical Theory of Risk. Skandia Jubilee Volume, Stockholm.
[4] Davis, M.H.A. (1984) Piece-wise-Deterministic Markov Processes: A General Class of Non-Diffusion Stochastic Models. Journal of the Royal Sta-tistical Society, 46, 353-388.
https://doi.org/10.1111/j.2517-6161.1984.tb01308.x
[5] Gerber, H.U. (1988) Mathematical Fun with the Compound Binomial Process. Astin Bulletin, 18, 161-168.
https://doi.org/10.2143/AST.18.2.2014949
[6] Albrecher, H. and Hartinger, J. (2006) On the Non-Optimality of Horizontal Dividend Barrier Strategies in the Sparre Andersen Model. Hermes International Journal of Computer Mathematics and Its Applications, 7, 109-122.
[7] Albrecher, H., Azcue, P. and Muler, N. (2017) Optimal Dividend Strategies for Two Collaborating Insurance Companies. Advances in Applied Probability, 49, 515-548.
https://doi.org/10.1017/apr.2017.11
[8] Liu, G. and Liu, Z. (2015) Piecewise Deterministic Markov Processes and Additive Functional of Semi-Dynamic Systems. Scientia Sinica Mathematics, 45, 579-592. (In Chinese)
https://doi.org/10.1360/N012015-00069
[9] Li, J.W., Liu, G.X. and Zhao, J.Y. (2020) Optimal Dividend-Penalty Strategies for Insurance Risk Models with Surplus-Dependent Premiums. Acta Mathematica Scientia, 40B, 1-29.
https://doi.org/10.1007/s10473-020-0112-1