1. 引言
经典的极值理论是研究社会生活中极端现象的一门学科,其主要研究一列随机序列极大值的相关极限理论。设
是一列独立同分布的实值随机序列,具有边际分布函数
。若存在常数序列
和非退化分布函数
使得对
的任意连续点处有
(1)
则称分布函数F属于非退化函数
的最大吸引场,简记为
。注意到
必为如下三大极值分布
上述的经典结果及其相关推广见专著[1]。
在实际应用中,有些数据可能因不同的原因以一种非常不规则的方式丢失。在许多领域(例如金融、水文、气象等),不同的研究者可能对不同的观测频率的样本感兴趣。在这些情况下,研究完全样本极值和非完全样本的极值的渐近理论以及它们之间的渐近关系变得很重要。
假设
中仅有部分随机变量能够被观测到。令
为一列伯努利序列,表示随机变量
被观测到的事件的指标且与
独立。在
的前n个样本中,记
和随机缺失序列的最大值为
。
并假设其满足,当
时
其中
为随机或非随机变量。
当
为一个常数时,文献[2]研究了独立同分布随机序列完全样本和非完全样本极值之间的渐近关系,获得了如下结论:对任意
有
(2)
其中
同时文献[2]也研究了一类平稳相依情形,即在极值理论领域一类非常经典的相依条件
和
(其定义详见专著[3])下研究了完全样本和非完全样本极值之间的渐近关系,文献[4]证明了(2)式仍然成立,其中
近年来,该问题逐渐成为极值领域的一个研究热点,文献[3] [5]-[7]将上述问题推广到了高斯情形;文献[8] [9]则考虑了自回归过程和线性过程情形;文献[10] [11]考虑了随机场情形;其他相关研究见[12]-[15]。
上述的研究中考虑了一些相依情形,如[2] [4]在
和
条件下考虑该问题,[3] [5]-[7]则在相依高斯背景下考虑了该问题,[8] [9]在自回归过程和线性过程下考虑了该问题。除[3] [5]-[7]中的高斯情形之外,其他研究中考虑的相依性都很弱的,其不影响极限分布
的形式。因此非常有必要在强相依背景下研究非高斯随机序列完全样本和非完全样本极值之间的渐近关系。
本文将研究一类可交换随机序列完全样本和非完全样本极值次序统计量之间的渐近关系。专著[16]中3.6节详细地陈述了可交换随机变量次序统计量的渐近性质。受文献[17]的启发,本文将使用拉普拉斯变换来描述随机变量之间的可交换性,该拉普拉斯变换与阿基米德Copula有着密切的关系。在过去的几年里,与Copula相关的主题引起了人们的极大兴趣。Copula常常被用来描述随机变量之间的尺度不变的依赖性。对这种随机依赖结构的理解在概率论的所有领域中都变得非常重要,特别是在精算领域和金融领域,Copula已经证明了它们在构建适当的多元模型方面是非常有效的。关于Copula的相关理论介绍,可参考专著[18]。
2. 主要结论及其证明
在本节中,设
是一列随机变量序列,并设
为一列伯努利随机序列,其中
表示随机变量
被观测到的事件的指标且与
独立。令
。记
,
。对于任给定的正整数
,令
分别表示
,
,
中的第
和m个最大值。
现在,我们将阐述主要结论。
定理2.1. 设F和
均是一维分布函数,且
。记
是
的拉普拉斯变换,且
是
的反函数。记
为
的k阶导数。假设随机向量
有如下的联合分布函数:
(3)
假设
,即存在常数序列
使得对
的任意连续点处有
(4)
进一步假设
满足
(5)
其中随机变量
几乎处处成立。则
1) 对任意的
,有
(6)
2) 当
时,有
(7)
当
时,有
(8)
3) 当
时,有
(9)
当
时,有
(10)
注记2.2. (i) (3)式定义了一个n维可交换的随机向量。当给定条件
时,他们是独立同分布的。由于独立同分布序列能够被扩展到无穷维序列,因此向量
事实上是无限维可交换随机变量序列的一部分;
(ii) 拉普拉斯变换是严格单调递减的,并且有
;
(iii) 可以借助阿基米德copula来描述(3)式所定义的相依结构,本文第三节给出了定理2.1在阿基米德copula结构下的应用;
(iv) 对(3)式定义的可交换的相依结构,文献[17]给出相应极值次序统计量的极限分布。
证明:为了方便,记
。由文献[19]可知,如果随机序列
的边际分布函数
,并且
满足弱相依条件
和局部相依
时,任意的
,有
(11)
由定理2.1的条件(3)可知,在给定
的条件下,
是相互独立的随机变量,并且其边际分布函数为
。注意到
,进而有
。这意味着在
给定的条件下,
满足经典的Fisher-Tippet定理,并且有着与(1)式一样的正规化常数
,且此时极限分布函数为
。详细情形可参考[20]定理3.2.3和[16]第3.6节。因此,利用(11)式,有
(12)
即,我们获得了关于
的逐点收敛。注意到上述概率是一致有界的,并且在
上关于
是可积的。因此,根据控制收敛定理和(12)式,有
(13)
根据定理3.1条件,
是
的拉普拉斯变换,即
进而有
带入(13)式可得
为了完成(6)式的证明,我们还需要证明当
时,
利用文献[17]中定理1.2可得
注意到,当
时,显然有
。定理3.1的1)证毕。定理3.1的2)与3)的证明是类似的,故略去。
3. 应用
在本节中,我们将应用定理2.1来探讨Copula相依结构下完全样本极值次序统计量与非完全样本极值次序统计量之间的渐近关系。首先,介绍一些关于Copula的定义,性质及相关定理,它们均来自专著[18]。Copula是一个自变量为边缘分布函数的多元函数,它能够将多维分布函数与其边缘分布函数进行有效的连接,从而清晰地反映两个边缘分布函数之间联系的结构。
定义3.1. (Copula)令
。一个d维Copula函数是一个定义在
上的d维分布函数,其边际分布函数服从
上的均匀分布。
下面的Sklar定理是一个研究Copula的重要工具,其证明见专著[18]。
命题3.1. 对给定的Copula函数C和边际分布函数
,有
(14)
是一个分布函数。反之,对给定的具有边际分布函数
的多维分布函数F,存在一个满足(14)式的Copula函数C。这个Copula函数C是不唯一的,如果
是连续函数,则有
(15)
其中
表示分布函数
的广义逆函数。
本文主要考虑阿基米得Copula,在介绍其定义之前,我们先给出几个辅助结果。
定义3.2。令
。设
是严格递减的、凸的函数,并且使得
,
对于
有
其中,
称为
的生成元。
定义3.3. 一个定义在I上函数g被称为在I上完全单调的,如果它是连续的并且具有交替符号的所有阶导数,即
,对所有
和所有
成立。
命题3.2. 对所有
,
是一个Copula当且仅当生成元
具有逆函数
并且
在
上完全单调.
定义3.4. (阿基米德Copula)如果
在
上完全单调,则称
是阿基米德Copula。
命题3.3.设
是一列同分布的随机变量,如果对任意的
,随机向量
具有阿基米德Copula
,则称随机序列
是阿基米德Copula相依的。
当随机变量序列是阿基米德Copula相依的,如果其共同分布函数
满足
,文献[21]研究了该随机序列极值的极限分布问题,并探讨了其结果在精算中的应用。如果其共同分布函数
满足
,文献[22]-[24]则获得了该随机序列极值以及极值次序统计量的分布极限定理和几乎处处中心极限定理。利用定理2.2,我们获得了阿基米德Copula相依随机序列完全样本极值次序统计量与非完全样本极值次序统计量之间的联合极限分布。
定理3.1. 设
是一列同分布的阿基米德Copula相依的随机变量,具有连续的边际分布函数
.设
为一列伯努利随机序列,其中
表示随机变量
被观测到的事件的指标且与
独立。假设
满足,当
时,
(16)
其中随机变量
几乎处处成立。则存在常数序列
使得(6)~(10)式均成立。
注记3.1. 文献[25]考虑了一列同分布的阿基米德Copula相依的随机变量最大值与其非完全样本情形下最大值的联合极限分布,同时本文中条件(16)中的
为随机变量,而文献[25]中
为常数,因此,定理3.1推广了文献[25]的主要结论.
证明:由文献[26]可知,对每个阿基米德Copula
,都存在一维分布函数F和一个正值随机变量
具有拉普拉斯变换
,使得满足阿基米德Copula
结构的随机变量
关于
条件独立,即其联合分布函数可以表示为(3)式。选择常数序列
使得
,其中
是
的逆函数。进而,定理2.1的条件都成立,因此,由定理2.1立刻可证定理3.1成立。
本文研究了可交换的随机变量在随机缺失情形下的极值次序统计量的极限分布问题,得到了完全样本极值次序统计量与非完全样本极值次序统计量的联合极限分布,并用所得结果研究了阿基米德Copula相依结构下完全样本极值次序统计量与非完全样本极值次序统计量的渐近关系,获得了它们的联合极限分布。本文的创新性主要体现在如下两个方面:其一,将文献[25]中条件
中常数
推广到随机变量情形;其二,将文献[25]中完全样本极大值与非完全样本极大值的联合极限分布推广到了极值次序统计量情形。
在未来的研究中,我将考虑更一般的Copula相依结构情形下完全样本极值次序统计量和非完全样本极值次序统计量的渐近关系,同时,通过解决上述所提到的问题,将所得结论应用到缺失数据的极值统计分析中。
基金项目
本文受浙江省自然科学基金(编号LY18A010020)。
NOTES
*通讯作者。