1. 引言
转变点问题一直是统计学前沿研究的热点问题,具有重要的应用价值,尤其在经济学和金融学方面有广泛的应用 [1] 。在经济飞速发展的现代社会,需要处理经济、金融的问题也越来越多。经济周期中的变点分析一直都是经济学家和统计学家关心的问题,因为研究经济周期中的变点问题对我们及时调整经济政策,使经济稳定发展有很大帮助。
转变点的定义:按统计学的定义,对于某一随机变量序列,如果存在一个时间点,在这个点以前的序列服从一种概率分布而在这个时间点以后的序列则服从另一种概率分布(或同一种概率分布而参数不同),那么在这个序列中存在一个转变点。因此,一个转变点问题就包含以下两方面的内容 [1] :① 确定是否存在变化,② 估计未知转变点的个数及位置。
一般地,估计转变点的方法有很多,常见的方法有Schwarz信息准则方法、二分分段法、似然比检验、(加权)最小二乘法、非参数方法、累加和方法 [2] 、贝叶斯方法 [3] - [5] 、极大似然方法等。Schwarz (1978)提出了信息准则的方法用于检测转变点的存在性时,无需导出其复杂的分布函数,来估计变点的个数和位置 [6] 。Vostrikova (1981)提出的二分分段法能够同时检测出转变点的数量和它们的位置,并能够节约大量运算时间 [7] 。文献 [8] 结合前人方法,将二分分段法和信息准则方法结合来检测均值转变点情况。Stergios Fotopoulos, Venkata Jandhyala (2001) [9] 针对独立同分布于指数分布的一系列的随机变量,用极大似然估计的方法估计分布参数的转变点问题,但其方法是寻找转变点位置的一个近似结果。Inclan和Tao (1994) [10] 用累积平方和的方法解决多个方差转变点的问题,在某种程度上类似于二分分段方法,该方法是节省了计算量,但是检测转变点必须整个时间序列分割,难以保证转变点是全局意义上的。如今Yuehjen E. Shao 和 Ke-Shan Lin (2015) [11] 针对随机变量分布在未知的情况下,提出了一种人工神经网络(ANN)的新方法。
然而总体的参数会是随时间而变的,关于分布参数的转变点 [12] ,文献 [12] [13] 用极大似然的方法来估计参数的转变点。一般转变点问题,常常考虑总体均值和方差的变化情况,且是在假设检验的框架下进行的,基于模型的总体分布是正态 [14] ,这样一来变点问题的推断等价于均值或者方差变化的检测。
2. 方差转变点的检测
Shao 和 Hou (2006) [15] 运用S—控制图和极大似然方法相结合来估计服从gamma分布的随机变量的转变点问题。Wenzhi Zhao, Zheng Tian, Zhiming Xia (2010) [16] 针对有长期记忆的线性过程用比值判别法来检测方差转变点,但是此方法需要一定的限制假设条件。文献 [17] 结合了X控制图与贝叶斯估计方法,文献 [18] 的应用实证中也运用贝叶斯方法来定位找到转变点的位置,通过一系列模拟。结果表明,贝叶斯估计量与之前的信息更准确和更精确。
鉴于以上研究情况,对于正态随机变量的方差多个转变点问题,我们采取将Bayes方法和极大似然方法相结合,先利用经验贝叶斯方法消去多余参数,然后利用极大似然方法寻找转变点位置。
设随机正态变量时间序列,()令,,且
其中表示的是方差转变点的下标,假定有个转变点,转变点下标,。为表达方便,令。转变点将时间序列分割成个时间段,每个时间段里分布相同,,,。在第个时间段中,的均值是0,方差为,的观测数是,。现在的主要问题是如何根据样本去估计转变点的位置以及个数,转变点个数实际上是转变点位置向量的维数。
我们检测的是方差转变点,而方差是样本分布的密度函数,所以将方差
转变点的检测和分析问题最终可看作是样本密度函数的估计问题,然后利用极大似然方法估计其转变点的位置。
因为,()所以的联合分布密度,以及似然函数为:
其中,,为变点的个数。
或者由Inclan (1993)给出的如下联合分布密度函数 [2] :
(1)
其中,,为变点的个数。,,,,令,。
我们要解决问题的关键是参数,,也就是转变点位置和转变点个数,而相对不重要,可看作是多余的参数。如果直接用极大似然方法处理多余参数,存在很多困难,因为和都不知道,而贝叶斯方法就可以处理这种问题。运用贝叶斯公式可得到参数的后验分布密度函数,然后通过后验分布密度对积分可以得到,的边缘分布密度。
2.1. 贝叶斯检测
要运用贝叶斯方法消去多余参数,必须先构造的先验分布。在没有的较好先验信息的情况下,经验贝叶斯方法可以解决此问题。经验贝叶斯的思想是从样本信息中构造的先验分布。
因为,,,,在,给定的条件下有:
(2)
这样可以根据式(2)导出的分布,并把它作为的先验分布。于是就得到的先验分布。这个先验分布用到了样本的信息,因此我们用的是贝叶斯方法。结合式(1)得:
令,,,则
,
,等式两边同时对积分得:
由式(1)知:,则似然函数为:
(,,,)
2.2. 极大似然方法检测
由此可知,要运用贝叶斯方法,还需要知道的先验分布,由于先验信息未知,且的先验分布对问题求解起到至关重要的作用。因此,我们对上面求出的联合密度函数也即是似然函数,用极大似然方法求出,,这样就避开了的先验分布未知的问题。先给定,然后通过将表达式最大化来确定作为转变点个数为时的转变点位置的估计。
以上过程中我们并不是只用贝叶斯一种方法,而是将贝叶斯方法和极大似然方法结合起来,先用贝叶斯方法消去多余参数,然后再用极大似然方法寻找转变点位置。这样既消去了多余参数;又回避了转变点在先验分布上未知的问题;而且极大似然方法的好处是只需要在解空间中找出似然密度函数最大的解,从而使方差多个转变点的检测问题得以解决。
在实际的经济模型应用中,我们经常会碰到既有多余参数又没有什么强的先验信息的情况。单纯利用贝叶斯方法或极大似然方法效果都不理想,这样把贝叶斯方法和极大似然方法结合起来利用各自方法的优点来解决各种问题,是一个较好的选择。可以先用贝叶斯方法消去多余参数,然后再利用极大似然方法估计我们感兴趣的参数。
基于模型总体分布是正态分布下的均值和方差多变点的情况,在前期的研究基础上讨论了同方差下的均值转变点检测问题 [8] ,本文讨论同均值下的方差转变点估计问题,还有不同方差下的均值转变点,以及均值和方差同时有转变点的估计问题 [12] 。以及对于经济模型中参数分布为指数分布、Poisson分布和t分布等情况的转变点结构模型问题,都有待我们去进一步研究和探讨。由于转变点问题常常涉及到非独立随机变量的分布问题,这是非常难以处理的,这个问题的研究在理论上难度很大,富有挑战性。
基金项目
转变点在经济领域中的数学建模与应用探讨(Q20121902),湖北省教育厅科学技术研究计划优秀中青年人才项目。
参考文献