1. 引言
在时间序列分析领域中,随机系数自回归模型作为一类重要的非线性时间序列模型,因其能够有效刻画数据中存在的条件异方差性和动态结构突变而受到广泛关注。与传统自回归模型假定系数为固定参数不同,RCAR模型将系数视为随机变量,从而赋予模型更强的灵活性和适应性,能够捕捉金融时间序列、环境数据以及经济指标中常见的复杂特征。随着数据分析需求的增长,RCAR模型的理论研究与应用价值日益凸显,其中Conlisk [1]提出的一阶RCAR (1)模型作为基础模型,成为早期研究的核心载体,其模型表达式如下:
在RCAR (1)模型的参数估计方面,近十年的研究方法主要集中在矩估计方法、极大似然估计以及贝叶斯方法等。Nicholls [2]研究了RCAR (1)模型的基本统计特性,以及与该模型相关参数的推理方法。Basu [3]研究了该模型参数的经验似然估计量和部分最小二乘估计量的最优性;Hallin [4]证明了在一定条件下,RCAR (1)模型是平稳的;Wang [5]运用贝叶斯估计方法对RCAR模型中的参数进行估计,进而对模型进行预测和实证分析;Sheng [6]等人使用条件最小二乘法、分位数回归和条件最大似然法来估计模型参数,并进行了模拟研究和两种真实数据示例的应用,结果显示,所提程序在模拟和应用中表现良好;Zhao [7]基于经验似然方法对RCAR模型中的系数进行了随机性检验,并给出实例;Bi [8]进一步使用局部最大功效法检验RCAR (1)模型中系数恒定性的问题,并通过模拟研究说明了该方法的可行性。
现有文献大多聚焦于参数估计问题,而对系数随机性检验关注不足。特别是在实际应用中,确定一个时间序列是否真正具有随机系数特性,而非固定系数过程,是一个至关重要但尚未很好解决的问题。这一局限性在更高阶的RCAR(p)模型中表现得更为明显,也为本研究提供了重要的动机。随着研究深入,学者们发现一阶模型难以捕捉现实时间序列中更为复杂的结构,于是将研究扩展至高阶随机系数自回归模型(RCAR(p))。
RCAR(p)模型的一般形式可表示为:
Fink Thorsten [9]详细介绍了通过卡尔曼算法来估计RCAR(p)模型参数;Proïa [10]研究了RCAR(p)模型中系数的非零序列相关性,并给出了相关性质;Akharif [11]对随机系数自回归模型系数进行检验时,提出了一种新的方法来估计模型参数;Saidi等人[12]研究了一种用于估计RCAR(p)未知参数的最大似然估计方法,其模拟部分表明该估计方法的有效性和准确性;Benmoumen [13]研究了p阶随机系数自回归模型的极大似然估计量的强一致性,并将改进的最小二乘法和经验似然法应用于多变量一阶随机系数自回归(RCAR(1))模型,进行随机系数检验和未知参数估计,并将该方法推广到p阶RCAR模型。
然而,关于p阶随机系数自回归(RCAR)模型系数随机性检验方法的研究仍存在不足。现有方法大多基于贝叶斯估计、经验似然估计和矩估计等方法。局部最大功效检验(LMP)法,因其计算简便且在局部具有高效性,已被广泛应用于时间序列模型的统计推断。近年来,LMP检验的应用范围进一步扩展,已被用于多变量时间序列模型、GARCH模型等多种模型的研究。然而,目前尚未有文献将LMP检验应用于RCAR(p)模型,以检验其系数的恒定性。因此,本研究基于RCAR(p)模型,运用LMP方法对其参数进行检验,推导出检验统计量的具体形式,分析其统计性质,并验证该检验方法的可行性,为进一步发展和应用RCAR(p)模型提供参考。
2. 模型介绍
2.1. RCAR(p)模型
P阶随机系数自回归RCAR(p)过程表达式如下:
(1)
展开为如下的迭代方程:
(2)
其中:
1)
是
阶的随机系数向量,且
为独立同分布随机变量序列,分布函数为
;
,
,
;
2)
是一列独立同分布随机变量序列;且
为密度函数,均值为0,方差为
;同时满足
和
相互独立。
2.2. 局部最大功效检验
在本节中,研究了局部最大功效法(LMP)在p阶随机系数自回归模型中的应用,并建立了LMP检验统计量获得了统计量的极限分布。对于模型(2),为了检验随机系数
是否具有随机性,等于检验随机系数的协方差矩阵是否等于零,为了叙述方便,记
,因此考虑如下检验问题:
即在备择假设条件下,参数的方差至少有一个非零。
设:
为模型的一组连续观测值,且
是独立同分布随机变量序列,分布函数为
,
是独立同分布随机变量序列;且
为密度函数,为了构造局部最大功效法的检验统计量,做出以下假设:
假设存在
的一个邻域
和正实值函数
使得:
1)
;
2)
;
3)
;
4) 对于
时,且
,有
,
,
和
在
内关于
连续有界。
由于
是马尔可夫链,因此转移概率可以表示为:
则模型(2)的对数条件似然函数为:
(3)
其中
表示在时刻
时的观测数值;
表示给定
时
的转移概率;因此
的概率密度函数为
。
所以对数似然函数可表示为:
似然函数
的泰勒级数展开式为:
其中
;如果
,得出
,随机变量
的分布函数是退化的,进而得出:
在原假设条件下,对数似然函数
进行求导,可得到以下方程:
(4)
将
的极大似然估计值
代入上式中,得出LMP检验统计量为:
(5)
其中
得出,,并且验证出
是零均值鞅。
利用鞅的中心极限定理,可以得出如下引理:
引理1:假设条件
(Y1)
(Y2)
成立时,当
时,可得
其中
引理2:在(1)和(2)的条件下,当
时,有
其中
引理3:假设条件(1)和(2)成立,当
时,有
下面的定理表明,LMP统计量服从自由度为
的卡方分布:
定理1:假设条件(1)~(4)成立,则在
下,当
时,有
其中
,
的二次型是依分布收敛的。
定理2:设
是一个严格平稳遍历的随机变量序列,在假设条件(1)~(4)成立时,LMP统计量的极限分布为:
其中,
表示自由度为
的卡方分布。
3. 模拟研究
本节通过数值模拟说明局部最大功效检验法(LMP)的合理性,分别模拟了模型阶数为二、三、四三种情形下的结果,其中对于二阶模型的模拟过程,与经验似然估计法(EL)形成对比。此外,假定误差项服从正态分布和混合正态分布两种情况,样本量为
,显著性水平为0.1,从检验水平和检验功效两个方面进行模拟,在每次模拟的过程中,设初值
,表中呈现的全部模拟结果都是在R软件下进行1000次重复试验完成的。
3.1. 检验水平
在检验水平层面,模拟了当原假设为真时接受原假设的概率,假定模拟的序列来自如下的三种模型:
(P1)
(P2)
(P3)
混合正态分布
在模拟过程中,模型(P1)~(P3)中的误差项均假设服从正态分布和混合正态分布两种情况,当误差项服从正态分布
时,令
;当误差项服从混合正态分布时,其分布函数为:
其中
为一常数,满足
,
为标准正态分布函数,
,模拟时取
和
两组参数。
首先,对于模型(P1),取参数
,
,模型(P1)的模拟结果在表1中给出;其次,对于模型(P2),取参数
,
,
,模型(P2)的模拟结果在表2中给出;最后,模型(P3)中参数的取值情况以及相应的模拟结果在表3中给出。
Table 1. Empirical sizes for Model (P1)
表1. 模型(P1)检验水平
参数 |
方法 |
样本量 |
|
|
100 |
300 |
500 |
700 |
1000 |
5000 |
(0.1, 0.15) |
LMP |
0.308 |
0.183 |
0.169 |
0.164 |
0.140 |
0.115 |
EL |
0.101 |
0.122 |
0.109 |
0.110 |
0.121 |
0.150 |
(0.1, 0.3) |
LMP |
0.309 |
0.183 |
0.163 |
0.157 |
0.137 |
0.116 |
EL |
0.105 |
0.112 |
0.113 |
0.110 |
0.128 |
0.153 |
(0.1, 0.45) |
LMP |
0.308 |
0.199 |
0.152 |
0.175 |
0.117 |
0.127 |
EL |
0.074 |
0.086 |
0.116 |
0.122 |
0.123 |
0.126 |
(0.1, 0.6) |
LMP |
0.307 |
0.210 |
0.161 |
0.155 |
0.114 |
0.115 |
EL |
0.101 |
0.103 |
0.123 |
0.115 |
0.145 |
0.151 |
Table 2. Empirical sizes for Model (P2)
表2. 模型(P2)检验水平
参数 |
样本量 |
|
100 |
300 |
500 |
700 |
1000 |
5000 |
(0.3, 0.2, 0.2) |
0.334 |
0.239 |
0.214 |
0.179 |
0.155 |
0.112 |
(0.3, 0.2, 0.3) |
0.362 |
0.252 |
0.199 |
0.184 |
0.157 |
0.108 |
(0.3, 0.2, 0.4) |
0.340 |
0.249 |
0.182 |
0.169 |
0.149 |
0.100 |
(0.4, 0.1, 0.1) |
0.378 |
0.257 |
0.197 |
0.182 |
0.160 |
0.115 |
(0.4, 0.1, 0.2) |
0.354 |
0.246 |
0.205 |
0.168 |
0.147 |
0.121 |
(0.4, 0.1, 0.3) |
0.356 |
0.277 |
0.194 |
0.181 |
0.148 |
0.125 |
(0.5, 0.1, 0.1) |
0.356 |
0.248 |
0.194 |
0.170 |
0.144 |
0.124 |
(0.5, 0.1, 0.2) |
0.359 |
0.246 |
0.198 |
0.179 |
0.136 |
0.122 |
(0.5, 0.1, 0.3) |
0.341 |
0.235 |
0.194 |
0.168 |
0.142 |
0.120 |
Table 3. Empirical sizes for Model (P3)
表3. 模型(P3)检验水平
参数 |
样本量 |
|
100 |
300 |
500 |
700 |
1000 |
5000 |
|
|
(0.3, 0.1, 0.1, 0.1) |
0.367 |
0.253 |
0.197 |
0.183 |
0.152 |
0.118 |
(0.4, 0.1, 0.1, 0.1) |
0.359 |
0.275 |
0.223 |
0.179 |
0.145 |
0.121 |
(0.5, 0.1, 0.1, 0.1) |
0.354 |
0.234 |
0.195 |
0.172 |
0.147 |
0.119 |
(0.6, 0.1, 0.1, 0.1) |
0.345 |
0.219 |
0.198 |
0.183 |
0.149 |
0.102 |
(0.3, 0.1, 0.1, 0.2) |
0.347 |
0.262 |
0.215 |
0.197 |
0.150 |
0.137 |
(0.3, 0.1, 0.1, 0.3) |
0.369 |
0.220 |
0.197 |
0.180 |
0.144 |
0.112 |
(0.3, 0.1, 0.2, 0.2) |
0.360 |
0.233 |
0.204 |
0.183 |
0.165 |
0.122 |
(0.3, 0.1, 0.2, 0.3) |
0.345 |
0.254 |
0.197 |
0.170 |
0.152 |
0.108 |
|
|
(0.3, 0.1, 0.1, 0.1) |
0.393 |
0.262 |
0.209 |
0.175 |
0.160 |
0.115 |
(0.4, 0.1, 0.1, 0.1) |
0.343 |
0.238 |
0.216 |
0.168 |
0.137 |
0.112 |
(0.5, 0.1, 0.1, 0.1) |
0.375 |
0.229 |
0.194 |
0.172 |
0.148 |
0.114 |
(0.6, 0.1, 0.1, 0.1) |
0.346 |
0.234 |
0.189 |
0.173 |
0.145 |
0.106 |
(0.3, 0.1, 0.1, 0.2) |
0.332 |
0.234 |
0.202 |
0.174 |
0.152 |
0.102 |
(0.3, 0.1, 0.1, 0.3) |
0.345 |
0.256 |
0.203 |
0.174 |
0.149 |
0.126 |
(0.3, 0.1, 0.2, 0.2) |
0.367 |
0.254 |
0.202 |
0.167 |
0.150 |
0.113 |
(0.3, 0.1, 0.2, 0.3) |
0.345 |
0.225 |
0.195 |
0.175 |
0.131 |
0.118 |
从表1的模拟结果中可以看出,当样本量较小时(例如100、300),两种方法的检验水平存在较大偏差;但随着样本量的增大,LMP的检验水平逐渐降低,并趋于0.1,当样本量为5000时,对于不同参数的情况时,LMP检验均接近0.1,而EL方法随着样本量的逐渐增大,检验水平逐渐减小,趋于0.1的速度较慢,和LMP检验结果存在一定偏差;从表2,表3中可以看出,无论模型的阶数是3阶还是4阶,随着样本量的逐渐增大,LMP检验水平逐渐趋于0.1;因此得出以下结论,无论误差项服从正态分布还是混合正态分布的情形时,对于不同的参数和不同的样本量,LMP检验法都具有较好的检验结果。而且,随着样本量的不断增大,检验结果越来越接近0.1,这说明局部最大功效检验法具有一定的稳健性,在检验水平层面有很好的表现。
3.2. 检验功效
在检验功效层面,分别模拟了模型阶数为二、三、四三种情形下的结果,对于二阶模型的模拟过程,同样选择了局部最大功效法和经验似然估计法,模拟了当备择假设为真时拒绝原假设的概率,假定模拟的序列来自如下的三种模型:
(S1)
(S2)
(S3)
混合正态分布
模拟时同样假设误差项服从正态分布和混合正态分布两种情况,当误差项服从正态分布
时,令
;当误差项服从混合正态分布时,参数为
。首先,对于模型(S1),假设
是一个固定的常数,
是一个参数为
的贝塔分布的随机变量序列,模拟结果在表4中给出;其次,对模型(S2),假设系数
及误差项都为正态误差情形,模拟结果在表5中给出;最后对模型(S3)的参数取值和模拟结果均在表6中给出。
Table 4. Empirical powers for Model (S1)
表4. 模型(S1)检验功效
参数 |
方法 |
样本量 |
|
|
|
100 |
300 |
500 |
700 |
1000 |
5000 |
0.40 |
(0.5, 1.5) |
LMP |
0.332 |
0.281 |
0.279 |
0.315 |
0.379 |
0.943 |
EL |
0.171 |
0.335 |
0.400 |
0.531 |
0.646 |
0.989 |
0.45 |
(0.5, 1.5) |
LMP |
0.343 |
0.271 |
0.300 |
0.258 |
0.388 |
0.975 |
EL |
0.153 |
0.336 |
0.452 |
0.538 |
0.633 |
0.990 |
0.50 |
(0.5, 1.5) |
LMP |
0.327 |
0.250 |
0.271 |
0.320 |
0.385 |
0.989 |
EL |
0.168 |
0.314 |
0.402 |
0.537 |
0.650 |
0.991 |
0.55 |
(0.5, 1.5) |
LMP |
0.311 |
0.272 |
0.306 |
0.313 |
0.379 |
1.000 |
EL |
0.165 |
0.333 |
0.474 |
0.520 |
0.622 |
1.000 |
0.60 |
(0.5, 1.5) |
LMP |
0.294 |
0.245 |
0.282 |
0.300 |
0.349 |
1.000 |
EL |
0.167 |
0.325 |
0.416 |
0.522 |
0.627 |
1.000 |
Table 5. Empirical powers for Model (S2)
表5. 模型(S2)检验功效
参数 |
样本量 |
|
|
100 |
300 |
500 |
700 |
1000 |
5000 |
|
(0.1, 0.3) |
(0.1, 0.3) |
0.423 |
0.702 |
0.882 |
0.948 |
0.985 |
0.996 |
(0.1, 0.36) |
0.460 |
0.746 |
0.914 |
0.963 |
0.980 |
1.000 |
(0.1, 0.4) |
0.496 |
0.779 |
0.920 |
0.971 |
0.983 |
1.000 |
(0.1, 0.46) |
0.519 |
0.818 |
0.922 |
0.959 |
0.984 |
1.000 |
(0.1, 0.46) |
(0.1, 0.3) |
0.494 |
0.829 |
0.937 |
0.964 |
0.987 |
1.000 |
(0.1, 0.36) |
0.534 |
0.835 |
0.927 |
0.943 |
0.986 |
1.000 |
(0.1, 0.4) |
0.538 |
0.840 |
0.935 |
0.944 |
0.964 |
1.000 |
(0.1, 0.46) |
0.570 |
0.849 |
0.945 |
0.952 |
0.966 |
1.000 |
Table 6. Empirical powers for Model (S3)
表6. 模型(S3)检验功效
参数 |
样本量 |
|
|
100 |
300 |
500 |
700 |
1000 |
5000 |
|
(0.5, 2) |
(0.5, 2) |
0.454 |
0.700 |
0.869 |
0.937 |
0.966 |
0.994 |
(0.5, 2) |
(0.5, 2.5) |
0.443 |
0.691 |
0.834 |
0.918 |
0.962 |
1.000 |
(0.5, 2) |
(0.5, 3) |
0.441 |
0.705 |
0.860 |
0.916 |
0.976 |
1.000 |
(0.5, 3) |
(0.5, 2) |
0.430 |
0.689 |
0.861 |
0.925 |
0.971 |
1.000 |
(0.5, 3) |
(0.5, 2.5) |
0.442 |
0.664 |
0.827 |
0.926 |
0.970 |
0.999 |
(0.5, 3) |
(0.5, 3) |
0.469 |
0.658 |
0.825 |
0.914 |
0.968 |
0.999 |
|
(0.5, 2) |
(0.5, 2) |
0.461 |
0.725 |
0.869 |
0.939 |
0.959 |
1.000 |
(0.5, 2) |
(0.5, 2.5) |
0.464 |
0.702 |
0.841 |
0.935 |
0.975 |
1.000 |
(0.5, 2) |
(0.5, 3) |
0.456 |
0.711 |
0.855 |
0.928 |
0.979 |
1.000 |
(0.5, 3) |
(0.5, 2) |
0.441 |
0.676 |
0.830 |
0.904 |
0.968 |
1.000 |
(0.5, 3) |
(0.5, 2.5) |
0.435 |
0.674 |
0.840 |
0.912 |
0.966 |
1.000 |
(0.5, 3) |
(0.5, 3) |
0.445 |
0.672 |
0.838 |
0.917 |
0.977 |
1.000 |
从表4的模拟结果可以看出,当系数
固定时,二者检验功效随着
取值的增大而增大,随着样本量的逐渐增大,检验功效也会随着增加,并趋近于1;从表5中的模拟结果可以得出,当系数
方差不变时,LMP检验功效随着
的方差增大而增大;从表6中可得出,与二阶、三阶模拟结果类似,LMP检验功效随着系数方差的增大而增大,在样本量足够大时,检验功效越来越接近于1,且增长速度更快。当样本量较小时(例如100或300),两种方法的检验功效均偏低;随着样本量的增大,这两种方法的检验功效均显著提升,当样本量为5000时,两者的检验功效均接近1;随机系数方差越大,LMP检验的检验功效趋近1的速度越快,这个结果与检验水平的结果一致;此外,在系数相同的情况下,发现误差项的方差的增大也有类似的效果。
综上,当系数
为常数或服从正态分布以及贝塔分布时,无论误差项服从正态分布或是混合正态分布的情形,局部最大功效法都具有较高的功效。对于不同的污染水平,不同的参数及不同的样本量,局部最大功效法的检验功效会随着样本量的不断增大越来越接近1。即当备择假设为真时有较大的概率拒绝原假设。模拟结果表明局部最大功效法是一个非常好的检验高阶自回归模型中的系数随机性的方法。
4. 实例分析
在本节中,对1991年6月至2013年9月意大利固定资本形成总额(GFCF)的季度环比增长率进行研究,共有90个观测值,表示为
,如图1(a)所示。通过对该组数据进行中心化变换后
所得的数据样本路径图,如图(b)所示,这意味着
表现出自回归时间序列过程效应。同时,在图2,图3中绘制了
的样本ACF和PACF图,从中得出
是来自平稳的二阶自回归过程。
Figure 1. (a) Observation data sampling path diagram of
; (b) Real data sample path diagram of
图1. (a) 观测数据
采样路径图;(b) 真实数据
样本路径图
Figure 2. ACF diagram of
图2.
的ACF图
Figure 3. PACF diagram of
图3.
的PACF图
Figure 4. The normal QQ diagram of
图4.
的正态QQ图
最后,绘制了
的正态分布Q-Q图检验残差数据的正态性,如图4所示,与对应的正态Q-Q线比较,得出数据
来自正态分布总体。通过计算检验统计量的值为12.4606,P值为0.00197,这表明在显著性水平为0.1的情况下拒绝原假设。由此得出,RCAR (2)模型对数据进行拟合比AR (2)模型更合理。综上,通过一组实例说明了LMP检验法在实际生活中的可行性。
5. 结论
本文运用局部最大功效检验法(LMP),检验RCAR(p)模型系数的恒定性问题。利用LMP法构造了模型参数的检验统计量,并推导了它的极限性质,证明了检验统计量极限分布为卡方分布。通过随机模拟结果得出:1) 随着样本量的增大,LMP检验水平更接近于0.1;2) 随着样本容量的增大,LMP检验功效更接近1,有较好的功效优势。模拟结果验证了该方法的可行性。最后,将其应用于意大利的一组经济数据的实证分析中,表明RCAR (2)模型适用于主要的GFCF数据。同时说明了局部最大功效法计算简单、易于实现,是检验自回归模型中系数具有随机性的较好方法。