1. 引言
时间序列数据中结构突变与参数渐变并存的现象,在宏观经济波动、金融市场状态切换以及环境系统演变等多个领域[1]-[3]广泛存在。马尔可夫切换时变参数自回归(MS-TVP-AR)模型[4]通过将状态切换的动态离散性与状态内参数的连续时变性相融合,为此提供了具有吸引力的理论框架,但其复杂的双重潜变量结构也为统计推断带来了实质性挑战。传统的极大似然估计方法依赖于非线性滤波技术[5]与数值优化算法。在应对MS-TVP-AR模型时,该方法存在三方面主要局限:高维参数空间与高度非凸的似然函数面使得优化过程极易陷入局部最优,估计结果对初值选择异常敏感;基于频率学框架的点估计难以对时变参数路径与状态识别结果提供完整的不确定性量化;该框架缺乏纳入先验理论信息的自然机制,限制了其在有限样本下的应用稳健性。
贝叶斯推断与马尔可夫链蒙特卡洛方法[6]的结合,为处理此类复杂潜变量模型提供了系统的解决方案。通过将状态序列、时变参数及超参数全部纳入随机变量框架并施加合理的先验分布,不仅能自然融合先验信息,更能通过后验抽样直接获得所有参数的完整分布特征,从而实现对估计不确定性的严谨度量。贝叶斯方法在时变自回归(TVP-AR)模型的估计与推断中已得到长足发展[7]-[9]。进一步地,马尔可夫切换时变参数自回归(MS-TVP-AR)模型,可被构建为一种包含双重潜变量的状态空间形式。尽管贝叶斯框架在状态空间模型[10]-[13]及其子类的估计中已较为成熟,但目前尚缺乏文献将其系统、完整地应用于兼具“状态切换”与“参数时变”双重属性的MS-TVP-AR模型。因此,本文填补这一方法应用上的空白。本研究旨在为MS(2)-TVP-AR(1)模型构建一套完整、稳健的贝叶斯MCMC推断框架。本文的方法论贡献主要体现在三个方面的技术整合:一是通过对数尺度前向滤波–后向抽样(FFBS)算法,解决序列分析中的数值下溢问题,显著提升状态变量抽样的效率与数值稳定性;二是将平稳性先验约束系统性地嵌入时变参数的贝叶斯更新过程中,通过截断正态先验与拒绝抽样机制,保障了模型在经济意义上的长期合理性;三是设计并实现完整的模块化Gibbs采样框架,保证抽样精度。通过模拟研究,我们验证了该框架在参数估计精度、状态识别准确率及计算稳定性方面的优良性能。
2. 模型
考虑一个可观测的单变量时间序列
,本文主要考虑阶数
,状态切换数
的马尔可夫切换时变参数自回归模型[4]。观测方程建立了
与其滞后项、状态依赖的时变参数及误差项之间的联系:
其中
表示时刻
所处的状态,
为状态依赖的截距项,
为状态依赖的时变自回归系数,
为状态依赖的观测噪声方差。时变系数
的演化由以下一阶自回归方程描述:
其中
为漂移项,
为满足平稳性约束
的持久性参数,
为状态依赖的过程扰动方差。不可观测的状态序列
服从一阶齐次马尔可夫链,其转移概率矩阵为:
初始状态
设定为该链的平稳分布
,其中
,
。该模型同时捕捉两种动态切换:离散的马尔可夫链
反映数据的结构性突变,而连续的时变系数
刻画同一状态内回归关系的渐进演化,从而为分析兼具突变与渐变特征的复杂时间序列提供了一种贴合实际的建模框架。
注1:本文中,我们使用
作为状态索引,用以标识所有依赖于状态的模型参数集合,例如
。
3. 贝叶斯推断
本节构建MS(2)-TVP-AR(1)模型的贝叶斯推断框架和MCMC抽样。模型包含三类未知量:固定参数集
、潜在状态序列
以及时变参数路径
。状态变量
服从齐次马尔可夫链,其平稳分布为
,
。对参数设定如下独立共轭先验:
其中正态分布与逆伽玛分布的选取基于共轭性考虑,平稳性约束
保证了时变参数演化过程的经济合理性。给定观测数据
,联合后验分布正比于:
其中:
为从联合后验分布
中高效抽取样本,本文设计了一套基于吉布斯采样的MCMC算法。该算法采用模块化迭代框架,依次对状态序列
、时变参数路径
及固定参数
进行条件抽样。这一综合设计有效应对模型因同时包含离散潜状态与连续时变参数而带来的计算复杂性。
注2:在算法描述中,符号
和
将继续用于遍历状态标签(
)。在参数更新步骤中,
指代目标参数所在的状态;在状态空间模型的概率计算中,
则表示对“当前状态取值为
”这一假设的遍历。
状态序列的更新通过对数尺度的前向滤波–后向抽样(FFBS)算法[14]完成,以实现从条件后验分布
中的高效稳健抽样。该算法的核心在于将对数滤波概率
的递推计算置于对数空间,从而避免长序列中因概率连乘导致的数值下溢。此对数尺度FFBS算法在数学上等价于标准算法,但通过数值稳定的递推公式,为长序列下的状态识别提供了可靠保障,是本文推断框架的基石。前向滤波过程始于平稳分布
,并按以下步骤递推(
):
(1) 预测步:计算
,其中对数求和通过Log-Sum-Exp (LSE)技巧保持稳定。
(2) 更新步:纳入观测似然,
,其中
为正态分布的对数密度。
(3) 归一化:对
进行中心化与归一化处理,确保数值表示稳定。
后向抽样阶段首先依据
抽取
,随后逆向递推(
):在给定
的条件下,依概率
抽取
。
对于时变参数路径的更新,在给定状态序列
后,转化为对两个独立线性高斯状态空间模型的抽样,利用状态空间模型的结构实现整条路径的高效采样。对于每个状态
,我们采用标准的卡尔曼滤波与蒋森平滑(RTS平滑器)算法[15] [16],从条件后验分布
中联合抽取整条路径
。该算法通过前向滤波获得状态的条件分布,再通过后向平滑递归进行抽样,其平滑步的核心公式为:
其中
,
和
为前向滤波的输出。
在贝叶斯推断框架下,固定参数
的条件后验分布得益于共轭先验设计,具有解析形式,从而能够实现高效的精确抽样,无需依赖近似算法。观测方程参数
和
的条件后验分布可直接推导。对于每个状态
,在给定状态序列
和时变参数
后,定义属于该状态的观测集合
及调整后的观测值
(
)。观测误差方差
的条件后验为逆伽马分布:
其中
。给定
,截距项
的条件后验为正态分布:
其后验均值和方差分别为及
。状态方程参数
、
和
的条件后验可通过将系数演化方程重写为线性回归形式得到。定义向量
和设计矩阵
。过程噪声方差
的条件后验为:
其中
。给定
,回归系数
的条件后验为正态分布:
其中
,
,且
,
为先验矩。为满足平稳性要求,对
的抽样需进行拒绝抽样,仅接受满足
的样本。转移概率参数
和
的条件后验基于状态序列的转移计数。令
为从状态
到
的转移次数。结合独立的Beta先验,其后验分布为共轭的Beta分布,可直接精确抽样:
平稳分布的更新是算法迭代中的必要步骤。每次获得新的转移概率
和
后,需重新计算对应马尔可夫链的平稳分布
,其解析表达式为:
更新后的平稳分布将用于下一轮MCMC迭代中状态序列
的前向滤波初始化步骤。
以上所有步骤构成了完整的Gibbs采样循环,各参数块的条件后验均具有标准形式,确保了算法的高效性与稳定性。MS(2)-TVP-AR(1)模型的完整MCMC抽样算法流程总结如下:
(1) 初始化:设定参数初值
、状态序列
及时变系数
。设定先验超参数、总迭代次数
与预烧期
。
(2) 迭代抽样(对于
):
(a) 更新状态序列:使用对数尺度FFBS算法,基于
抽取
。
(b) 更新时变参数:对于
,使用卡尔曼平滑算法,基于
抽取
。
(c) 更新测量方程参数:对于
,从共轭后验中抽取
与
。
(d) 更新转移方程参数:对于
,从共轭后验中抽取
、
与
。
(e) 更新转移概率和平稳分布:抽样
;抽样
。
(3) 输出:丢弃前
次预烧样本,保留剩余的样本集合
用于后续的后验统计推断。
该算法通过融合对数尺度FFBS、卡尔曼平滑与Gibbs采样模块,为MS(2)-TVP-AR(1)模型提供了一个计算稳定、效率良好且易于实现的贝叶斯推断完整解决方案。
尽管本文聚焦于基本形式,但所构建的贝叶斯推断框架具备向更一般的MS(K)-TVP-AR(p)模型扩展的理论基础与算法模块。当状态数
与自回归阶数
的增加,时变参数向量的维度需要扩展,状态方程需以向量化的形式表示,观测方程需扩展为包含
阶滞后项。状态序列抽样仍可采用对数尺度前向滤波—后向抽样算法,但转移概率矩阵
的维度变为
。时变参数的抽样仍可使用卡尔曼平滑算法,但需处理更高维的状态向量与设计矩阵。大多数固定参数的共轭更新步骤形式不变,需调整参数维度。扩展后模型参数数量显著增加,对MCMC抽样的混合效率与计算资源提出更高要求。同时,模型可能存在更严重的似然函数平坦区与状态标签互换等识别问题,需通过施加更细致的先验约束来解决。
4. 模拟实验
为全面评估所提MS(2)-TVP-AR(1)模型的贝叶斯MCMC算法的性能,本节设计了模拟实验。实验采用经济学领域常见的季度GDP增长率数据作为参考,生成符合MS(2)-TVP-AR(1)模型的模拟时间序列,并对所提方法进行多维度评估。代码实现基于R语言,核心算法模块包括对数尺度FFBS、卡尔曼滤波平滑及参数的条件共轭抽样。
参考GDP增长率的典型特征,模型设定两个状态:状态1表示扩张期,状态2表示收缩期。真实参数设定如表1所示,模拟数据时间序列和状态切换如图1所示。
Table 1. True parameters of simulated data
表1. 模拟数据真实参数
参数模块 |
参数 |
状态1 |
状态2 |
经济学解释 |
观测方程 |
|
1.200 |
−0.500 |
状态下的平均增长率 |
|
0.010 |
0.015 |
观测波动性 |
状态方程 |
|
0.100 |
−0.050 |
时变系数的长期漂移 |
|
0.850 |
0.750 |
时变系数演化持续性,满足
|
|
0.002 |
0.005 |
时变系数演化不确定性 |
转移机制 |
|
0.950 |
0.900 |
状态持续性 |
Figure 1. Time series and state transition diagram
图1. 时间序列和状态切换图
基于上述参数,模拟25年季度数据,生成长度
的时间序列。生成的数据中,扩张期实际占比61.0%,出现了5个完整的扩张阶段,平均长度为12.2季度;收缩期占比39.0%,出现了5个阶段,平均长度为7.8季度。生成的GDP增长率序列范围在[−0.71%, 4.34%]之间,均值为1.38%,标准差为1.58%,与设定的参数特征相符。
采用两条独立的MCMC链进行后验推断,每条链运行8000次迭代,舍弃前3000次作为烧退期,之后每5次迭代保留一个样本,最终每条链获得1000个有效样本。算法为所有未知参数设置了如表2的共轭或弱信息先验分布。
Table 2. Prior distribution of parameters
表2. 参数的先验分布
参数 |
先验分布 |
超参数设定 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
采用Gelman-Rubin统计量
对两条MCMC链的收敛性进行综合评估。所有参数的
值均在1.000至1.006之间,远低于1.1的临界标准,且其97.5%分位数上限也均低于1.1,表明两条MCMC链已充分混合,收敛至同一后验分布。基于合并两条链的后验样本,计算各参数的后验均值、标准差及95%置信区间,并与真实值进行对比,结果如表3所示。各个参数的后验分布直方图如图2所示。
Table 3. Parameter estimation
表3. 参数估计
参数 |
真实值 |
后验均值 |
后验标准差 |
95%置信区间 |
区间包含真实值 |
|
1.200 |
1.233 |
0.037 |
[1.159, 1.303] |
是 |
|
−0.500 |
−0.541 |
0.027 |
[−0.592, −0.489] |
是 |
|
0.010 |
0.010 |
0.003 |
[0.006, 0.018] |
是 |
|
0.015 |
0.011 |
0.003 |
[0.006, 0.019] |
是 |
|
0.100 |
0.129 |
0.019 |
[0.092, 0.167] |
是 |
|
−0.050 |
−0.057 |
0.019 |
[−0.092, −0.018] |
是 |
|
0.850 |
0.810 |
0.035 |
[0.741, 0.876] |
是 |
|
0.750 |
0.772 |
0.055 |
[0.646, 0.870] |
是 |
|
0.002 |
0.002 |
0.001 |
[0.001, 0.003] |
是 |
|
0.005 |
0.004 |
0.002 |
[0.001, 0.009] |
是 |
|
0.950 |
0.937 |
0.027 |
[0.875, 0.978] |
是 |
|
0.900 |
0.878 |
0.047 |
[0.769, 0.953] |
是 |
表3的参数估计结果显示,在12个主要参数中,只有参数
的偏差略高于5%,绝大多数的后验均值相对偏差低于5%,表明模型整体上能够准确恢复参数。例如,核心参数
估计为0.937,真实值为0.950,偏差仅1.4%;
估计为0.810,真实值为0.850,偏差为4.7%。图2展示了各参数的MCMC采样后验分布,红色实线表示真实值,黑色虚线表示后验均值,灰色虚线分别表示95%置信区间的上限和下限。所有真实值均落在其对应的95%后验置信区间内,覆盖率为100%,表明贝叶斯方法能够合理地量化参数估计的不确定性。时变参数的自回归系数
和
的后验估计均满足
的平稳性约束。该模型对模拟数据的样本内拟合如图3所示,由图可以看出拟合效果良好,RMSE为0.079%,MAE为0.062%,MAPE为8.394%。通过计算每个时间点上状态的后验概率,并取概率众数作为状态估计,模型对隐状态序列的恢复准确率达到100%,能准确识别经济周期切换时点。后验状态概率在真实状态发生转换的时刻呈现清晰、急剧的跳跃,表明模型能精准捕捉经济周期的转折点。
Figure 2. Histogram of posterior distribution
图2. 后验分布直方图
Figure 3. Growth rate fitting plot
图3. 增长率拟合图
5. 总结
本文提出了MS(2)-TVP-AR(1)模型的贝叶斯推断方法。算法通过引入对数尺度FFBS解决状态序列抽样的数值下溢问题,采用平稳性先验约束保障时变参数的合理演化,并利用共轭先验实现了转移概率和其他参数的高效更新。基于经济周期特征的模拟实验表明,该方法收敛稳健,所有参数的Gelman-Rubin统计量
。参数估计表现良好,核心参数的估计偏差普遍较小,95%后验置信区间均覆盖真实值,且对隐含状态序列的识别准确率达到100%。本文实现该模型首个完整的贝叶斯计算方案,其系统架构与验证结果为该模型在实证研究中的推广应用提供可靠的技术基础。