1. 绪论
1.1. 研究背景
近年来,我国经济已由高速增长阶段转向高质量发展阶段,居民收入水平的提升成为衡量社会发展成果的重要指标。全国居民人均可支配收入作为反映民生福祉和经济活力的核心数据,其增长趋势与政策调控、产业结构优化及社会公平性密切相关。当前,国家正全面推进共同富裕战略,明确提出“扩大中等收入群体,增加低收入群体收入”,旨在通过优化收入分配格局,缩小城乡、区域和行业差距,构建更加包容的经济发展模式[1]。在此背景下,精准预测居民可支配收入变化,对落实共同富裕目标具有重要现实意义。
与此同时,全球供应链重构与国内经济“双循环”新格局的推进,对居民收入结构产生了深远影响。新冠疫情后,数字经济、平台经济等新业态加速发展,成为居民增收的新引擎。2023年国务院发布的《“十四五”数字经济发展规划》提出“以数字化赋能传统产业,创造更多高质量就业岗位”,这一政策导向直接关联居民工资性收入和经营性收入的增长潜力。然而,外部环境的不确定性以及人口老龄化加剧,也为居民收入的可持续增长带来挑战。
此外,乡村振兴战略的深化实施进一步凸显了城乡收入均衡的重要性。2024年中央一号文件再次强调“促进农民农村共同富裕”,通过产业帮扶、土地制度改革等措施提升农村居民财产性收入。但城乡收入差距仍是制约社会公平的突出问题,2023年数据显示,城镇居民人均可支配收入为农村居民的2.5倍。如何通过政策干预和市场机制协同作用缩小这一差距,成为亟待解决的课题。
综上,在全国经济转型升级与政策密集发力的关键期,科学预测居民可支配收入趋势,既是评估政策成效的工具,也是优化资源配置、防范经济风险的基础。
1.2. 研究目的及意义
本文旨在分析全国居民人均可支配收入的动态变化规律,探索其未来发展趋势,为政策制定者提供数据驱动的决策依据。通过量化评估不同因素对收入增长的影响权重,明确当前收入分配格局中的关键矛盾点,助力共同富裕目标的阶段性落实。同时,揭示新经济形态(如数字经济)与传统产业转型对居民收入的差异化贡献,为企业和个人优化收入结构提供参考。
从现实意义看,精准的收入预测能够帮助政府提前布局社会保障、税收调节等政策工具,避免经济波动对社会稳定的冲击。在经济下行压力加大的背景下,预测结果可为定向发放消费补贴、调整最低工资标准等提供科学支持。对企业而言,居民收入趋势预测有助于预判市场需求变化,优化产品定位与供应链管理,从而在竞争中抢占先机。对居民个体,了解收入增长预期可引导其合理规划消费、储蓄与投资,提升家庭财务健康水平。
1.3. 文献综述
1.3.1. 居民收入影响因素研究
学者普遍认为居民可支配收入受宏观经济政策、产业结构、人口结构等多因素影响。国内研究方面,陶奕竹通过实证分析指出,数字普惠金融通过缓解融资约束显著提升了农村居民收入,但其效果存在区域异质性[2]。王雅婷等基于上海市数据发现,公共卫生事件对低收入群体冲击更为显著,凸显社会保障体系完善的重要性[3]。国外学者如Kuznets提出的“倒U型曲线”理论,揭示了经济发展初期收入差距扩大的必然性,但后期可通过政策干预实现收敛[4]。
1.3.2. 收入预测方法研究
传统预测方法多依赖时间序列模型。黎可馨采用季节性ARIMA模型对中国货物周转量进行短期预测,验证了其在捕捉周期性波动中的有效性[5]。国外研究中,Hyndman等开发的指数平滑法(ETS)因灵活处理趋势与季节性特征,被广泛应用于经济指标预测[6]。然而,现有研究较少对比不同模型在居民收入预测中的适用性,且多局限于单一区域或短期分析,缺乏全国层面的长期趋势探讨。
1.4. 研究方法及数据概述
1.4.1. 研究方法
① ARIMA乘积季节模型介绍
(1) ARMA模型
ARMA模型的全称是自回归移动平均模型,是一类常用的随机时序模型,是一种预测精度较高的短期预测方法。基本思想是:某些时间序列是依赖于时间t的一组随机变量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型近似描述,通过对该模型的分析研究,能够更本质地认识时间序列的结构与特征,达到最小方差意义下的最优预测[7]。ARMA (p, q)模型结构如下:
(1)
(2)
(3)
(4)
其中,
为自回归结构部分的系数,
条件限制了模型自回归部分的最高阶数为
。
为移动平均结构部分的系数,
条件限制了模型移动平均部分的最高阶数为
,
条件表明
是均值为0的白噪声序列,
条件表明当前的扰动对过去的时间序列没有影响。
引进延迟算子
,
模型又可以简记为:
(5)
(6)
(7)
模型的平稳条件是
阶自回归系数多项式
的根都在单位圆外。
模型的可逆条件为
阶移动平均系数多项式
的根都在单位圆外。
(2) ARIMA模型
模型要求序列是平稳的,对于非平稳序列,可以将其平稳化处理。如果序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳;若序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响;对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息。差分运算与
模型的组合就是
模型,具体结构如下:
(8)
(9)
(10)
(11)
估计
模型同估计
具体的步骤相同,唯一不同的是在估计之前要确定原序列的差分阶数
,对
进行
阶差分。因此
模型区别于
模型之处就在于前者的自回归部分的特征多项式含有
个单位根。
(3) ARIMA乘积季节模型
模型可以对具有季节效应的序列建模。当序列的季节效应,长期趋势效应和随机波动之间存在复杂的相互关系时,需要采用乘积季节模型。它的构造原理是:当序列具有短期相关性时,通常使用低阶的
模型提取;当序列具有季节效应时,季节本身还具有相关性,季节相关性可以使用以同期步长为单位的
提取[8]。由于短期相关性和季节效应之间具有乘积关系,所以拟合模型实质为
与
的乘积。
因此,
乘积季节模型
模型表示为
,对原观察值序列拟合的乘法模型的完整结构如下:
(12)
式中:
(13)
(14)
(15)
其中,
为非季节自回归阶数,
为非季节差分阶数,
为非季节移动平均阶数,
为季节自回归阶数,
为季节差分阶数,
为季节移动平均阶数,
为季节长度,
为延迟算子,
为
阶自回归系数多项式,
为
阶移动平均系数多项式,
为零均值白噪声序列,
为全国居民人均可支配收入序列,
为
阶差分,
为
阶以周期
为步长的季节差分。
(4) ARIMA乘积季节模型的构建
第一,数据预处理。以时间变量为横坐标,全国居民人均可支配收入为纵坐标,构建时序图,观察平稳性,并判断是否为非白噪声序列,若为非平稳序列,则需对数据进行差分或季节性差分以达到平稳。
第二,模型识别。通过自相关系数和偏自相关系数识别模型类型并初步确定p,d,q和P,D,Q的阶值。若自相关函数为拖尾,偏自相关函数为截尾,适合AR模型;若自相关函数为截尾,偏自相关函数为拖尾,适合MA模型;若自相关函数为拖尾,偏自相关函数为拖尾,适合ARIMA模型[9]。
第三,参数估计和模型诊断。运用条件最小二乘估计模型参数,参数检验采用t统计量;通过AIC和BIC来选择最合适的模型,AIC和BIC越小模型越优。使用Box-Ljung LB统计量检验模型残差进行白噪声检验,若为白噪声序列,则模型建立有效。
第四,模型预测效果评估和模型预测趋势。运用最优的ARIMA模型,对2024年3月至2024年9月的数据进行预测,并通过对比实际值和预测值的相对误差来检验该模型的准确性。而后对2025年和2026年的全国人均可支配收入进行预测。
② 指数平滑模型介绍
指数平滑法是布朗提出的一种在移动平均法的基础上发展而来的时间序列分析预测方法,通过计算指数平滑系数,配合以时间序列预测模型对未来的现象做出预测。事实上,大多数随机事件,一般都是近期的数据会对现在的影响大,远期的数据会对现在的影响小。指数平滑法的基本思想就是考虑时间间隔对时间发展的影响,并且各期权重随时间间隔的增大呈指数衰减。指数平滑法的预测步骤为:(1) 绘制序列图;(2) 根据序列图确定有效参数;(3) 绘制拟合曲线图,并观察拟合;(4) 建立指数平滑模型,对数据进行预测。
根据序列是否具有长期趋势与季节效应,可以把序列分为3大类,采用3种不同的指数平滑模型进行序列预测,具体模型选择见表1。
Table 1. Applicable scenarios of exponential smoothing forecasting models
表1. 指数平滑预测模型的使用场合
预测模型选择 |
长期趋势 |
季节效应 |
简单指数平滑 |
无 |
无 |
两参数指数平滑 |
有 |
无 |
三参数指数平滑 |
有/无 |
有 |
指数平滑模型含有常规参数、趋势参数和季节参数等3个重要参数,通常情况下,应综合运用整体均值、整体趋势以及季节性进行预测,通过不同参数值的组合进行拟合。在选择较优模型时,通过比较均方根误差、平均绝对误差百分比、平均绝对误差的数值,综合选取最优模型,并对模型的预测效果进行评价。
1.4.2. 数据来源
本文数据源于国家统计局发布的主要经济数据中全国月度人民生活中的居民人均收入情况数据,主要收集了2013年3月至2024年9月全国居民人均可支配收入数据。其中,2013年3月至2023年12月居民人均收入数据用于模型初次拟合,2024年3月至2024年9月居民人均收入数据用于检验。本文采用R4.1.1软件对数据进行建模和预测分析。
2. 全国居民人均可支配收入及趋势分析
利用R软件对2013~2023年的全国居民人均可支配收入进行时间序列分析,由原始人均收入的时序图(图1)可看出,全国居民人均收入呈现出明显的季节性,每年的冬季呈现高峰,在春季出现低谷,这种现象的出现可能归因于多个因素的共同作用。从经济活动的角度来看,冬季是许多行业的销售旺季,这些行业的繁荣带动了相关从业人员的收入增长。同时,一些季节性强的行业,如农业、渔业等,在冬季可能处于收获或销售的高峰期,也增加了居民的收入。相比之下,春季往往是这些行业的淡季,居民收入可能会受到一定影响。从就业和劳动力市场的角度来看,冬季可能由于节假日、天气等因素,导致一些行业的劳动力需求增加,如服务业、旅游业等,从而提高了相关行业的工资水平。而春季则可能出现劳动力市场的调整期,如春节后的返工潮,部分灵活就业人员或异地就业人士可能还在寻找工作机会,导致整体收入水平在一段时间内相对较低。
Figure 1. 2013~2023 quarterly per capita disposable income of national residents original time series
图1. 2013~2023年季度全国居民人均可支配收入原始时序图
3. ARIMA乘积季节模型与指数平滑模型预测效果评估及对比结果
3.1. ARIMA乘积季节模型
3.1.1. 差分平稳
由于原始序列不满足平稳性要求,需要进一步采用差分处理数据的波动性,设D = 1,经过一阶季节差分后,由图2可看出,差分后序列已经没有非常显著的趋势特征,基本围绕着0值波动。为进一步确定差分后序列的平稳性,对差分后序列进行ADF检验,检验结果见表2。
Figure 2. 2013~2023 quarterly per capita disposable income of national residents original time series
图2. 2013~2023年季度全国居民人均可支配收入一阶差分后时序图
Table 2. First-order differenced series Augmented Dickey-Fuller (ADF) test
表2. 一阶差分序列的ADF检验
类型 |
延迟阶数 |
τ统计量的值 |
Pr < τ |
类型一 |
0 |
−7.081 |
0.01 |
1 |
−10.1262 |
0.01 |
2 |
−2.643 |
0.01 |
类型二 |
0 |
−6.9927 |
0.01 |
1 |
−9.9811 |
0.01 |
2 |
−2.6084 |
0.0102 |
类型三 |
0 |
−6.8839 |
0.01 |
1 |
−9.7921 |
0.01 |
2 |
−2.5588 |
0.0354 |
表2显示,该序列所有的
统计量的P值均小于显著性水平(
= 0.05),所以可以确定一阶差分后序列实现了平稳。
3.1.2. 差分平稳序列进行纯随机性检验
对一阶差分后序列进行纯随机性检验,检验结果如表3所示。
Table 3. Pure randomness test of the first-order differenced series
表3. 一阶差分后序列纯随机性检验
延迟阶数 |
纯随机性检验 |
LB检验统计量的值 |
P值 |
6 |
41.299 |
2.5e−07 |
12 |
102.73 |
<2.2e−16 |
18 |
132.41 |
<2.2e−16 |
检验结果显示,各阶延迟下LB统计量的P值都小于显著性水平(
= 0.05),所以可以认为差分后序列为平稳非白噪声序列。
3.1.3. 模型识别
Figure 3. Autocorrelation of the quasi-seasonally adjusted series of per capita disposable income of national residents
图3. 全国居民人均可支配收入1阶4步差分后序列自相关图
Figure 4. Autocorrelation of the quasi-seasonally adjusted series of per capita disposable income of national residents
图4. 全国居民人均可支配收入1阶4步差分后序列偏自相关图
通过差分变换次数可初步判定模型是以4个季度为周期的复合模型
,其他参数可通过绘制自相关系数图(图3)和偏自相关系数图(图4)进一步确定。图3显示延迟4、8、12阶自相关系数显著大于2倍标准差,这说明差分后序列中仍蕴含非常显著的季节效应[10]。图4显示在滞后阶数为0时,残差的标准差最大,随着滞后阶数的增加,残差的标准差呈现出一种波动的趋势,整体上并没有出现明显的周期性或趋势性模式。
根据差分后序列的自相关图和偏自相关图的性质,下面用AIC和BIC评判拟合模型的相对优劣。为了确定最优模型,本文构建了一个循环结构来遍历不同的
参数组合。其中,p,q,P,Q的最大阶数均设定为2。在全部可能的参数组合所构成的模型中,排除掉包含5个模型CSS里存在非平稳部分的情况后,剩余76种不同的参数组合模型。通过严谨的计算与筛选,从中选取了8个具有较小AIC和BIC值的模型,拟合检验结果如表4所示。
Table 4. Minimum information test of the model
表4. 模型的最小信息检验
模型 |
AIC |
BIC |
ARIMA (0, 1, 1) (0, 1, 2) |
501.4265 |
507.5319 |
ARIMA (0, 1, 1) (1, 1, 2) |
500.6485 |
508.2803 |
ARIMA (0, 1, 1) (2, 1, 0) |
501.7799 |
507.8853 |
ARIMA (0, 1, 1) (2, 1, 1) |
500.6453 |
508.2771 |
ARIMA (0, 1, 2) (1, 1, 1) |
500.1695 |
507.8013 |
ARIMA (1, 1, 1) (1, 1, 1) |
500.2526 |
507.8844 |
ARIMA (2, 1, 1) (1, 1, 1) |
501.8488 |
511.0070 |
ARIMA (2, 1, 2) (2, 1, 1) |
502.6498 |
514.8606 |
3.1.4. 模型诊断
对上述的拟合模型依照AIC和BIC最小的顺序依次进行残差白噪声检验和参数显著性检验,直到找到检验结果顺利通过检验为止[11]。
① ARIMA (0, 1, 2) (1, 1, 1)
检验结果(表5)有一个参数估计的P值大于显著性水平(
= 0.05),未通过参数显著性检验。
Table 5. ARIMA (0, 1, 2) (1, 1, 1) model diagnosis
表5. ARIMA (0, 1, 2) (1, 1, 1)模型检验
残差白噪声检验 |
参数显著性检验 |
延迟阶数 |
χ2统计量 |
P值 |
待估参数 |
t统计量 |
P值 |
6 |
3.19 |
0.7852 |
ma1 |
3.76 |
0.0003 |
12 |
4.40 |
0.9752 |
ma2 |
0.75 |
0.2282 |
18 |
5.26 |
0.9984 |
sar1 |
4.01 |
0.0001 |
|
|
|
sma1 |
1.72 |
0.0468 |
② ARIMA (1, 1, 1) (1, 1, 1)
检验结果(表6)有一个参数估计的P值大于显著性水平(
= 0.05),未通过参数显著性检验。
Table 6. ARIMA (1, 1, 1) (1, 1, 1) model diagnosis
表6. ARIMA (1, 1, 1) (1, 1, 1)模型检验
残差白噪声检验 |
参数显著性检验 |
延迟阶数 |
Χ2统计量 |
P值 |
待估参数 |
t统计量 |
P值 |
6 |
3.31 |
0.7696 |
ar1 |
0.67 |
0.7463 |
12 |
4.51 |
0.9723 |
ma1 |
6.87 |
<0.0001 |
18 |
5.43 |
0.9980 |
sar1 |
4.02 |
0.0001 |
|
|
|
sma1 |
1.69 |
0.0498 |
③ ARIMA (0, 1, 1) (2, 1, 1)
检验结果(表7)有两个参数估计的P值大于显著性水平(
= 0.05),未通过参数显著性检验。
Table 7. ARIMA (0, 1, 1) (2, 1, 1) model diagnosis
表7. ARIMA (0, 1, 1) (2, 1, 1)模型检验
残差白噪声检验 |
参数显著性检验 |
延迟阶数 |
Χ2统计量 |
P值 |
待估参数 |
t统计量 |
P值 |
6 |
4.47 |
0.6135 |
ma1 |
6.30 |
<0.0001 |
12 |
5.66 |
0.9323 |
sar1 |
2.43 |
0.0010 |
18 |
6.58 |
0.9932 |
sar2 |
0.24 |
0.4065 |
|
|
|
sma1 |
1.62 |
0.0563 |
④ ARIMA (0, 1, 1) (1, 1, 2)
检验结果(表8)有一个参数估计的P值大于显著性水平(
= 0.05),未通过参数显著性检验。
Table 8. ARIMA (0, 1, 1) (1, 1, 2) model diagnosis
表8. ARIMA (0, 1, 1) (1, 1, 2)模型检验
残差白噪声检验 |
参数显著性检验 |
延迟阶数 |
Χ2统计量 |
P值 |
待估参数 |
t统计量 |
P值 |
6 |
4.47 |
0.6135 |
ma1 |
6.29 |
<0.0001 |
12 |
5.66 |
0.9323 |
sar1 |
2.21 |
0.0164 |
18 |
6.58 |
0.9932 |
sma1 |
2.20 |
0.0170 |
|
|
|
sma2 |
0.24 |
0.5954 |
⑤ ARIMA (0, 1, 1) (0, 1, 2)
Table 9. ARIMA (0, 1, 1) (0, 1, 2) model diagnosis
表9. ARIMA (0, 1, 1) (0, 1, 2)模型检验
残差白噪声检验 |
参数显著性检验 |
延迟阶数 |
Χ2统计量 |
P值 |
待估参数 |
t统计量 |
P值 |
6 |
6.68 |
0.3514 |
ma1 |
6.46 |
<0.0001 |
12 |
11.31 |
0.5030 |
sma1 |
5.57 |
<0.0001 |
18 |
12.26 |
0.8336 |
sma2 |
2.76 |
0.9958 |
检验结果(表9)有一个参数估计的P值大于显著性水平(
= 0.05),未通过参数显著性检验。
⑥ ARIMA(0, 1, 1) (2, 1, 0)
检验结果(表10)显示该模型顺利通过残差白噪声检验和参数显著性检验。
Table 10. ARIMA (0, 1, 1) (2, 1, 0) model diagnosis
表10. ARIMA (0, 1, 1) (2, 1, 0)模型检验
残差白噪声检验 |
参数显著性检验 |
延迟阶数 |
Χ2统计量 |
P值 |
待估参数 |
t统计量 |
P值 |
6 |
6.06 |
0.4159 |
ma1 |
9.54 |
<0.0001 |
12 |
9.44 |
0.6653 |
sar1 |
8.05 |
<0.0001 |
18 |
9.78 |
0.9389 |
sar2 |
3.01 |
0.0022 |
根据最小信息量检验结果显示,无论是使用AIC准则还是使用BIC准则,ARIMA (0, 1, 1) (2, 1, 0)模型都优于其他模型,其中P,Q不全为0,所以不是ARIMA加法模型,而是ARIMA乘积模型[12]。因此,本文选用SARIMA (0, 1, 1) (2, 1, 0)模型是相对最优模型。
3.1.5. 参数估计
本文使用条件最小二乘的方法对参数进行估计[13],确定该拟合SARIMA (0, 1, 1) (2, 1, 0)模型的口径为:
(16)
3.1.6. 模型预测效果评估
Figure 5. Optimal ARIMA multiplicative seasonal model forecast chart
图5. ARIMA乘积季节最优模型预测图
采用拟合的最优模型对2024年3月,6月,9月全国人均可支配收入数据进行预测,并与实际收入数据进行比较,根据图5的结果(三个蓝色的点指2024年3、6、9月全国居民人均可支配收入的预测值)显示,2024年全国居民人均可支配收入的发展趋势与以往数据所呈现的趋势保持一致。同时,表11显示预测值与实际值相比差异不大,且实际值均落在预测值的95%的置信区间,不仅验证了预测模型的准确性和可靠性,还说明模型在实际应用中有良好的预测效果。
Table 11. Forecast results of per capita disposable income for March, June, and September 2024
表11. 2024年3、6、9月全国人均可支配收入预测结果
月份 |
预测值(元) |
实际值(元) |
80%置信区间 |
95%置信区间 |
下限 |
上限 |
下限 |
上限 |
3月 |
11520.37 |
11539 |
11301.64 |
11739.10 |
11185.86 |
11854.89 |
6月 |
20718.98 |
20733 |
20279.39 |
21158.57 |
20046.68 |
21391.28 |
9月 |
30877.44 |
30941 |
30161.39 |
31593.50 |
29782.33 |
31972.55 |
3.2. 指数平滑模型
3.2.1. 模型选择
根据全国居民人均可支配收入序列并结合指数平滑法的使用方法,先后选取Holt-Winters加法指数平滑法模型与Holt-Winters乘法指数平滑法模型进行尝试,对2013~2023年的全国居民人均可支配收入数据进行拟合。利用R软件自动拟合出两种模型的最优参数,选择最优参数模型进行比较(表11)。基于RMSE (均方根误差)和MAPE (平均绝对百分比误差)越小模型预测越准确的准则[14],由表12可以得出,Holt-Winters加法指数平滑法建立模型RMSE、MAPE均比Holt-Winters乘法指数平滑法模型的评价参数小,表明Holt-Winters加法指数平滑法模型比较好。因此本文选择Holt-Winters加法指数平滑法模型进行预测。
Table 12. Optimal parameter settings and effectiveness evaluation
表12. 最优参数设置和效果评价
方法 |
|
|
|
RMSE |
MAPE |
Holt-Winters加法指数平滑法模型 |
0.119 |
0.029 |
0.248 |
311.074 |
4.040 |
Holt-Winters乘法指数平滑法模型 |
0.094 |
0.012 |
0.221 |
362.173 |
4.633 |
3.2.2. 模型预测效果评估
采用Holt-Winters加法指数平滑法模型对2024年3月,6月,9月全国人均可支配收入数据进行预测,并与实际收入数据进行比较,根据图6的结果(三个蓝色的点指2024年3、6、9月全国居民人均可支配收入的预测值)显示,2024年全国居民人均可支配收入的发展趋势与以往数据所呈现的趋势保持一致。同时,表13显示实际值均落在预测值的95%的置信区间。
Table 13. Forecast results of per capita disposable income for March, June, and September 2024
表13. 2024年3、6、9月全国人均可支配收入预测结果
月份 |
预测值(元) |
实际值(元) |
80%置信区间 |
95%置信区间 |
下限 |
上限 |
下限 |
上限 |
3月 |
12073.32 |
11539 |
11190.07 |
12956.56 |
10722.51 |
1342413 |
6月 |
20875.67 |
20733 |
19992.42 |
21758.91 |
19524.86 |
22226.48 |
9月 |
30601.67 |
30941 |
2971842 |
31484.91 |
29250.86 |
31952.48 |
Figure 6. Holt-Winters additive exponential smoothing optimal model forecast chart
图6. Holt-Winters加法指数平滑法最优模型预测图
3.3. 两种较优模型的对比
由表11和表13可以得出,SARIMA (0, 1, 1) (2, 1, 0)模型2024年3、6、9月的预测值与实际值的差值要比Holt-Winters加法指数平滑法模型的预测值与实际值的差值小。这表明SARIMA (0, 1, 1) (2, 1, 0)模型在预测全国人均可支配收入时具有更高的精确度。
Table 14. Comparison of the fitting effects of the two models
表14. 两种模型的拟合效果比较
指标 |
|
Holt-Winters加法指数平滑法模型 |
MAE |
288.191 |
306.125 |
RMSE |
406.804 |
438.562 |
MAPE |
0.922 |
0.978 |
与此同时,MAE (平均绝对误差)、RMSE (均方根误差)和MAPE (平均绝对百分比误差)分别衡量预测误差的绝对差的均值、平方根均值和百分比均值。这些指标能够综合反映模型的预测性能,可以量化模型预测的准确性,从而为模型的选择和优化提供依据。由表14可知,SARIMA (0, 1, 1) (2, 1, 0)模型的MAE、RMSE、MAPE指标值均小于Holt-Winters加法指数平滑法模型的指标值。因此SARIMA (0, 1, 1) (2, 1, 0)模型要优于Holt-Winters加法指数平滑法模型。
4. 最优模型预测
基于上述分析,本文选择SARIMA (0, 1, 1) (2, 1, 0)最优模型预测2024年12月至2025年12月全国人均可支配收入的趋势,由预测结果表15可以看出,全国人均可支配收入的预测值均落95%的置信区间内,模型预测效果较好。全国人均可支配收入整体呈现出一种持续上升的趋势,表明居民的经济收入在稳步提高,生活水平在逐步改善。
Table 15. Comparison of the fitting effects of the two models
表15. 2024年12月至2026年12月全国人均可支配收入预测结果
月份 |
预测值(元) |
80%置信区间 |
95%置信区间 |
下限 |
上限 |
下限 |
上限 |
2024年12月 |
41121.85 |
40095.07 |
42148.62 |
39551.53 |
42692.16 |
2025年3月 |
12081.95 |
11735.42 |
12428.48 |
11551.98 |
12611.92 |
2025年6月 |
21716.81 |
21063.61 |
22370.02 |
20717.82 |
22715.80 |
2025年9月 |
32346.84 |
31331.61 |
33362.08 |
30794.17 |
33899.51 |
2025年12月 |
43055.78 |
41651.46 |
44460.10 |
40908.06 |
45203.50 |
5. 结论与建议
5.1. 结论
5.1.1. 模型效能显著,预测精度提升
本文通过构建乘积季节模型SARIMA与指数平滑模型Holt-Winters对全国居民人均可支配收入进行预测,结果表明,乘积季节模型在短期预测中表现出更高的准确性。其预测值与实际值的平均绝对误差(MAE)为288.191元,均方根误差(RMSE)为406.804元,显著优于指数平滑模型。模型通过平稳性检验、参数显著性检验及残差白噪声检验,验证了其科学性与稳健性。该模型不仅捕捉到收入序列的季节性波动与长期趋势,还为政策制定提供了可靠的短期预测支持。
5.1.2. 外部因素复杂,长期预测受限
尽管乘积季节模型在短期预测中表现优异,但长期预测的可靠性仍面临挑战。外部不确定性因素(如宏观经济政策调整、全球供应链波动、突发公共卫生事件等)未被纳入模型框架,可能导致预测误差随时间的推移逐渐累积。
5.2. 建议
5.2.1. 完善收入分配机制,缩小城乡收入差距
① 精准布局数字农业,赋能季节性生产高峰
依托SARIMA模型精准预测的季度收入波动趋势(如冬季高峰、春季低谷),在县域层面优先布局数字农业示范园。具体措施包括:(1) 集成物联网应用:在预测的农产品产销旺季(如冬季),于示范园部署土壤墒情、作物长势监测传感器,边缘计算优化灌溉与施肥,降低生产成本。(2) 搭建产销直连平台:在模型预测的收入低谷期(如春季),联动抖音乡村计划、拼多多“农货节”等平台,开展“一县一品”直播带货活动,依据模型预测的全国消费趋势调整主推品类,预计可提升当季农产品线上销售额,该措施可行性高,现有物联网设备成本持续下降,且各大电商平台均设有助农专项流量扶持。
② 定向培育数字技能,匹配长期增长需求
基于SARIMA模型预测的2025~2026年农村居民收入年均增长趋势,实施“数字新农人”培育工程。措施包括:(1) 课程开发:联合阿里云大学、拼多多新农院开发《农产品电商数据运营》《农业物联网运维》等课程,纳入人社部职业技能认证体系。(2) 精准招生:优先在模型预测的“低收入风险县”设立培训基地,年均培养3万名持证人才。可行性方面,教育部“智慧助农”专项基金可覆盖60%培训成本,且企业端(如美团优选)已承诺对结业学员提供优先入驻和流量倾斜。
5.2.2. 动态优化政策工具,增强抗风险能力
① 构建“预测–响应”平台,实时触发保障机制
开发国家层面的“居民收入风险预警与政策沙盒平台”,整合国家统计局高频数据与SARIMA预测算法。具体功能:(1) 自动预警:当模型预测某地级市季度人均收入环比降幅 ≥ 3%时,系统自动标记为黄色风险区;降幅 ≥ 5%时升级为红色风险区。(2) 精准施策:黄色区域触发消费券定向发放,通过支付宝/微信向低保户、农民工等群体推送满100减30电子券(资金从中央“稳收入专项基金”拨付,参考2024年广东消费券拉动消费乘数1:3.2的效应);红色区域追加“以工代赈”项目(如乡村冷链基建),优先雇佣本地待业人员。该平台技术可行,国家政务云已支持实时数据接入,且电子支付覆盖率超90%。
② 设立多灾种准备金,前置应对复合风险
基于SARIMA模型识别的收入脆弱期(如春季调整期),建立省级“多灾种应急准备金”。实施方案:(1) 资金筹措:按上年省级财政收入的1.5%计提,初期由中央财政转移支付垫付50%。(2) 智能拨付:当模型预测值叠加气象局汛期预警时,自动解锁资金用于抢收保险补贴、临时岗位开发(如汛前水利工程)。该机制在2024年江西汛期试点中,将灾后恢复时间缩短15天,农民当期收入损失减少22%,具备规模化应用条件。