1. 引言
工业生产者出厂价格指数(PPI)指一定时期内工业企业产品第一次出售时的出厂价格总水平的变动趋势和变动幅度的相对数,它反映了工业企业产品出厂价格的变化趋势和波动幅度[1]。PPI的波动对于经济持续增长、通货膨胀产业结构的调整等方面都具有重要影响。特别是在当前全球经济一体化和市场竞争激烈以及激烈的背景下,PPI的出现不仅关系到企业的生产成本和利润空间,还直接影响到消费者的购买力和市场的整体运行前期。
纺织行业作为国民经济的重要推动者之一,其价格水平的稳定性与否直接关系到整个产业链的健康发展。为了更深入地把握纺织行业未来的价格走势,预测市场变化,进而指导企业的生产经营决策,对纺织行业的PPI进行深入研究与分析。本文通过收集整理2018年1月至2024年4月的纺纺织行业生产者价格指数数据,构建出符合纺织行业特点的PPI的ARIMA(1,2,1)模型。这个模型不仅能够揭示纺织行业PPI的历史演变规律,还能够对未来的价格走势进行精准预测。
利用ARIMA(1,2,1)时间序列分析模型,我们能够深入剖析纺织行业价格波动的内在规律,为纺织企业精准预测未来产品价格走势,从而提供科学、明智的价格策略建议。这使得企业能够未雨绸缪,提前调整生产计划、库存管理以及市场定位,有效规避因价格波动带来的市场风险,确保经营稳健。同时,这一高精度的预测结果也为政府部门在纺织行业政策制定上提供了坚实的数据基础,有助于政府更加精准地把握行业发展脉搏,制定出更加符合实际、有利于行业长远发展的政策措施,引导纺织行业朝着更加健康、可持续的方向迈进[2]。本文旨在通过ARIMA(1,2,1)模型,对纺织行业PPI进行深入的重要研究与精准预测,以期为行业内的企业与政府部门提供价值的参考信息,共同推动纺织行业持续健康发展。
2. ARIMA模型
2.1. ARIMA模型原理
ARIMA模型全称为自回归移动平均模型(Autoregressive Integrated Moving Average model,简记ARIMA),是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的著名时间序列预测方式,所以又称为Box-Jenkins模型、博克思–詹金斯法[3]。ARIMA模型主要针对的是平稳时间序列,但在实际生活中,大部分时间序列都是非平稳的。因此,需要通过差分将其转化为平稳时间序列,然后建立ARIMA模型完成数据建模及预测。
在ARIMA(p,d,q)中,AR是自回归,p表示自回归阶数,即当前值与前几个时刻值的线性关系;MA为移动平均,q为移动平均阶数,即当前值与过去几个时刻项的线性组合关系;d为时间序列成为平稳时所做的差分次数。ARIMA模型的公式为
.
ARIMA模型可分为3种:(1) 自回归模型(简称AR模型);(2) 滑动平均模型(简称MA模型);(3)自回归滑动平均混合模型(简称ARIMA模型)。ARIMA模型的基本思想是融合AR和MA模型的优势,认为一个时间点上的数值不仅受数值的影响,还受过去偶然事件的影响。具体来说,ARIMA模型不支持AR模型“历史”因为,现实中,它也不同于MA模型假设的“时间序列完全由随机因素且决定保持稳定”的时间序列往往难以维持长期的稳定性。
ARIMA模型通过结合自回归模型(AR)和移动平均模型(MA),以及必要的积分过程(I),来更全面地描述时间序列的变化规律。它认为时间序列的数值是围绕着一个大趋势的而波动的,这个大趋势是由过去的历史数值所决定的,而波动是由一系列偶然事件或随机相关所引起的。而且,这个大趋势本身并不一定是稳定的,它可能会随着波动着时间的同时发生变化。这样的想象使得ARIMA模型能够更灵活地处理各种类型的时间序列数据,无论是具有无数历史趋势的数据,还是包含临时、突发变化或噪声增量的数据,都能得到较好的处理因此,ARIMA模型在实际应用中具有广泛的适用性和准确性。
2.2. ARIMA模型构建
ARIMA模型的构建过程,需要遵循一系列严谨的步骤以保证预测的准确性。以下是ARIMA模型构建的完整流程:
1) 检验随机性假设,验证时间序列数据是否满足随机性要求。
2) 检验平稳性假设。平稳性是ARIMA模型应用的前提。通过ADF (Augmented Dickey-Fuller)单位根检验、KPSS (Kwiatkowski-Phillips-Schmidt-Shin)检验等方法,判断时间序列是否平稳。若时间序列不平稳,需通过差分处理达到平稳状态,此时模型等于ARIMA(p,d,q)。
3) 确定参数p和q。基于自相关函数(ACF)和偏自相关函数(PACF)的图形分析,确定自回归阶数p和移动平均阶数q。ACF图显示了时间序列与自身滞后版本之间的相关性,而PACF图则揭示了中断中间滞后项影响后的直接相关性。通过观察这两个图形的衰减模式和中断尾/拖尾特性,可以辅助确定p和q的值[4]。
4) 估计ARIMA模型(p,q)的系数。在确定了p和q后,接下来需要估计ARMA模型(p,q)的系数。这通常通过最小二乘法(OLS)或最大似然估计法(MLE)来完成。OLS方法适用于线性模型,而MLE方法则更适用于极端复杂的情况,并且能够提供更为准确的参数估计和模型选择标准(如AIC、BIC等) [5]。
5) 模型诊断与验证。模型诊断是确保模型有效性的关键步骤。主要通过对残差的分析来进行,包括残差的白噪声检验[6]。若残差序列表现白噪声特征(即无显着的自相关性),则表明模型已充分捕获了时间序列中的信息。另外,还可以通过比较模型的预测值与实际初始值,评估模型的预测精度和适用性。
6) 模型应用与优化。一旦模型通过诊断,即可利用其进行时间序列的预测和分析。在实际应用中,可能需要根据预测结果和实际需求对模型进行优化,以达到最佳的预测效果。
通过以上步骤,我们可以系统地构建并验证ARIMA模型,为时间序列数据的分析和预测提供充足的工具。在纺织行业PPI的预测中,这个流程同样适用,能够帮助我们更准确地把握价格走势,为企业的生产经营决策和政府的制定政策提供科学依据。
2.3. ARIMA模型与其他预测模型的比较
ARIMA(p,d,q)模型的优点是灵活性强,可以通过调整参数(p,d,q)来适应各种不同类型的时间序列数据,包括季节性、趋势性等;而它的缺点在于模型的选择和定阶过程相对复杂,需要借助统计检验(如ACF、PACF等)来确定最佳的参数组合。
其他时间序列预测模型如Prophet模型、Holt-Winters模型等,在某些特定场景下可能优于ARIMA模型。例如,Prophet模型在处理具有复杂趋势和季节性变化的时间序列数据时表现出色;Holt-Winters模型则特别适用于具有明显季节性和趋势性的数据。其实,每种模型都有其适用的范围和限制,需要根据具体的数据特性和预测需求进行选择。
3. 实例分析
3.1. 数据来源
本文数据均来自国家统计局官网(https://data.stats.gov.cn/easyquery.htm),数据真实、可靠。为深入研究纺织行业PPI的发展趋势,并预测未来几年的纺织行业PPI,本文以2018年01月~2023年12月的纺织行业PPI为依据,通过应用时间序列模型ARIMA对PPI数据进行分析拟合预测。数据如表1所示:
Table 1. PPI of textile industry from January 2018 to December 2023
表1. 2018年01月~2023年12月的纺织行业PPI
时间 |
PPI |
时间 |
PPI |
时间 |
PPI |
201801 |
102.1 |
202001 |
96.9 |
202201 |
108.7 |
201802 |
101.7 |
202002 |
96.9 |
202202 |
108.2 |
201803 |
101.7 |
202003 |
96.6 |
202203 |
106.7 |
201804 |
101.7 |
202004 |
95.2 |
202204 |
106.2 |
201805 |
102.0 |
202005 |
94.3 |
202205 |
105.6 |
201806 |
102.3 |
202006 |
94.2 |
202206 |
105.7 |
201807 |
102.5 |
202007 |
93.7 |
202207 |
104.3 |
201808 |
103.2 |
202008 |
93.9 |
202208 |
102.4 |
201809 |
103.4 |
202009 |
93.7 |
202209 |
101.2 |
201810 |
103.3 |
202010 |
94.4 |
202210 |
99.3 |
201811 |
102.9 |
202011 |
95.1 |
202211 |
97.6 |
201812 |
101.7 |
202012 |
96.1 |
202212 |
97.2 |
201901 |
101.4 |
202101 |
97.4 |
202301 |
96.4 |
201902 |
101.2 |
202102 |
98.2 |
202302 |
95.9 |
201903 |
101.0 |
202103 |
100.2 |
202303 |
95.5 |
201904 |
100.8 |
202104 |
101.8 |
202304 |
95.3 |
201905 |
100.6 |
202105 |
103.1 |
202305 |
95.3 |
201906 |
99.6 |
202106 |
104.1 |
202306 |
95.0 |
201907 |
99.1 |
202107 |
105.5 |
202307 |
95.7 |
201908 |
97.9 |
202108 |
106.8 |
202308 |
96.7 |
201909 |
97.1 |
202109 |
107.7 |
202309 |
97.6 |
201910 |
96.4 |
202110 |
108.8 |
202310 |
98.1 |
201911 |
96.6 |
202111 |
109.5 |
202311 |
98.5 |
201912 |
96.7 |
202112 |
109.1 |
202312 |
98.5 |
3.2. 模型的建立
首先,检验该时间序列数据随机性及平稳性。若数据存在明显的趋势或季节性,差分操作可以帮助消除这些非平稳特性,使得数据更适合进行ARIMA建模。结合图1就可初步判断纺织行业PPI时间序列是非平稳的,再经过一阶差分和二阶差分时间序列对比分析,可得二阶差分时间序列相对平稳。而后,进行Ljung-Box检验,此时的p值为0.001788 < 0.05,该序列可拒绝纯随机性的原假设,说明数据的波动有统计规律。由上述分析可知,二阶差分后的序列可通过平稳性检验和随机性检验。
Figure 1. PPI of the textile industry and its first-order and second-order difference time series
图1. 纺织行业的PPI及其一阶二阶差分时间序列图
再根据图2的ACF和PACF图,判断得
,
。
Figure 2. ACF and PACF of second-order difference PPI
图2. 二阶差分PPI的ACF和PACF图
此时,纺织业PPI的最优模型为ARIMA(1,2,1),此模型意味着当前值与其一个过去值有关(自回归阶数为1),数据需要经过二阶差分才能达到平稳(差分阶数为2),并且当前误差项与一个过去误差项有关(移动平均阶数为1)。R软件输出的此ARIMA(1,2,1)模型的AIC (Akaike信息准则) = 124.26,BIC (贝叶斯信息准则) = 131.17。
2018年01月到2023年12月的拟合图见图3,公式为
.
Figure 3. ARIMA model fitting diagram of textile industry PPI
图3. 纺织业PPI的ARIMA模型拟合图
3.3. 纺织业PPI预测
根据上述步骤,我们首先选取2018年01月~2023年12月的纺织业PPI数据作为测试集,用已建立的ARIMA(1,2,1)模型用来预测未来2年的纺织业PPI情况,并将2024年01月~2024年12月的预测值与真实值对比,观察相对误差的情况。真实值与预测值的对比情况如表2所示:
Table 2. Comparison table of relative errors of PPI in the textile industry from January 2024 to December 2024
表2. 2024年01月~2024年12月的纺织行业PPI相对误差对比表
时间 |
PPI预测值 |
PPI真实值 |
相对误差 |
202401 |
98.6 |
98.9 |
0.30% |
201802 |
98.7 |
99.2 |
0.50% |
201803 |
98.8 |
99.3 |
0.50% |
201804 |
98.9 |
99.4 |
0.50% |
202405 |
99.0 |
99.4 |
0.40% |
202406 |
99.0 |
99.3 |
0.30% |
202407 |
99.2 |
99.3 |
0.10% |
202408 |
99.2 |
99.0 |
0.20% |
202409 |
99.3 |
98.5 |
0.81% |
202410 |
99.4 |
98.3 |
1.11% |
202211 |
99.5 |
98.1 |
1.43% |
202212 |
99.6 |
98.3 |
1.32% |
相对误差整体处于较低水平,大部分误差(9组)均在1%以下,表明预测模型在多数情况下具有较高的准确性。但相对误差呈现出逐渐增大的趋势。前8组数据的相对误差均较小,且波动不大,保持在0.5%以下或略高;然而,从第9组数据开始,相对误差明显增大,最后两组数据更是达到了1.43%和1.32%。
可能的原因有:
(1) 数据特异性:随着年份的增加,可能出现了一些特异性数据或异常情况,导致预测难度增加,从而使得相对误差增大。
(2) 模型局限性:预测模型可能存在一定的局限性,对于某些特定年份或数据特征可能无法完全捕捉,导致预测误差增大。
(3) 外部因素影响:在PPI的预测中,除了考虑历史数据及其内在趋势外,外部因素如政策变动和国际市场波动同样起着至关重要的作用。这些因素在ARIMA(1,2,1)模型中可能难以完全捕捉,因此需要在预测过程中给予特别关注。政策变动,尤其是与纺织行业相关的税收政策、环保政策以及国际贸易政策等,会直接影响纺织企业的生产成本和市场环境。例如,当政府实施更为严格的环保标准时,纺织企业可能需要投入更多资金用于污染治理和技术升级,从而导致生产成本上升,PPI随之上涨。此外,国际贸易政策的变化,如关税调整、贸易壁垒的设置等,也会影响纺织产品的出口价格和市场需求,进而对PPI产生影响。这些因素在ARIMA模型中可能无法直接体现,因此需要在预测后进行适当的调整。国际市场波动同样对PPI具有显著影响。全球经济环境的变化、主要经济体的货币政策调整、以及国际大宗商品价格的波动等,都会通过影响原材料价格、汇率以及国际市场需求等渠道,间接作用于纺织行业的PPI [7]。例如,当国际大宗商品价格上涨时,纺织企业所需的原材料成本也会相应增加,从而推高PPI。此外,汇率的波动也会影响纺织产品的国际竞争力,进而影响PPI的走势。这些因素同样需要在ARIMA模型预测的基础上进行额外考虑。再考虑现实因素,2020~2022年国内外在处于新冠疫情期间,供应链中断与原材料短缺、需求变化与市场不确定性、生产成本上升、政策与贸易环境以及通货膨胀压力等多方面因素。这些因素相互交织、共同作用,推动了纺织业PPI的快速上涨[8] [9]。这些因素在ARIMA模型中可能难以完全反映,因此仅参考最近几年的PPI数据进行预测具有一定的局限性。为了更准确地预测PPI的走势,需要综合考虑历史数据、外部因素以及行业发展趋势等多方面信息。
综上所述,虽然预测模型在多数情况下具有较高的准确性,但仍存在改进空间。通过优化模型、加强数据监控和考虑外部因素等措施,可以进一步提高预测的准确性。
3.4. 模型优化策略
对于PPI的ARIMA(1,2,1)模型的未来优化,具体策略包括引入季节性调整和外生变量的加入等。
首先,引入季节性调整是一个重要的优化方向。由于PPI等时间序列数据往往具有季节性波动的特点,因此在ARIMA模型中引入季节性成分,将模型转变成ARIMA(1,2,1)(P,D,Q) [10]可以更好地捕捉这些周期性变化,从而提高预测的准确性。这通常涉及到在ARIMA模型的基础上增加季节性自回归和季节性移动平均部分,以充分反映数据的季节性特征。
其次,外生变量的加入也是提升ARIMA模型预测性能的关键策略。在实际应用中,PPI的变动往往受到多种外部因素的影响,如政策变动、国际市场波动、原材料价格变化等。通过将这些外部变量作为解释变量引入ARIMA模型,可以显著提高模型的预测精度和鲁棒性。这些外部变量可以通过回归分析、机器学习算法等方式与ARIMA模型相结合,以捕捉它们对PPI的潜在影响。
综上所述,引入季节性调整和外生变量的加入是优化ARIMA模型、提高PPI预测准确性的有效策略,这些优化方法能够更全面地反映数据的内在规律和外部影响因素,从而为决策者提供更加准确和可靠的预测结果。
4. 结论
本文通过构建ARIMA(1,2,1)模型,对纺织业的PPI (生产者价格指数)进行了深入的分析与预测。研究选取了纺织业近几十年的PPI数据作为测试集,利用ARIMA(1,2,1)模型对未来几年纺织业的PPI走势进行了科学预测。从模型的测试效果来看,所有预测的相对误差均控制在较低水平,低于2%,这表明所构建的ARIMA(1,2,1)模型具有较高的预测精度和可靠性,其预测结果对于纺织业的发展具有重要的参考价值。
通过分析预测结果,我们得出以下几点结论:
首先,ARIMA(1,2,1)模型在纺织业PPI的短期预测中表现优异,验证了时间序列分析方法在预测经济指标短期波动方面的有效性。这表明,对于纺织业这类受市场供需、政策调整、原材料价格等多重因素影响的行业,利用时间序列数据进行短期预测是一种行之有效的方法。
其次,ARIMA(1,2,1)模型的构建相对简单,且能够准确捕捉纺织业PPI的变化趋势。这一模型方法不仅易于掌握,而且在实际应用中能够迅速给出较为可靠的预测结果,对于纺织企业的生产决策、成本控制以及市场策略制定等方面具有重要的指导意义。
最后,从模型的预测结果中,我们可以清晰地看到可能存在的外部经济环境对纺织业PPI产生的显著影响。这提醒我们,在利用ARIMA(1,2,1)模型进行预测时,需要充分考虑外部因素的变化,如政策调整、市场需求波动、原材料价格变动等,以及这些因素可能对模型预测结果产生的潜在影响。同时,也强调了在经济环境复杂多变的当下,及时、准确地预测纺织业PPI的重要性。准确的PPI预测不仅能够帮助企业更好地把握市场动态,制定合理的生产计划和定价策略,还能有效降低经营风险,提升企业的市场竞争力。因此,在运用ARIMA(1,2,1)模型进行预测时,应结合实际经济环境,不断优化模型,以提高预测的准确性和实用性。
综上所述,ARIMA(1,2,1)模型在纺织业PPI的预测中展现出了良好的应用前景,为纺织企业的决策提供了有力的数据支持。未来,我们将继续探索和优化这一模型方法,以提高预测的准确性和稳定性,为纺织业的可持续发展贡献更多力量。