基于ARIMA模型研究分析我国居民消费价格水平
Research and Analysis of Consumer Price Level of Chinese Residents Based on ARIMA Model
DOI: 10.12677/FIA.2023.124051, PDF, HTML, XML, 下载: 148  浏览: 277 
作者: 王晗琨:云南财经大学,统计与数学学院,山东 烟台
关键词: 居民消费价格指数ARIMA模型国民经济通货膨胀预测 Consumer Price Index of Residents ARIMA Model National Economy Inflation Forecast
摘要: 居民消费价格指数(consumer price index,简称CPI)是衡量总体价格水平的指标,也是一个宏观经济指标,反映日常生活中人们购买生活用品和消费服务时价格水平的趋势变化,因此居民消费价格指数不仅同人们生活密切相关,且在整个国民经济价格体系中也有一席之地。除此之外居民消费价格指数在分析和决策经济、调控和检测价格水平以及核算国民经济的重要指标。其变动率反映了一定程度的通货膨胀或紧缩。本文选取2001年至2020年全国人民消费价格指数数据,建立ARIMA模型进行研究分析,并预测未来5年居民消费价格指数的变化趋势。
Abstract: The Consumer Price Index (CPI) is an indicator that measures the overall price level and is also a macroeconomic indicator that reflects the trend changes in price levels when people purchase daily necessities and services in their daily lives. Therefore, the CPI is not only closely related to people’s lives but also has a place in the entire national economic price system. In addition, the consumer price index of residents is an important indicator for analyzing and decision-making about the economy, regulating and testing price levels and accounting for the national economy. Its rate of change reflects a certain degree of inflation or contraction. This article selects the national consumer price index data from 2001 to 2020, establishes an ARIMA model for research and analysis, and predicts the trend of changes in the consumer price index in the next 5 years.
文章引用:王晗琨. 基于ARIMA模型研究分析我国居民消费价格水平[J]. 国际会计前沿, 2023, 12(4): 382-392. https://doi.org/10.12677/FIA.2023.124051

1. 引言

居民价格消费指数(CPI)与人们日常生活有着紧密的联系,不仅可以反映物价水平,还可以反映居民工资情况。居民价格消费指数还与通货膨胀有关,一般要是居民价格消费指数数值增长代表着商品价格上升,随之而来的影响可能有通货膨胀、货币贬值等,反而对居民日常水平受到一定波动影响。除此之外,居民价格消费指数反映经济增长数量,对国民经济发展有一定影响。因此,为了能够更好地分析我国居民价格消费指数的发展趋势以及预测未来5年居民价格消费指数的发展趋势,需要建立模型进行分析研究。

1.1. 研究背景

根据国家统计局发布的数据来看,我国居民价格消费指数近几年不断波动发展,其发展已经影响到居民正常生活,那居民价格消费指数波动现象会如何影响未来发展?国家政府人们又将如何应对这个局面?未来几年居民价格消费指数的趋势又会如何变化?

居民消费价格指数衡量居民消费的商品和服务的价格随时间的变化趋势,每年都统计,且其变化程度可以反映出通货膨胀或紧缩的程度。一般来说当CPI变化率高于3%时,称为通货膨胀;当CPI变化率高于5%,称为严重的通货膨胀。如果CPI变化率过高,通货膨胀过于严重,会造成经济发展不稳定,带来其他风险。也就是说,CPI增长过高,生活成本过高随之而来的是货币价值下降,一张100的纸币只能买到价值低于100的商品和服务。除此之外CPI还可以衡量国内生产总值、资产、负债、消费以及收入等实际价值。

我国居民价格消费指数由国家统计局编制发布,各省、自治区、直辖市的CPI由国家统计局认定反馈,各调查总队公开。确定居民消费价格指数首先确定要被调查的商品和服务项目。因此我国统计部门选取一些能代表居民消费、对居民生活影响较大的商品和服务,并把这些固定数量的商品和服务统称为“商品篮子”。我国把CPI分为八个大类:医疗保健、衣着、生活用品及服务、交通和通信、食品烟酒、居住、教育文化和娱乐、其他用品和服务,262个基本分类(功能、性质、结构相同或相近的产品)。

CPI = (一组固定商品当期价值/一组固定商品基期价值) × 100%。也就是说CPI反映出来的是当居民消费一组商品时,在当前时间点比以往某一时间点多支出多少。但是在日常生活中,更关注的是通货膨胀的程度,也就是一定时期内商品价格增长程度,通过通货膨胀率来反映,用CPI来计算。通货膨胀率 = (报告期CPI − 基期CPI) ÷ 基期CPI × 100%。所以说,这个通货膨胀率就是不同时间段CPI变化的百分比。

时间序列分析,是将周期、趋势、时期和不稳定因素这四个因素综合进行预测,也需要根据要检测的对象的变化特点,选择恰当的数学软件,然后根据数据建立数学模型,得出其相应的数学规律。对于本文来说,选择什么样的数学软件,建立哪种数学模型来分析预测居民价格消费指数的变化,是至关重要的。统计学中,ARIMA模型常用来进行数据分析好预测,其短期预测的效果很好。

1.2. 研究目的及内容

2001年到2020年,我国居民价格消费指数变化波动较大,尤其是2009年以后呈增长趋势,也就是说我国面临通货膨胀的严峻形势,随着居民日常生活消费成本不断增加,分析CPI趋势发展也成为热门的研究话题。本文将从这个角度出发,用Eviews建立ARIMA模型 [1] 对2001年到2020年居民价格消费指数进行研究分析并预测未来5年的发展趋势 [2] ,有助于我国的国民经济发展。

本文从统计学角度出发对居民价格消费指数进行研究分析,利用软件建立ARIMA时间序列模型对国家统计局官网公布的2001~2020年居民价格消费指数数据进行分析研究,并预测未来5年居民价格消费指数的发展趋势 [3] 。主要内容如下:ARIMA模型的理论与方法介绍、利用ARIMA模型分析研究居民价格消费指数、预测未来5年居民价格消费指数的变化趋势 [4] 。

2. 方法介绍

2.1. 模型理论与方法介绍

2.1.1. ARIMA模型介绍

ARIMA模型全称自回归移动平均模型(Autoregressive Integrated Moving Average Model),由Box和Jenkins提出的一个时间序列预测方法,运用数学模型来表现随机序列数据,可以从已知的时间序列数据预测未来。

ARIMA模型也叫差分整合移动平均自回归模型,结合自回归模型(AR)、移动平均模型(MA)和差分法得到模型ARIMA(p, d, q),其中p是自回归项数,q是滑动平均项数,d是序列成为平稳序列所需要进行差分的阶数,也是至关重要的一步 [5] 。

自回归模型(AR):

AR模型通过已知的不同时间段序列之间的相关关系,利用回归方程来预测。也就是说用以前时间点的数据做回归变量来预测未来时间点的数据。

其模型表示为:

X t = a 1 X t 1 + a 2 X t 2 + + a p X t p + ε t = j = 1 p a j X t j + ε t (1)

由该式子可以看出t时刻的 X t X t 1 X t p 的加权以及随机干扰项决定。该模型被称为 AR ( p ) 模型,即p阶自回归模型,其中 a 1 a p 是常数项,成为模型的自回归系数。

移动平均模型(MA):

MA模型是由自回归模型中误差线性组合而成,此误差服从正态分布且相互独立,其通过误差的线性组合来观察其振动,可以消除预测时的随机扰动,也就是说,当运用的数据受外在影响波动明显无法很好判断其发展趋势时,可以利用此模型消除这些影响因素以此来分析,进而预测其未来趋势发展 [6] 。

其模型表示为:

X t = μ + ε t θ 1 ε t 1 θ q ε t q (2)

此模型被称为 MA ( q ) 模型,其描述的是t时刻与 t , t 1 , 时刻误差的相关关系。

自回归滑动平均模型(ARMA):

ARMA模型是由AR模型和MA模型结合而成,是时间序列模型中的一种。ARMA(p, q)模型中包含了p个自回归项和q个移动平均项,可表示为:

X t = c + ε t + i = 1 p φ i X t i + j = 1 q θ j ε t j (3)

其中p和q是模型的自回归阶数和移动平均阶数; φ θ 是不为零的待定系数; ε t 是独立的误差项; X t 是平稳、正态、零均值的时间序列。

自回归移动平均模型(ARIMA):

ARIMA模型是ARMA模型的拓展 [7] ,其建立模型分析一随机的时间序列数据,通过已知的数值预测未来的时间序列数值。ARIMA模型只能分析平稳的时间序列,非平稳时间序列必须先转化为平稳时间序列后再运动ARIMA模型,因此有差分的过程。

ARIMA(p, d, q)模型一般可表示为:

( 1 L ) d X t = φ 1 X t 1 + + φ p X t p + ε t + θ 1 ε t 1 + + θ q ε t q (4)

简记为:

Φ ( L ) ( 1 L ) d X t = Θ ( L ) ε t (5)

其中,AR是自回归模型,p为自回归项系数;MA为移动平均模型,q为移动平均项系数模型,d为时间序列成为平稳时所做的差分次数。

2.1.2. 非平稳时间序列

非平稳时间序列指时间序列随时间的变化而变化。随机游走是一较特殊的非平稳时间序列,其过程定义为: y t = y t 1 + ε t ;其中ε为均值为零的误差项。另一种非平稳时间序列是在随机游走中加一个常数项,被称为带漂移项的随机游走,其定义为 y t = c + y t 1 + ε t ,其中c为常数。漂移项使得这个非平稳时间序列拥有了长期趋势。

使用ARIMA模型进行预测时,首先通过差分得到平稳时间序列 [8] 。差分法是一种非常简便、有效的确定性信息提取法,运算的实质是使用自回归的方式提取确定性信息,即:

d x t = ( 1 B ) d x t = i = 0 d ( 1 ) i C d i x t i (6)

其一阶差分为: x t = x t x t 1

p阶差分为: p x t = p 1 x t p 1 x t 1

k步差分为: k x t = x t x t k

2.2. ARIMA模型建立过程

模型建立分为四步:处理数据、估计参数、模型建立和模型检验

2.2.1. 数据处理

ARIMA模型建立的必要条件是平稳时间序列,因此首先要检查数据的平稳性 [9] 。平稳性检验方法如下:

1) 图检验方法

a) 时序图检验

根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图的序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征。

b) 自相关图检验

平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。

2) 单位根检验(ADF检验)

如果该时间序列数据是平稳的,那么该时间序列的所有特征根都应该在单位圆内。

a) ADF检验原理:

假设序列为: x t = ϕ 1 x t 1 + ϕ 2 x t 2 + + ϕ p x t p + ξ t

如果序列平稳,它必须满足所有非零特征根都在单位圆内。假如有一个单位根存在,不妨假设 λ 1 = 1 ,则序列非平稳。

λ 1 = 1 代入特征方程,得到 1 ϕ 1 ϕ 2 ϕ p = 0 ϕ 1 + ϕ 2 + + ϕ p = 1

这意味着,如果序列非平稳,存在特征根,那么序列回归系数之和恰好等于1。因而,对于序列的平稳性检验,可以通过检验它的回归系数之和的性质进行判断。

b) 检验假设条件

ρ = ϕ 1 + ϕ 2 + + ϕ p 1 ,则假设条件为: H 0 : ρ = 0 H 1 : ρ < 0

c) 检验统计量

τ = ρ ^ S ( ρ ^ ) (7)

d) 检验结果判定

通过蒙特卡洛方法,可以得到ADF检验统计量的临界值表。当显著性水平取为α时,记 τ α 为ADF检验的α分位点,则当 τ τ α 时,拒绝原假设,认为序列平稳;当 τ > τ α 时,接受原假设,认为序列非平稳。

2.2.2. 参数估计

如果所用的时间序列数据为非平稳时间序列,则根据ADF检验得出的结果判断其为平稳序列时在几阶差分,确定d的值。然后通过自相关图和偏自相关图确定p与q的值,初步建立模型。

2.2.3. 模型建立

衡量模型的参数指标有调整R2、AIC、SC等。调整R2代表着模型拟合的整体优度,其值在0到1之间且调整R2值越大,表示模型拟合的效果越好 [10] 。AIC也叫最小信息量准则,其统计量为:

AIC = 2 ln ( ) + 2 ( ) (8)

SC准则和AIC准则一样,值越小表示模型拟合效果越好。因此分析初步建立的几个模型,比较其调整R2、AIC、SC等参数,并且进行检验,根据检验结果,确定出一个最优的模型。

2.2.4. 模型检验

在确定模型后要先对已经拥有的数据进行预测,比较得出的预测值和官网的实际值,计算出相对误差,并且比较其误差大小。当相对误差很小时,说明该模型的拟合效果较好,并可以运用该模型对实际问题进行比较分析和对未来数据进行预测 [11] 。

3. 结果

3.1. 平稳性检验

本文的数据取自我国国家统计局官网公布的2001年至2020年的居民消费价格指数的年度数据(上年同期 = 100)。由国家统计局官网公布的数据可知从2001年以来我国CPI在不断波动变化,初步判断其为不平稳时间序列数据,但由于该趋势图有一定局限,不能直接认定其不平稳,无法由此图准确得知我国居民价格消费指数是否平稳,因此进一步进行平稳性检验。

对该序列进行ADF检验,结果如图1

Figure 1. ADF test results

图1. ADF检验结果

从图中可以知道P值为0.9864,因此该序列有单位根,接受原假设,即该序列是非平稳时间序列。

ARIMA模型预测的必须是平稳时间序列,因此要对序列进行差分处理,一阶差分结果如图2

Figure 2. First order difference results

图2. 一阶差分结果

由上图可知,一阶差分后T值为−4.478051,P值为0.0031,因此拒绝原假设,一阶差分后的序列为平稳的时间序列。

通过以上分析可知我国居民价格消费指数是一个不平稳的时间序列,一阶差分后变为平稳的时间序列数据。

3.2. 参数估计

通过上面的ADF检验和差分处理后得到一阶差分后的居民消费价格指数为平稳的时间序列,因此ARIMA(p, d, q)模型中参数d = 1,为估计参数p、q,分析一阶差分后的自相关图和偏自相关图,如图3所示。

Figure 3. Autocorrelation and partial autocorrelation graphs

图3. 自相关图和偏自相关图

建立模型前要确认模型参数,通过一阶差分后时间序列的自相关图和偏自相关图来估计。如上图可知可选取p值q值为1或2,因此可建立模型ARIMA(1, 1, 1)、ARIMA(1, 1, 2)、ARIMA(2, 1, 1)、ARIMA(2, 1, 2)。

3.3. 模型建立

为了得到最优模型,需要对比不同模型的参数值,运用适当的比较准则选取参数,确定最优模型。对模型ARIMA(1, 1, 1)、ARIMA(1, 1, 2)、ARIMA(2, 1, 1)、ARIMA(2, 1, 2)进行建模,结果如下:

Figure 4. ARIMA(1, 1, 1) model results

图4. ARIMA(1, 1, 1)模型结果

Figure 5. ARIMA(1, 1, 2) model results

图5. ARIMA(1, 1, 2)模型结果

Figure 6. ARIMA(2, 1, 1) model results

图6. ARIMA(2, 1, 1)模型结果

Figure 7. ARIMA(2, 1, 2) model results

图7. ARIMA(2, 1, 2)模型结果

图4知,模型方程为:

x = 4.634074 + x t 1 0.999069 ε t 1

图5知,模型方程为:

x = 4.648343 + 1.117443 x t 1 0.117445 x t 2 0.997751 ε t 1

图6知,模型方程为:

x = 4.603652 + x t 1 0.570137 ε t 1 0.429858 ε t 2

图7知,模型方程为:

x = 3.747182 + 0.448821 x t 1 + 0.551179 x t 2 0.053766 ε t 1 0.946208 ε t 2

3.4. 模型建立

为了在建立的四个模型中确立最优模型,需要对比参数调整R2、AIC和SC。根据上面模型图可知这三个参数值对比表如下:

Table 1. Model parameter comparison table

表1. 模型参数对比表

表1可以很容易得到,模型拟合效果更优的是ARIMA(1, 1, 1)模型。这是因为对于AIC和SC来说,他们都表示信息准则,这两个值越小越好。因此综合比较,可以得知ARIMA(1, 1, 1)模型对于拟合我国居民价格消费指数的趋势来说效果更优。

3.5. 模型检验

通过以上结果可知,我国居民价格消费指数的趋势的最优模型为ARIMA(1, 1, 1)。下面将验证该模型对于数据预测的准确性,现利用该模型拟合我国2016年至2020年的居民价格消费指数,并与之前的数据进行比较,检测结果如表2所示。

Table 2. Predicted and actual values from 2016 to 2020

表2. 2016年至2020年预测值与实际值

(相对误差 = |实际值 − 预测值| ÷ 实际值 × 100%)。

由上可知,模型拟合的数据预测值与实际值之间的误差相对较小,说明ARIMA(1, 1, 1)的预测精度较高,能够预测未来的数据。因此我们用此来预测随后5年我国的CPI数据,结果如表3

Table 3. Predictions for 2021-2025

表3. 2021年至2025年的预测值

由预测值可以看出,未来我国居民价格消费指数处于小幅波动,但在合理范围内,总体较为稳定。

4. 讨论

由以上分析可知ARIMA模型拟合效果还不错,可以用来分析预测我国居民消费价格指数。但是该模型缺陷时预测短期时间序列效果较好,时间越长与预测误差会逐渐变大。用该模型预测未来5年我国居民价格消费指数,发现其总体略微上升。

除此之外的建议措施如下:第一,我们可以加强物价监管的政策运行,面对通货膨胀时要有相对的措施应对;第二,完善生活必需品供给保障机制,确保市场有效供应;第三,推进全国各地物流体系建设,降低物流成本;第四,加强市场调控力度,整顿市场秩序;第五,合理控制价格改革节奏好力度 ,整顿市场秩序;第六,健全联动机制,系统解决物价上涨对低收入人群的影响。

5. 结论

本文我们建立ARIMA模型,我国2001年至2020年的居民价格消费指数是一组非平稳的时间序列数据。本文通过运用eviews软件我国居民价格消费指数进行分析,建立ARIMA(1, 1, 1)模型,并且用这个模型来预测我国未来2021年~2025年居民价格消费指数的数值变化,通过对我国未来五年的居民价格消费指数进行分析比较,可以得知其相对误差相对较小,可以得出ARIMA模型的拟合程度相对于其他模型更好,该模型的预测准确度更高,因此我们可以利用ARIMA(1, 1, 1)模型来预测我国未来五年内的居民价格消费指数的趋势。因此,便利用该模型对2021年至2025年的CPI进行了预测,结果显示,我国的居民价格消费指数呈略微上升的趋势。

但是影响我国居民价格消费指数的因素是多样且不确定的,而建立ARIMA模型时并未考虑其他因素,该模型只是靠统计的数据反映出的一些基本信息。在发生一些突然变故时(如:金融危机、投资行为、政治活动影响等),模型预测效果可能不会这么好。因此在预测未来我国居民价格消费指数趋势发展时,有必要将这些因素考虑在内,结合当时的实际经济状况及国际上经济、政治的重大事件,才能得出更为合理准确的结果和经济政策。

参考文献

[1] 马慧慧, 郭庆然, 丁翠翠. Eviews统计分析与应用[M]. 第3版. 北京: 电子工业出版社, 2016: 142-156, 293.
[2] 李璇, 黄冬冬. 基于ARIMA模型的CPI实证分析及预测[J]. 沈阳大学学报(社会科学版), 2013, 15(3): 306-310.
[3] 杨颖梅. 基于ARIMA模型的北京居民消费价格指数预测[J]. 统计与决策, 2015(4): 76-78.
[4] 张云峰. 居民消费价格指数的分析统计与预测[J]. 河北企业, 2017(12): 40-41.
[5] 初睿. 基于ARIMA模型的北京市CPI预测分析[J]. 价值工程, 2018, 37(5): 21-22.
[6] 袁黎, 赵昌英, 杨忠丽, 姚娟. 基于ARIMA模型的贵州省CPI预测[J]. 科技经济前沿, 2019, 27(2): 21-22.
[7] 倪颖, 年靖宇. 基于ARIMA模型的居民消费价格指数走势实证分析与预测——以重庆市为例[J]. 贵州商学院学报, 2018, 31(2): 14-23.
[8] 刘锐. 基于ARIMA模型的西安市居民消费价格指数分析及预测[J]. 西部经济, 2017(7): 18-19.
[9] 袁志强, 陈锐. 基于ARMA模型的CPI短期预测研究[J]. 中国集体经济, 2018(3): 64-65.
[10] 找伟霖, 旷永鑫, 郭兴方. 基于ARMA模型的南阳市CPI预测分析[J]. 河南教育学院学报(自然科学版), 2018, 27(3): 18-21.
[11] 杜文晟. 基于时间序列方法的湖北省居民消费价格指数预测分析[J]. 湖北师范大学学报(哲学社会科学版), 2019, 39(6): 45-48.