1. 引言
粮食产量是关乎国计民生的大事,中国以世界上9%的耕地来养育全世界22%左右人口的用粮问题 [1],供需压力尤为明显,而且“当今世界处于百年未有之大变局”,在动荡的国际形势以及严峻的疫情形势之下,摸清我国未来几年粮食的缺口、预测粮食产量变得尤为重要。2022年中央一号文件《中共中央国务院关于做好2022年全面推进乡村振兴重点工作的意见》更是明确提出“坚持中国人的饭碗任何时候都要牢牢端在自己手中”。随着国际化进程的不断深入,粮食已经不再是传统意义上的农产品,其具备了社会、文化、生态、政治等多重属性,事关国家安全,因此保障粮食安全,深入分析研判供需关系,实现粮食产量的有效预测,对中国的农业经济的发展、产业结构的调整以及农民的创收均有深远意义,同时一定程度上为政府部门合理引导粮食生产提供参考意义 [2]。
陕西省作为西北地区重要的农业大省和经济中心,近几年随着经济的快速发展和户籍政策的调整,常住人口数量逐年增加,粮食产量预测对陕西省政府制定相应措施进而保障粮食充足供给十分重要。目前一些学者基于各种模型对中国各个省份乃至全国粮食产量进行了相关研究。谢玉莹 [3] 通过灰色关联模型筛选出影响粮食产量的主要因素,应用Shapley值理论对3个单一模型进行权重赋值并建立线性组合模型,实现了对粮食产量较为准确的预测。孟强 [4] 利用时间序列ARIMA (3, 1, 2)模型拟合了东三省2009~2013年的粮食产量,同时分析预测了东三省2014~2023年未来十年的粮食产量。孙英敏 [5] 以粮食生产的“投入指标”为评价依据,运用变异系数法,分析陕西省耕地利用转型和粮食产量耦合关系时空演变,结果显示2005~2015年陕西省各地市耕地利用强度逐年增大,但空间布局较分散。刘妍妮 [6] 基于《陕西省统计年鉴》数据,应用DPS软件建立回归分析模型和GM (1, 1)模型,完成未来10年陕西省粮食产量预测,同时分析探讨了粮食产量变化及其影响因素。李志超 [7] 等通过建立ARIMA (3, 1, 7)模型,GM (1, 1)模型以及一元23阶多项式回归模型对CPI指数进行短期预测,结果显示ARIMA (3, 1, 7)模型和灰色预测模型GM (1, 1)预测精度相近且较高。ARIMA模型应用较为广泛,但针对陕西省的粮食产量最近进展与未来预测的研究较少,本文将通过应用ARIMA模型,分析预测未来5年陕西省产量的预测值,为陕西省政府部门制定相应措施进而保障粮食充足供给提供一定的参考意义。
2. ARIMA模型
ARIMA模型,即差分自回归移动平均模型,由Box和Jenkins于上世纪七十年代提出,其中AR、MA、I分别表示自回归模型、移动平均模型和差分,其主要针对的是平稳时间序列,但实际生活中大部分时间序列均是非平稳的,因此需要通过差分将其转化为平稳时间序列,然后通过建立ARIMA模型完成数据建模及预测。ARIMA (p, d, q)模型由AR、MA、I三部分组成,其中p、d、q分别表示自回归阶数、差分次数以及移动平均阶数 [8]。模型表达式如下:
(1)
ARIMA模型的建立流程为首先检验时间序列的平稳性,若非平稳则需进行差分使其平稳,其次是模型ARIMA (p, d, q)的识别,接下来是模型的检验,即残差白噪声检验,最后是模型的具体应用。
3. 实例分析
3.1. 数据来源
本文数据均来自国家统计局官网(https://data.stats.gov.cn/easyquery.htm?cn=E0103),数据真实、可靠。为深入研究陕西省粮食产量的发展趋势,并预测未来5年的粮食产量,笔者以陕西省2002~2021年粮食产量(表1)为依据,通过应用时间序列模型ARIMA对产量数据进行分析拟合预测。
Table 1. The grain yield data of Shaanxi Province from 2002 to 2021 (unit: 10,000 tons)
表1. 陕西省2002~2021年粮食产量数据(单位:万吨)
数据来源:国家统计局官网(2002~2021年)。
3.2. 平稳性检验及处理
图1为2002~2021年陕西省粮食产量及其一阶差分时间序列图,依据经验结合图像初步判断陕西省粮食产量时间序列是非平稳的,而其一阶差分时间序列相对平稳。为进一步验证判断,笔者通过应用MATLAB软件对原始时间序列及其一阶差分时间序列进行ADF和KPSS检验。结果显示,原始时间序列的ADF检验和KPSS检验返回值分别为0和1,均表明该序列不平稳,而其一阶差分时间序列的ADF检验和KPSS检验返回值分别为1和0,均表明时间序列平稳。
Figure 1. Time series graph of grain yield and its first-order difference in Shaanxi Province
图1. 陕西省粮食产量及其一阶差分时间序列图
3.3. 模型建立
陕西省粮食产量时间序列经一阶差分后产生的时间序列通过了平稳性检验,因此ARIMA (p, d, q)模型阶数d值可以确定为1,剩余仅需确定p、q值。图2为陕西省粮食产量的一阶差分序列的自相关(ACF)和偏自相关(PACF)图,从ACF图可以发现自0阶后衰减趋于零,而PACF图在1阶和12阶之后衰减趋于零,通过AIC信息准则(值越小越好),我们可以进一步确定模型阶数。表2为AIC和BIC值较小的模型参数统计表,得到的最优模型为ARIMA (0, 1, 1),其公式为:
。
Figure 2. Autocorrelation and partial autocorrelation plots of first difference sequences
图2. 一阶差分序列的自相关和偏自相关图
Table 2. Model parameter statistics table
表2. 模型参数统计表
3.4. 模型检验
为了验证所建模型的可靠性,需要对模型残差进行白噪声检验,ARIMA模型要求残差不存在自相关性,即模型为白噪声,可通过Q统计量检验进行判断。表3为模型Q统计量表,通常选取Q6进行分析,其对应的p值远大于0.1,即模型残差序列为白噪声,表明模型通过检验,基本满足要求,最终确定预测模型为ARIMA (0, 1, 1)。
3.5. 粮食产量预测
图3为模型ARIMA (0, 1, 1)关于陕西省粮食产量拟合情况以及未来5年粮食产量预测情况,由图可以看出真实值和拟合值吻合度高,而且随着时间的推移,陕西省粮食产量逐渐增加,并且随着预测年限的增加,预测值的误差范围逐渐增大,表明模型拟合效果好,可较为真实反映未来5年陕西省粮食产量变化,但其预测分析的年限受限,适合短期分析预测。
Figure 3. Shaanxi Province’s grain yield model fitting and yield forecast for the next 5 years
图3. 陕西省粮食产量模型拟合和未来5年产量预测
Table 4. The forecast table of grain yield in Shaanxi Province in the next five years
表4. 陕西省粮食产量未来5年预测表
由表4可以看出2021年陕西省粮食产量真实值和预测值分别为1270.43万吨和1280.75万吨,相对误差仅为0.81%,远远小于5%,预测精度高达99.19%。预测结果显示,未来5年陕西省粮食产量平均年净增长值为13.48万吨,增长率为1.03%。
4. 结语
本文通过选取陕西省2002~2021年粮食产量数据,经过分析处理检验,构建ARIMA (0, 1, 1)模型,完成了2022~2026年陕西省粮食产量预测。以2021年的数据进行验证,结果显示模型精度高达99.19%。预测结果显示未来五年陕西省粮食产量呈逐年增加趋势,且平均年净增长值和增长率分别为13.48万吨和1.03%,为陕西省经济决策提供一定参考。同时随着预测年限的增加,预测精度有所下降。因此今后在建立ARIMA模型时应多研究改进算法,进一步提高预测精度。