1. 引言
螺纹钢是中国钢材产品中产量最大的品种之一,在基础建设领域有大量的应用,对国计民生影响很大。随着中国经济的飞速发展,对螺纹钢的需求不断扩大。但是,螺纹钢市场信息的不通畅、交易价格的不透明等因素带来的螺纹钢价格变动风险不断增强。为了规避上述的风险,中国于2009年3月推出螺纹钢期货。
螺纹钢期货价格的变化在很大程度上反映了未来一段时间螺纹钢现货市场的供需情况,对螺纹钢现货的价格具有一定的引领作用。在螺纹钢现货价格出现较大的波动前,在螺纹钢期货的价格上可以提早体现。所以螺纹钢期货在一定程度上可为螺纹钢现货市场规避由价格剧烈波动带来的风险,同时对于提高市场的透明度、建立公平公正的现货市场有着重要意义。
本文在2017年1月2日~2022年12月30日这段时间螺纹钢期货价格的基础上用ARIMA模型预测螺纹钢期货的价格。ARIMA模型是一种针对时间序列数据进行预测的模型。因其理论基础比较坚实、短期预测效果好等优点在农产品、能源、股票和期货等价格的预测方面应用广泛。
关于螺纹钢期货和螺纹钢现货价格的预测国内已经有学者用不同于ARIMA模型的数学模型进行了研究 [1] [2] [3] [4] ,有学者用ARIMA模型预测钢材价格 [5] 和铁矿石价格 [6] 。得到了比较好的预测结果。
本文在所选样本时间段内,对螺纹钢期货价格的预测值与真实的价格相比,样本内平均误差为0.03%,能够很好地刻画期货价格的走势与波动。本文所建ARIMA模型可以为有关部门、钢铁企业、螺纹钢买卖双方、期货投资者更好把握市场,进行稳健决策提供一定的依据。
2. ARIMA模型简介
ARIMA模型,称为差分整合移动平均自回归模型,又称整合移动平均自回归模型,是时间序列预测分析方法之一。
其模型ARIMA
形式为
其中L为滞后算子,d为差分阶数,
是零均值白噪声序列,
和
分别为p阶与q阶平稳的滞后算子,对应的公式为
式中
均为非负整数。
3. 数据选择与处理
3.1. 数据选择与可视化
本文是从Akshare接口直接下载近六年(2017年1月2日~2022年12月30日)螺纹钢期货价格的数据。共采集到样本数据1439个,将这些跟时间相关的数据构成的初始时间序列记为
。由于数据来源比较权威且Akshare已经实现从采集,清洗加工等一系列流程,所以本文没有对下载的原始数据进行清洗。
用python软件对
可视化得到如图1所示的螺纹钢期货价格时序图。应用ARIMA模型,需要保证时间序列是平稳的。下面对初始时间序列
进行平稳性检验。
Figure 1. Timing chart of rebar futures prices
图1. 螺纹钢期货价格时序图
3.2. 模型平稳性检验
利用单位根检验–ADF方法检验初始时间序列
是否含有单位根。通过python软件编程运行得到结果如表1所示,初始时间序列
检验统计量大于各个临界值,且
,接受原假设。即认为初始时间序列
是非平稳时间序列,不能应用ARIMA模型。
Table 1. Test results of ADF method for X t
表1. 时间序列
的ADF方法检验结果
4. 模型建立
4.1. 初始时间序列,一阶差分后,二阶差分后的时序图
由于初始时间序列是非平稳的,需要通过d阶差分来实现时间序列平稳。如图2所示,从上到下分别为原始数据,一阶差分后数据,二阶差分后数据的时序图。记一阶差分后时间序列为
,二阶差分后时间序列为
。由图2可知经一、二阶差分后的时间序列
,
中的数据基本围绕基准线零线进行上下波动,并不存在显著的趋势或周期,可初步假设时间序列
,
已经达到平稳。
Figure 2. Time sequence diagrams after first and second difference
图2. 一阶差分,二阶差分后的时序图
4.2. 初始时间序列d阶差分的平稳性检验
对于一阶差分后的时间序列
是否真正平稳,需要进行单位根检验。采用ADF方法检验时间序列
是否还含有单位根。单位根检验结果如表2所示,可以看出,经过一阶差分后的时间序列
检验统计量小于各个临界值,且
。可判断该时间序列为平稳序列。
Table 2. Test results of ADF method for Z t
表2. 时间序列
的ADF方法检验结果
同时,对二阶差分
的平稳性也做出了验证,如表3所示,二阶差分后的数据也是平稳的。
4.3. 白噪声序列检验
因为差分后的数据构成的时间序列有可能是白噪声(纯随机)序列,而对一个白噪声序列没有必要建模。因此对差分后的序列需要进行相关性检验来判断是否是白噪声序列。
Table 3. Test results of ADF method for Y t
表3. 时间序列
的ADF方法检验结果
利用混成检验法(LB)对时间序列
和
进行白噪声检验,由表4可知在前20阶延迟下Q检验统计量
序列的p值大于0.05,即认为时间序列
属于白噪声序列。而
序列的p值小于0.05 (见表5),与对应时间序列为白噪声序列的假设不成立,即认为时间序列
属于非白噪声序列。因此选择使用二阶差分后时间序列
。
Table 4. First twenty order test Q-statistic of Z t
表4. 时间序列
的前20阶Q检验统计量
Table 5. First twenty order test Q-statistic of Y t
表5. 时间序列
的前20阶Q检验统计量
4.4. 模型建立
经过平稳性检验以及白噪声检验后,认为原数据二阶差分后的数据符合预测的条件,基于此在通过穷举的方法对二阶差分后的数据
进行遍历,通过不断缩小范围,找出AIC + BIC + HQ (赤池信息量准则 + 贝叶斯信息准则 + HQ信息准则)最小值所对应的p和q,可以确定模型参数
。由此建立模型ARIMA
,即模型参数自回归项数为0,滑动平均项数为1,使用的数据为二阶差分后数据。
5. 模型检验
为了验证模型是否适用,需要对模型进行检验,首先检验残差序列是否为正态分布,结果如表6所示。因为
,拒绝原假设,接受备择假设,认为残差序列具有正态性。
Table 6. Residual normal test diagram
表6. 残差正态检验图
如图3,图4所示,QQ图散点基本在线上,直方图也呈现正态性,因此模型建立成功。
6. 数据预测
6.1. 样本内预测
通过上面的分析,可以确定ARIMA
模型是螺纹钢期货价格时序图谱线(见图1)最佳的拟合预测模型,下面给出样本内预测结果。
根据表7可得预测值与真实值平均误差为0.03%。
Table 7. Prediction result of ARIMA ( 0 , 2 , 1 ) in sample
表7. ARIMA
模型样本内预测结果
6.2. 样本外内预测
由表8可得样本外预测结果,平均误差为1.17%。
Table 8. Prediction result of ARIMA ( 0 , 2 , 1 ) out of sample
表8. ARIMA
模型样本外预测结果
7. 结论
本文以2017年1月2日~2022年12月30日螺纹钢价格期货价格的数据为样本,选取在时间序列预测上作用明显的ARIMA模型对螺纹钢期货价格进行预测,建立了ARIMA钢材价格预测模型。通过上面的一系列预测过程,ARIMA模型成功的预测出了螺纹钢期货的价格,样本内平均误差为0.03%。结果与真实值之间误差较小,预测结果比较好。但样本外预测结果与真实值之间误差相对样本内的预测结果比较大,平均误差为1.17%。短期预测比长期预测效果好。这是因为ARIMA模型的预测仅从时间序列自身出发,没有考虑其它因素的影响。但螺纹钢期货的影响因素不仅仅只有时间,还有各种各样的因素,比如政策的影响等。在时间并不是数据变化的唯一影响因素时,ARIMA模型的发挥会受到影响,预测结果的误差会比较大。故推荐将ARIMA模型的预测作为一种参考。
基金项目
上海工程技术大学大学生创新项目:螺纹钢期货价格影响因素分析(项目编号:CS2221003)。
参考文献