基于多维放缩和长短期记忆网络的期货价格预测

doi:10.12677/AAM.2020.910207

期刊菜单

基于多维放缩和长短期记忆网络的期货价格预测
Futures Price Prediction Based on Multidimensional Scaling and Long Short-Term Memory Network

DOI: 10.12677/AAM.2020.910207, PDF, HTML, XML, 科研立项经费支持
作者: 扈文, 孙德山：辽宁师范大学数学学院，辽宁大连
关键词: 多维放缩；长短期记忆网络；BP神经网络；Multidimensional Scaling； Long Short-Term Memory Network； BP Neural Network

摘要: 结合多维放缩方法构建长短期记忆网络(MDS-LSTM)模型，对黄金主连期货未来10日的收盘价格进行预测。首先选取黄金主连的12个指标，利用多维放缩对12个指标进行降维，然后建立MDS-LSTM、MDS-BP和LSTM神经网络模型对收盘价格进行预测，将三个模型的预测结果进行比较，结果表明MDS-LSTM模型的预测精度较高，能更好的预测期货的走势。

Abstract: Combined with the multidimensional scaling method, the long short-term memory network (MDS-LSTM) model is constructed to predict the closing price of gold main link futures in the next 10 days. First, 12 indexes of the gold main link are selected and dimension-reduction of the 12 indexes is carried out. Then, MDS-LSTM, MDS-BP and LSTM neural network models are established to predict the closing price. The comparison of the prediction results of the three models shows that the MDS-LSTM model has a higher prediction accuracy and can better predict the futures trend.

文章引用：扈文, 孙德山. 基于多维放缩和长短期记忆网络的期货价格预测[J]. 应用数学进展, 2020, 9(10): 1798-1804. https://doi.org/10.12677/AAM.2020.910207

1. 引言

随着期货市场和期货行业改革的深入推进，期货行业将进入历史上最好的发展机遇期，期货行业将持续发展。人们也越来越关注期货的未来走势，希望可以提高收益，降低风险。近来，有许多文章都对期货价格的变化进行了研究。随着神经网络的发展，许多学者开始尝试使用神经网络模型对期货价格进行预测。

文宝石等 [1] 对股票数据进行滤波、差分及积分处理后结合LSTM模型进行预测，并与原始的LSTM模型和ARIMA模型对比发现，对数据进行多维处理后的LSTM模型有更好的性能和预测精度。马元昊 [2] 采用了多层LSTM模型对上证指数的后一日收盘价格进行预测，结果表明LSTM对股票的预测有强大的作用。肖争艳等 [3] 纳入反应中国国情的扩展指标，应用贝叶斯向量自回归模型与LSTM模型，对GDP进行动态滚动预测和固定窗口预测，结果表明LSTM模型有更好的泛化能力。李洁等 [4] 建立了基于后向传播的多时间尺度RNN模型，并对民航日客流量进行预测，并与其他几种方法对比发现该模型的预测精度更高。张可等 [5] 利用主成分分析法提取特征，建立LSTM模型对动作识别领域的7个数据集进行分析与预测，并与KNN模型和SVM模型对比，结果表明LSTM模型降低了预测难度，提高了精度。戴邵武等 [6] 引入经验模态分解法将数据分解成IMF分量和趋势项，构建LSTM模型对北京市PM2.5的浓度进行预测，与SVR模型相比较精度明显提高。

2. 多维放缩和长短期记忆网络

2.1. 多维放缩

多维放缩(Multidimensional Scaling)是一种经典的降维方法，它可以使原始空间中样本的距离在低维空间中得到保持，因此它主要关注与高维数据内部的特征，致力于保留高维空间中的“相似度”信息。

假设m个样本在原始空间的距离矩阵为 $D \in R^{m \times m}$ ，其元素 $d_{i j}$ 表示样本 $x_{i}$ 和 $x_{j}$ 之间的距离，原始空间的维数为d。目标是获得样本在 $d^{'}$ 维空间的表示 $Z \in R^{d^{'} \times m}, d^{'} \leq d$ ，且任意两个样本在 $d^{'}$ 维空间中的欧式距离等于原始空间中的距离，即 $‖ z_{i} - z_{j} ‖ = d_{i j}$ 。

令 $B = Z^{T} Z \in R^{m \times m}$ ，其中B为降维后样本的内积矩阵， $b_{i j} = z_{i}^{T} z_{j}$ ，有

$d_{i j}^{2} = {‖ z_{i} ‖}^{2} + {‖ z_{j} ‖}^{2} - 2 z_{i}^{T} z_{j} = b_{i i} + b_{j j} - 2 b_{i j}$ (1)

为了便于讨论，令降维后的样本Z被中心化，即 $\sum_{i}^{m} z_{i} = 0$ 。显然矩阵B的行与列之和均为零，即 $\sum_{i = 1}^{m} b_{i j} = \sum_{j = 1}^{m} b_{i j} = 0$ ，则

$\sum_{i = 1}^{m} d_{i j}^{2} = \sum_{i = 1}^{m} b_{i i} + m b_{j j} - 2 \sum_{i = 1}^{m} b_{i j} = t r (B) + m b_{j j}$ (2)

$\sum_{j = 1}^{m} d_{i j}^{2} = \sum_{j = 1}^{m} b_{j j} + m b_{i i} - 2 \sum_{j = 1}^{m} b_{i j} = t r (B) + m b_{i i}$ (3)

$\sum_{i = 1}^{m} \sum_{j = 1}^{m} d_{i j}^{2} = \sum_{i = 1}^{m} (t r (B) + m b_{i i}) = 2 m t r (B)$ (4)

其中， $t r (B) = \sum_{i}^{m} {‖ z_{i} ‖}^{2}$ 。令

$d_{i \cdot}^{2} = \frac{1}{m} \sum_{j = 1}^{m} d_{i j}^{2}$ (5)

$d_{\cdot j}^{2} = \frac{1}{m} \sum_{i = 1}^{m} d_{i j}^{2}$ (6)

$d_{\cdot \cdot}^{2} = \frac{1}{m^{2}} \sum_{i = 1}^{m} \sum_{j = 1}^{m} d_{i j}^{2} = \frac{1}{m^{2}} (2 m t r (B)) = \frac{2}{m} t r (B)$ (7)

于是由(1)~(7)可得

$d_{i j} = - \frac{1}{2} (d_{i i}^{2} + d_{i \cdot}^{2} - d_{\cdot j}^{2} + d_{\cdot \cdot}^{2})$ (8)

由此即可通过原始空间的距离矩阵D求取内积矩阵B。

对矩阵B做特征分解， $B = V Λ V^{T}$ ，其中 $Λ = d i a g (λ_{1}, λ_{2}, \dots, λ_{d})$ 为特征值构成的对角矩阵， $λ_{1} \geq λ_{2} \geq \dots \geq λ_{d}$ ，V为特征向量矩阵。假定其中有d个非零特征值，它们构成对角矩阵 $Λ_{*} = d i a g (λ_{1}, λ_{2}, \dots, λ_{d^{*}})$ ，令 $V_{*}$ 表示相应的特征向量矩阵，则Z可表示为 $Z = Λ_{*}^{\frac{1}{2}} V_{*}^{T} \in R^{d^{*} \times m}$ 。

在现实应用中为了使降维的效果更好，仅需要降维后的距离与原始空间中的距离尽可能接近，不需要完全相等，则可取 $d^{'} \leq d$ 个最大特征值构成的对角矩阵来表示Z。

2.2. 长短期记忆网络

长短期记忆网络(Long Short-Term Memory)是特殊的递归神经网络，由于常规的递归神经网络不能有效的解决长时间的信息依赖问题，所以Hochreiter和Schmidhuber提出了能够解决长期依赖的长短期记忆网络。LSTM的主要结构如下：

Figure 1. The structure of LSTM

图1. LSTM结构

LSTM最重要的结构是单元状态，如图1中横向穿过的一条直线。LSTM有特殊的门限结构，它可以有选择的让信息通过，LSTM有忘记门，输入门和输出门三种门限控制单元状态，分别对应图1中 $f_{t}$ ， $i_{t}$ 和 $O_{t}$ 。

忘记门 $f_{t}$ 根据上一时刻的输出 $h_{t - 1}$ 和当前时刻的输入 $x_{t}$ 判断哪些信息需要从单元状态中抛弃，它由sigmiod层决定，如图1中 $σ$ 层，sigmoid层输出的数字为[0, 1]，1表示完全保留，0表示完全抛弃。 $C_{t - 1}$ 是上一时刻的状态值，它会随着时间的变化不断更新。

输入门 $i_{t}$ 决定单元状态哪些信息需要储存，它分为两步，首先输入sigmoid层决定哪些值需要更新，接下来在tanh层输入新的候选值，如图1中tanh层。下面通过忘记门和输入门选择的信息进行信息更新，变成下一时刻的新信息。

输出门 $O_{t}$ 首先经过sigmoid层决定单元状态哪些信息可以输出，接下来将单元状态中的信息输入到tanh函数中与sigmoid的门限值相乘，最终得到输出的信息。

3. 实证分析

3.1. 数据选取

选取黄金主连(au0001) 2009年4月14日至2020年9月25日共2785个交易日的数据。分别用开盘价、收盘价、最高价、最低价、成交量、MA.MA1、KDJ.K、KDJ.D、KDJ.J、MACD.DIFF、MACD.DEA、MACD.MACD等12个指标预测未来10日期货收盘价。在图2中可以看到黄金主连的收盘价格变化幅度较大，没有明显的规律。

Figure 2. Curve: Gold main link closing price

图2. 黄金主连收盘价曲线

3.2. MDS-LSTM模型

本文使用的软件为MATLAB。首先将数据进行标准化处理，消除量纲的影响，本文采用“最大最小

值”标准化方法，即 $x^{'} = \frac{x - x_{\max}}{x_{\max} - x_{\min}}$ ，x为原始数据， $x^{'}$ 为标准化的数据， $x_{\max}$ 为原始数据的最大值， $x_{\min}$

为原始数据的最小值。

将标准化后的数据进行MDS降维，首先用euclidean法计算距离矩阵，然后将数据进行降维处理，结果显示MDS方法将数据降到10维。将降维后的数据输入到LSTM神经网络中进行训练，选取前2775个数据作为训练样本，后10个数据作为测试样本，将收盘价作为输出，用前一日的特征指标预测后一日的期货收盘价格。由于Adam优化器非常适用于大规模数据，并且计算高效，所以MDS-LSTM模型选择Adam作为优化器，初始学习率为0.005，迭代次数为200次，结果如图3。

Figure 3. The prediction results of MDS-LSTM

图3. MDS-LSTM预测结果

3.3. 模型对比

为了验证MDS-LSTM模型的效果，选取了MDS-BP模型与LSTM模型进行预测并与MDS-LSTM模型对比。MDS-BP模型选用newff法建立网络，用tansig训练隐藏层，purelin训练输出层，预测结果如图4。LSTM模型仍然选用Adam作为优化器，初始学习率为0.005，迭代次数为200次，预测结果如图5。

Figure 4. The prediction results of MDS-BP

图4. MDS-BP预测结果

Figure 5. The prediction results of LSTM

图5. LSTM预测结果

将MDS-BP模型和LSTM模型与MDS-LSTM模型进行对比，结果如图6。未来10日具体预测见表1，可以发现MDS-LSTM模型的预测效果更好，而且在期货价格波动较大时仍然有很好的拟合能力。

Figure 6. Comparison of prediction results

图6. 预测结果对比

Table 1. Comparison of prediction results over the next 10 days

表1. 未来10日的预测结果对比

4. 总结

建立了MDS-LSTM、MDS-BP和LSTM神经网络模型，充分利用LSTM神经网络的长时间记忆性对期货价格进行预测。在对比试验中发现MDS-LSTM模型对于期货收盘价预测精度更高，LSTM模型预测精度相对较低。相比较于MDS-BP模型，MDS-LSTM模型在期货价格波动较大时有很好的拟合能力，可以更准确地预测期货的收盘价格，所以该方法有可行性。对于波动较大的收盘价格MDS-LSTM模型基本可以预测趋势，但精度有待提高，需要不断探索得到更高的准确率。

基金项目

辽宁省自然科学基金指导计划项目(编号：2019-ZD-0471)。

参考文献

[1]	文宝石, 颜七笙. 数据多维处理LSTM股票价格预测模型[J]. 江西科学, 2020, 38(4): 443-449+472.
[2]	马元昊. 基于LSTM神经网络的股票大盘短期趋势预测[J]. 电脑知识与技术, 2020, 16(5): 205-206.
[3]	肖争艳, 刘玲君, 赵廷蓉, 陈彦斌. 深度学习神经网络能改进GDP的预测能力吗? [J]. 经济与管理研究, 2020, 41(7): 3-17.
[4]	李洁, 林永峰. 基于多时间尺度RNN的时序数据预测[J]. 计算机应用与软件, 2018, 35(7): 33-37+62.
[5]	张可, 崔乐. 基于PCA-LSTM模型的多元时间序列分类算法研究[J]. 统计与决策, 2020, 36(15): 44-49.
[6]	戴邵武, 陈强强, 刘志豪, 戴洪德. 基于EMD-LSTM的时间序列预测方法[J]. 深圳大学学报(理工版), 2020, 37(3): 265-270.

为你推荐

友情链接