基于ARIMA-LSTM组合模型的股价预测
Stock Price Prediction Based on ARIMA-LSTM Combination Model
DOI: 10.12677/ecl.2024.1341822, PDF, HTML, XML,   
作者: 梅星宇:贵州大学经济学院,贵州 贵阳
关键词: 浦东金桥ARIMA-LSTM股价预测Pudong Jinqiao ARIMA-LSTM Stock Price Prediction
摘要: 本文的研究基于对浦东金桥股票1799个交易日的时间序列数据进行分析,旨在利用ARIMA-LSTM组合模型对该股票的收盘价进行精确预测。通过网格调参确定了ARIMA模型的最佳阶数,以确保模型能够有效捕捉时间序列数据中的趋势和周期性变化。利用这一优化后的ARIMA模型对浦东金桥的收盘价进行预测,从中获得预测残差。而后将残差数据输入到LSTM (长短期记忆网络)模型中。LSTM作为一种适合处理序列数据的深度学习模型,能够更好地捕捉数据中的长期依赖关系和非线性动态。通过结合ARIMA模型的残差和LSTM模型的预测能力,构建了一个ARIMA-LSTM组合模型,进一步提升了对浦东金桥收盘价未来走势的预测准确性和稳定性。
Abstract: This study is based on the analysis of 1799 trading days’ time series data of Pudong Jinqiao stock, aiming to use the ARIMA-LSTM combination model to accurately predict the closing price of the stock. The optimal order of the ARIMA model was determined through grid tuning to ensure that the model can effectively capture trends and periodic changes in time series data. Use this optimized ARIMA model to predict the closing price of Pudong Jinqiao and obtain the prediction residual. Then, the residual data will be inputted into the LSTM (Long Short Term Memory Network) model. LSTM, as a deep learning model suitable for processing sequential data, can better capture long-term dependencies and nonlinear dynamics in the data. By combining the residual of the ARIMA model with the predictive ability of the LSTM model, an ARIMA-LSTM combination model was constructed to further improve the accuracy and stability of predicting the future trend of the closing price of Pudong Jinqiao.
文章引用:梅星宇. 基于ARIMA-LSTM组合模型的股价预测[J]. 电子商务评论, 2024, 13(4): 5833-5846. https://doi.org/10.12677/ecl.2024.1341822

1. 引言

随着科技的持续进步和金融行业的快速发展,量化投资正逐步成为金融市场中的一个至关重要的领域。量化投资利用大数据和复杂算法来分析金融市场的时间序列数据,通过系统化的方法进行交易决策和资产配置,以期在风险控制的基础上实现收益最大化。而金融时间序列数据受到多种因素的影响,包括宏观经济因素、公司财务表现、市场情绪和全球政治事件等。这些影响因素既可能呈现线性关系,例如通货膨胀率对股市走势的影响,也可能是非线性的,例如市场恐慌时投资者的羊群行为。量化投资者通过建立复杂的数学模型和算法来捕捉和分析这些因素,以便及时作出反应并优化投资组合的表现。

股票市场的预测一直是金融领域的核心议题。传统的技术分析和基本面分析在预测市场走势方面有其局限性,而随着人工智能技术的崛起,机器学习和神经网络等先进技术开始在金融领域广泛应用。这些技术能够处理大规模数据并从中提取模式,进而预测股票价格的未来波动和趋势。例如,神经网络可以通过学习历史数据的模式和趋势来预测未来的市场走势,而机器学习算法则可以通过训练数据来自动调整和优化模型,以提高预测的准确性和可靠性。对投资者和决策者而言,利用这些先进的技术预测股价的波动和趋势具有重要意义。首先,精确的市场预测可以帮助投资者在不同市场环境下做出理性的投资决策,从而降低投资风险并增加收益。其次,预测市场走势还可以为资产配置和投资组合管理提供科学依据,使投资者能够根据预期收益和风险来优化资产配置,实现长期的投资目标。

学术界对ARIMA-LSTM模型的使用已经涉及到众多领域,既有金融领域又有非金融领域。在金融领域,炊婉冰和吕学斌(2023)利用ARIMA-SSA-LSTM模型对湖北省和广东省碳排放交易价格进行了预测[1],发现ARIMA-SSA-LSTM模型的预测精确度最高;孙晨皓和王林(2023)对上证指数进行了预测,发现模型的预测结果具有滞后性[2];次必聪和张并一(2022)利用ARIMA-LSTM模型预测了道琼斯工业指数、上证指数和伦敦金价格指数[3];冯一铂(2021)则对北京、天津和上海三个地区的寿险保费收入进行了预测,并将ARIMA-LSTM模型的预测结果和其他模型的预测结果进行了对比[4]。在医学领域,王瑞等(2024)预测了北京某传染病的确诊人数,发现模型预测的确诊人数和实际确诊人数一致[5];赖晓蓥和钱俊(2022)则预测了某种传染病的发病趋势[6]。在其他领域,何露莹和熊显名(2022)则对重大节假日和商场活动时的商场停车位数量[7];康俊峰等(2023)预测了上海市入境旅游人数[8];李如仁等(2024)预测了露天矿地表形变趋势[9];余浩等则预测了矿井涌水量的变化趋势[10]

2. 模型设定和研究方法

2.1. ARIMA模型

ARIMA (Autoregressive Integrated Moving Average)模型是一种自回归模型(AR)、移动平均模型(MA)和差分思想结合的时间序列分析方法。假如有如下随机过程序列:

{ x t :t=1,2,3, } (1)

如果对于每一个时间指标集 1 t 1 < t 2 << t m 和任意正整数 h1 ( x t1 , x t2 ,, x tm ) 的联合分布都与 ( x t1+h , x t2+h ,, x tm+h ) 的联合分布相同,那么这个随机过程就是平稳的。对于一个平稳时间序列过程 { x t :t=1,2,3, } 若随着h无穷递增, x t x t +h “近乎独立”,则称之为弱相关的。假设有如下弱相关时间序列:

x t = e t + α 1 e t1 t=1,2,3, (2)

其中, { e t :t=0,1,2, } 是均值为0、方差为 σ e 2 的独立同分布序列。过程 x t 即为一阶移动平均过程[moving average process of order one, MA(1)]: x t e t e t1 的一个加权平均,MA(1)过程弱相关的原因在于序列中相邻两项之间是相关的,因为:

x t+1 = e t+1 + α 1 e t (3)

Cov( x t , x t+1 )= α 1 σ e 2 (4)

所以有

Corr( x t , x t+1 )= α 1 / ( 1+ α 1 2 ) (5)

x t x t+1 的相关系数最大为0.5 ( α 1 =1 时出现最大正相关),因此MA(1)过程是弱相关的。

关于一阶自回归过程[auto regressive process of order one, AR(1)],我们可以参照下面这个例子:

y t = ρ 1 y t1 + e t t=1,2,3, (6)

该时间序列的起始点为 y 0 (t = 0),且 { e t :t=0,1,2, } 是均值为0、方差为 σ e 2 的独立同分布序列,这里假设 e t 独立于 y 0 E( y 0 )=0 ,且 ρ 1 的绝对值小于1,则 { y t } 被称为一阶自回归过程。

为了更好地开展对时间序列数据的拟合,可以将AR(p)与MA(q)结合起来,得到ARMA(p, q)模型:

y t = β 0 + β 1 y t1 ++ β p y tp + ε t + θ 1 ε t1 ++ θ q ε tq (7)

进一步地,在ARMA(p, q)模型中引入差分思想,即得到ARIMA(p, d, q)模型,其中p为自回归模型的阶数,q为移动平均模型的阶数,d为时间序列所需要的差分次数。

2.2. LSTM模型

长短期记忆网络(Long Short-Term Memory, LSTM)是一种在深度学习领域中被广泛应用于处理时间序列数据的特殊循环神经网络(Recurrent Neural Network, RNN)。相比于传统的循环神经网络,LSTM通过其特有的记忆单元和门控机制,能够更有效地处理和学习长期依赖关系,使其在多个领域如自然语言处理、语音识别、时间序列预测等方面具有优势。LSTM的设计核心包括三个关键的门控单元,遗忘门(Forget Gate)、输入门(Input Gate)和输出门(Output Gate) (见图1)。遗忘门决定了在记忆单元中哪些信息需要被保留或遗忘;输入门根据当前的输入和前一时刻的隐藏状态;输出门则决定了当前时刻的隐藏状态和输出值。这些门控机制有效地管理信息流动,从而使得LSTM能够长期记忆和处理时间序列中的复杂模型。

Figure 1. Internal network structure diagram of long short term memory

1. 长短期记忆内部网络结构图

在图(1)中ifo来表示输入门、遗忘门和输出门,O表示对应元素相乘,Wb分别表示网络的权重矩阵与偏置向量。在时间步为t时,LSTM隐含层的输入与输出向量分别为xh,记忆单元为c,输入门用于控制网络当前输入数据x流入记忆单元的多少,即有多少可以保存到c,其值为:

i t =σ( W xi x t + W hi h t1 + b i )=σ( W i V+ b i ) (8)

遗忘门是LSTM的关键组成部分,可以控制哪些信息要保留哪些要遗忘,并且以某种方式避免当梯度随时间反向传播时引发的梯度消失和爆炸问题。遗忘门可以决定历史信息中的哪些信息会被丢弃,即判断上一时刻记忆单元ct-1中的信息对当前记忆单元ct的影响程度。其输入值为:

f t =σ( W xf x t + W hf h t1 + b f )=σ( W f V+ b f ) (9)

c ˜ t =tanh( W xc x t + W hc h t1 + b c )=tanh( W c V+ b c ) (10)

c t = f t c t1 + i i c ˜ t (11)

输出门控制记忆单元c,对当前输出值h,的影响,即记忆单元中的哪一部分会在时间步t输出。输出门的值及隐含层的输出值可表示为:

σ t =σ( W X0 X t + W h0 + b 0 )=σ( W 0 V+ b 0 ) (12)

2.3. ARIMA-LSTM模型

ARIMA-LSTM模型即是ARIMA模型和LSTM模型的结合,该组合模型相对于单一的ARIMA模型或者LSTM模型拥有无法比拟的优势。相比于ARIMA模型,该组合模型的优势在于:一是ARIMA模型只能捕捉线性关系,而ARIMA-LSTM模型可以捕捉时间序列数据中的非线性关系;二是ARIMA-LSTM模型比ARIMA模型更适合解决数据中的长期依赖问题;三是预测精准度比单独使用ARIMA模型要高;四是能更有效地处理数据中的噪声和异常值问题。相比于LSTM模型,该组合模型的优势在于:一是减少了单一LSTM模型中训练的复杂程度,组合模型中LSTM只需处理残差;二是增强模型的稳健性,消除时间序列数据中的趋势和季节性;三是可以减少处理时间序列数据时模型过拟合的风险。综合考虑以上因素后,本文选择ARIMA-LSTM模型进行对浦东金桥股价预测的研究。

就具体做法而言,首先使用股票收盘价的时间序列数据进行ARIMA模型构建,然后提取数据中的线性部分,而ARIMA模型的残差部分作为非线性部分,将残差部分放入LSTM模型中,预测下一交易日的ARIMA模型残差,最后将ARIMA的预测值和LSTM的残差预测值之和作为最终收盘价预测值。

3. 数据选取和研究思路

3.1. 数据选取

本文选取的是A股上市的浦东金桥股票1799个交易日的数据,通过ARIMA-LSTM模型对该股票的收盘价进行分析和预测。该股票相关数据均为通过python软件的efinance库抓取。浦东金桥股票相关指标的描述性统计如下所示(见表1)。

Table 1. Descriptive statistics

1. 描述性统计

变量名

样本数

平均值

标准差

最小值

中位数

最大值

收盘价

1799

11.251

1.884

8.14

11.79

16.91

开盘价

1799

12.248

1840

8.06

11.80

16.73

最高价

1799

12.437

1.866

8.32

11.99

17.21

最低价

1799

12.077

1.821

7.33

11.63

16.57

成交量

1799

55642.1

81049.06

17914.00

32161.00

1027089

成交额

1799

1.37E+08

1.86E+08

19956772

72510940

1.46E+09

振幅

1799

2.948

1.984

0

2.39

14.04

涨跌幅

1799

0.005

2.282

−11.38

−0.08

11.74

涨跌额

1799

−0.002

0.282

−1.75

−0.01

1.6

换手额

1799

0.668

0.953

0.04

0.39

12.08

3.2. 研究思路

1) 原始数据的相关检验。这里的检验主要包括白噪声检验和平稳性检验,白噪声检验也称为纯随机性检验,作用在于验证现有时间序列数据是否为一个纯随机过程。若现有数据为一个纯随机过程,则后续分析就没有任何意义,平稳性检验用于判断时间序列的平稳性,如果现有时间序列数据不平稳,则需要对数据一阶差分,再重新进行平稳性检验,若一阶差分的数据仍然不具有平稳性,则继续对数据二阶差分,以此类推。

2) ARIMA模型的参数选取。在上一步的处理后,现有时间序列数据趋于平稳,此时需要绘制自相关图(ACF)和偏自相关图(PACF),通过ACF图确定参数q的值,即移动平均项的阶数;通过PACF图确定参数偏差的值,即自回归项的系数,同时结合(1)中的差分次数,确定参数d的值。

3) ARIMA模型的数据预测。将有关数据输入模型,训练模型并预测,将预测值保存,残差部分准备输入到LSTM模型中。

4) LSTM模型数据预处理。先将数据输入到模型中,转换成相应的矩阵形式,从而被LSTM模型识别。进而将数据进行归一化处理,以此提高模型的训练效果。

5) 初始化模型。经过多次尝试,找到最佳的LSTM模型的训练块大小和次数。

6) 输出并反归一化。结束训练模型后,需要将LSTM模型输出的预测值进行反归一化处理,然后与之前ARIMA模型的预测值汇总,得到最终股价收盘价得到预测结果。

4. ARIMA模型预测结果和分析

4.1. 原始数据收盘价变化趋势

由于本文重点关注的是浦东金桥收盘价的变化以及对其收盘价的预测研究,此处我们先将通过python软件efinance库抓取的1799个交易日数据绘图,以此反映浦东金桥收盘价的变动趋势(见图2)。从图2可以看出,浦东金桥的收盘价整体上一直处于上升和下降的交叠中,某段时间区间内可能会出现明显的上升或者下降。以2023年全年的交易日为例,可能的原因在于浦东金桥股票隶属于上海金桥开发区股份有限公司(以下简称金桥公司),这是一家以房地产为主要经营业务的公司,而根据诸葛数据研究中心的相关数据,2023年10月上海新房成交量呈现严重的下滑趋势,新建商品房成交量环比下降23.8%,新房成交价也呈现下降趋势,环比下降3.8%,这一方面因为受国庆假期的影响,出游意愿上升,导致居民购房需求暂缓,另一方面,在9月“任房不认贷”政策落地下,市场情绪迅速升温,促使成交量短期冲高,随着政策效应的逐渐减退,10月成交量开始逐渐趋于正常。另外,在第250个交易日后,浦东金桥的收盘价出现大幅上升,可能的原因在于金桥公司的最大股东为上海市国资委,国家此时出台相关政策大力支持浦东新区的开发。图2第300个交易日至第350个交易日的收盘价表明浦东金桥收盘价又回到了上涨和下跌的交汇中。

Figure 2. Closing price trend

2. 收盘价变化趋势

4.2. 数据平稳性检验

使用ARIMA模型预测收盘价的一个重要前提是现有时间序列数据必须是平稳的。如果所研究的时间序列不具有平稳性,例如具有时间趋势或者季节性,那么ARIMA模型可能无法正确识别时间序列的特性,从而导致模型预测的结果误差较大。因此,此处本文对样本期内浦东金桥的收盘价进行单位根检验,即通过增广的迪基–富勒检验(augmented Dickey-Fuller(ADF)test)计算出相应的统计量,进而判断样本期内浦东金桥的收盘价是否具有平稳性(见表2)。表2汇报了对浦东金桥收盘价进行平稳性检验的结果,由结果可知,浦东金桥的收盘价ADF-test的值约为−2.9975,与三个显著性水平下ADF-test的临界值比较后,综合考虑p值后,浦东金桥收盘价在5%的水平上具有平稳性。

Table 2. Stability test of raw data

2. 原始数据平稳性检验

原始数据

1%显著性水平

5%显著性水平

10%显著性水平

ADF-test

−2.99752329

−3.449559662

−2.870003511

−2.571279007

p-value

0.035126341

0.01

0.05

0.1

为了增强数据的平稳性,结合前文的理论分析结果,此处对浦东金桥收盘价这一时间序列进行一阶差分,对差分后的数据重新进行平稳性检验(见表3)。表3汇报了对浦东金桥收盘价时间序列数据一阶差分后的平稳性检验结果,由结果可知,一阶差分后的时间序列数据ADF-test的值约为−8.1420,远大于三个显著性水平下ADF-test的临界值,且p-value接近0,通过了1%水平上的显著性检验,因此,在对浦东金桥收盘价进行一阶差分后,时间序列的平稳性。

Table 3. First order difference stationarity test

3. 一阶差分平稳性检验

一阶差分

1%显著性水平

5%显著性水平

10%显著性水平

ADF-test

−8.1420455880

−3.449559662

−2.870003511

−2.571279007

p-value

2.832122E−14

0.01

0.05

0.1

Figure 3. First order differential trend chart

3. 一阶差分趋势图

为了更直观地展示浦东金桥收盘价经过一阶差分处理后和未经过差分处理的原始收盘价的差异,本文将经过差分处理的收盘价同样绘制成图,反映经过一阶差分处理后浦东金桥收盘价的变动趋势(见图3)。图3展示了一阶差分后浦东金桥收盘价的变化趋势,相比于图2图3所展示的时间序列平稳性明显增强,且数据波动相比于图1更为平缓。这也印证了前文对浦东金桥收盘价进行一阶差分处理的必要性,进一步增强了表3中ADF检验的说服力。

4.3. ARIMA模型参数选取

首先,本文根据浦东金桥收盘价格的原始数据绘制自相关图(ACF)和偏自相关图(PACF) (见图4)。自相关图(ACF)显示了浦东金桥收盘价这一时间序列与其自身滞后项的相关性,由图4中左下角的这幅图可以看出,浦东金桥收盘价与其自身滞后项存在正相关,且首个超过图中蓝色阴影部分的滞后阶数在0~2.5之间,因此我们可以初步确定ARIMA模型中p的取值范围为(0, 3);由图4中右下角的这幅图可以看出,首次超过蓝色阴影部分的滞后阶数在0~2.5之间,因此我们可以初步确定ARIMA模型中p的取值范围为(0, 3);结合前文对浦东金桥收盘价的平稳性检验,我们可以确定差分阶数d = 1。但是,仅根据自相关图和偏自相关图确定ARIMA模型的参数具有很强的主观性,而且无法确定具体pq的值,下文将用网格搜索寻参的方法确定具体pq的值。

Figure 4. Autocorrelated and partial autocorrelated graphs

4. 自相关和偏自相关图

考虑到根据ACF和PACF图确定模型参数的缺陷,此处采取网格调参的方法确定模型最佳参数选取。本文根据赤池信息准则(AKaike Information Criterion, AIC)选取ARIMA模型参数,该准则同时考虑了模型的拟合优度和复杂程度,对拟合模型阶数具有良好的效果。

该方法可表示为:

minln( e e/n )+ 2 n K (13)

其中,右边第一项为对模型拟合度的奖励(减少残差平方和),而第二项为对解释便利个数过多的惩罚(解释变量个数K的增函数)。当K上升时,第一项的值减少而第二项的值增加。

结合模型设定和前文的分析结果,我们将pdq各种可能的组合带入模型中验证,寻找使得AIC值最小的参数组合(见表4)。表4汇报了不同参数组合下AIC的值,由结果可知当p = 2,d = 1,q = 1时,AIC取得最小值。至此,ARIMA模型的参数确定。

Table 4. Grid tuning results

4. 网格调参结果

p

d

q

AIC

0

1

0

559.2684736

0

1

1

561.2480348

0

1

2

559.4258222

1

1

0

561.2498584

1

1

1

550.8966360

1

1

2

548.9911841

2

1

0

559.7053620

2

1

1

548.7455814

2

1

2

550.3254884

注:p为自回归阶数,d为差分阶数,q为移动平均的阶数。

4.4. 训练ARIMA模型

确定好最佳的模型参数组合后,我们需要利用ARIMA模型对浦东金桥收盘价展开预测以获取残差项。首先,为方便取值操作,此处需要转换数据类型为数组模块;其次,需要划分训练集和测试集,这里选用80%的数据作为训练集,20%的数据作为测试集;最后是训练模型和进行预测(见表5)。表5汇报了ARIMA模型对测试集360个数据的预测结果,利用实际观测值和模型预测值的差计算出残差项。

Table 5. ARIMA model prediction results

5. ARIMA模型预测结果

训练集

模型预测值

实际观测值

残差

1

11.455220

11.570000

0.114780

2

11.540563

11.310000

−0.09563

3

11.303152

11.330000

0.026848

4

11.329444

11.310000

−0.194440

5

11.310403

11.590000

−0.279597

6

11.573603

11.570000

0.003603

7

11.553791

11.600000

0.046209

8

11.587232

12.460000

0.872776

9

11.458979

11.440000

−0.018979

10

11.330203

11.310000

−0.020203

356

11.523494

11.720000

0.196596

357

11.744510

11.490000

−0.254510

358

11.500242

11.440000

−0.060242

359

11.461404

11.230000

−0.231404

360

11.252100

11.220000

−0.032100

获得已经拟合好的ARIMA模型残差后,我们将模型残差绘图(见图5)。图5展示了残差项的变化情况,根据图形初步判断残差在0附近上下波动,且波动率较小,具有随机性,可能符合残差均值为0、方差稳定的假设。为了更好的判断这一假设是否成立,本文继续绘制残差散点图和直方图(见图6图7)。

Figure 5. Residual plot

5. 残差图

Figure 6. Scatter plot

6. 散点图

图6绘制了残差项的散点图,由图6可知散点均匀地分布在直线上,这表明残差的方差是恒定的,残差具有很强的同方差性。图7绘制了相应的直方图,从图6可以看出,ARIMA模型残差的分布以0为对称轴,均匀地向两侧展开,这说明残差项近似服从正态分布,满足均值为0的假设。

Figure 7. Histogram

7. 直方图

验证模型拟合的残差服从0均值,同方差的假设后,本文将ARIMA模型针对浦东金桥收盘价的预测数据与实际数据绘制成下图(见图8)。图8展示了ARIMA模型对浦东金桥收盘价格的预测值和真实值的变化以及二者之间的差异,其中蓝色曲线表示ARIMA模型的预测值,红色曲线表示浦东金桥收盘价的真实值,可以发现ARIMA模型的预测值和真实值差异并不明显,单一使用ARIMA模型预测的效果良好,但是ARIMA模型在预测过程中只考虑了线性因素对股票收盘价的影响,而忽略了潜在的非线性因素对股价收盘价的影响。因此,下一小节将采用差分自回归移动平均方法-长短期记忆神经网络(ARIMA-LSTM)模型进行股票收盘价的预测。

Figure 8. ARIMA prediction results

8. ARIMA预测结果

5. ARIMA-LSTM模型预测结果及分析

5.1. 训练LSTM模型

根据上一章ARIMA的预测结果,本章用预测得到的数据训练LSTM模型。具体而言,在LSTM模型中生成一个新的空数据集,将ARIMA模型预测的结果放入这个空数据集中,获取数据集中的残差项并做数据类型转换,使得数据转换为LSTM模型可识别的形式。然后对数据归一化处理,消除数据之间因不同特征导致的量纲影响,其次再反归一化处理,将数据集中的数据还原到原始数据的尺度,以便后续的结果解释。

5.2. 构建LSTM网络

LSTM网络主要分为长短期记忆层、dropout层和全连接层。其中,LSTM层的神经元数为128,这层主要作用是用于解决传统循环神经网络(CNN)中存在的长期依赖问题;dropout层用于减少神经网络中的过拟合现象,在训练模型的过程中随机丢弃网络中的部分神经元,强制网络不依赖于任何一个神经元,从而增加了整体网络的泛化能力;全连接层则用于连接前一层的神经元和当前层的神经元,保证每个神经元对上一层神经元都具有输出权重。LSTM网络构建完成后,则需要先分析训练模型的loss情况(见图9)。图9展示了训练LSTM模型中所产生的100次loss变化趋势,由图9可以看出,loss整体呈现下降趋势,这说明LSTM模型拟合的情况较好,模型的收敛速度和稳定性良好,反之,若loss没有随着时间显示出下降的趋势甚至在某一个时间段突然上升,则说明需要进一步优化模型。

Figure 9. LSTM model loss trend chart

9. LSTM模型loss趋势图

5.3. ARIMA-LSTM模型预测

此处对训练集中的残差项的数据进行预测,同时进行反归一化处理,分别获得残差项的预测数据和真实数据,同时计算评价指标mse、mae和rmse (见表6)。表6汇报了三种评价指标的结果,其中,mse是预测值和真实值之间的差异平均平方值,mse的值越小,表明模型预测的精确度越高;mae是预测值和真实值之间的差异平均绝对值,mae衡量了预测值偏离真实值的程度,mae的值越小,表明模型预测的精确度越高;rmse表示的是mse的平方根,用于衡量预测值和真实值之间的平均误差大小,与mse一样,rmse的值越小,表示模型预测的精确度越高。

Table 6. ARIMA-LSTM model evaluation indicators

6. ARIMA-LSTM模型评价指标

评价指标

mse

mae

rmse

ARIMA-LSTM

0.346

0.347

0.588

经过上述三种指标的评价后,LSTM模型的拟合程度较好。据此,我们将预测结果绘制成下图(见图10)。图10中蓝色曲线反映的是基准数据的变化趋势,红色曲线反映的是预测数据的变化趋势。从两条曲线的变化中可以看出,ARIMA-LSTM模型预测数据上升和下降的情况基本和数据一致,但是具体的数值存在一定的偏差。可能的原因有两方面:一是在为ARIMA模型定价时,虽然通过网格调参确定了最佳的参数选取,但是有时候选取的参数未必是最适合模型的,从而导致ARIMA计算的残差项有偏差;二是相较于传统的循环神经网络,LSTM虽然能够在一定程度上解决时间序列数据中的长期依赖问题,但也没有能够考虑所有非线性因素的影响。

Figure 10. ARIMA-LSTM prediction result chart

10. ARIMA-LSTM预测结果图

6. 结论和政策建议

本章节为作者提供“致谢”的示例。本文基于浦东金桥2017年1月1日至2024年5月31日共计1799个交易日的数据,利用ARIMA-LSTM模型预测了浦东金桥收盘价的变化趋势。根据预测结果,本文提出如下结论政策建议:

首先,使用模型预测股票收盘价时需要寻找合适的模型。在金融领域,存在多种预测模型,例如基于统计学的时间序列分析、机器学习的回归模型以及深度学习的神经网络模型等。每种模型都有其独特的优势和适用场景。选择合适的模型取决于数据的特性、预测的时间跨度以及预测的精度要求。例如,对于短期预测,时间序列模型可能更为适用,而对于长期和复杂的市场动态,则可能需要更复杂的机器学习模型来捕捉非线性关系和复杂的市场行为。

其次,不断优化和寻找模型的最佳参数是提升预测效果的关键。模型的参数选择直接影响到预测的准确性和稳定性。在实际应用中,通过调整和优化模型的参数,可以使模型更好地拟合历史数据的模式,并在新数据上表现更为优越。这种优化过程不仅包括模型的超参数调整,还可能涉及特征工程的改进和数据预处理的优化,以确保输入数据的质量和适用性。

最后,为了提升预测效果,还可以考虑集成多个模型进行预测。模型集成技术能够结合多个单一模型的预测结果,通过投票、加权平均或者堆叠等策略,来提升整体预测的准确性和稳定性。例如,结合基于统计学的模型和基于机器学习的模型,可以利用各自的优势互补,从而得到更为可靠和一致的预测结果。

参考文献

[1] 炊婉冰, 吕学斌. 利用ARIMA-SSA-LSTM组合模型的碳排放交易价格预测[J]. 西安科技大学学报, 2023, 43(5): 1025-1034.
[2] 孙晨皓, 王林. 基于ARIMA和LSTM的上证指数预测与分析[J]. 信息与电脑(理论版), 2023, 35(2): 29-31.
[3] 次必聪, 张品一. 基于ARIMA-LSTM模型的金融时间序列预测[J]. 统计与决策, 2022, 38(11): 145-149.
[4] 冯一铂. 基于ARIMA和LSTM的组合模型对寿险保费收入的预测[J]. 科学技术创新, 2021(33): 166-168.
[5] 王瑞, 李瑞沂, 曹沛根, 等. 基于ARIMA-LSTM混合模型对传染病的预测分析[J]. 现代信息科技, 2024, 8(1): 116-120.
[6] 赖晓蓥, 钱俊. 基于机器学习组合模型的疟疾发病率预测研究[J]. 数学的实践与认识, 2022, 52(2): 125-133.
[7] 何露莹, 熊显名. 基于ARIMA-LSTM的停车场已用车位预测研究[J]. 工业控制计算机, 2022, 35(12): 23-25.
[8] 康俊锋, 符悦, 方雷, 等. 基于最小二乘法赋权的ARIMA-LSTM模型预测入境旅游人数——以上海市为例[J]. 浙江大学学报(理学版), 2023, 50(4): 508-20.
[9] 李如仁, 李梦晨, 葛永权, 等. 基于多源因素融合回归和ARIMA-LSTM的露天矿地表形变趋势分析[J/OL]. 金属矿山.
https://kns.cnki.net/kcms/Detail/Detail.aspx?doi=34.1055.TD.20240419.1826.002, 2024-07-26.
[10] 余浩, 陈巧军, 岳楷迪, 等. 基于ARIMA-LSTM模型对矿井涌水量的预测[J]. 内蒙古煤炭经济, 2023(24): 1-3.