时间序列模型预测——基于函数型数据分析的方法与应用
Time Series Model Forecasting—Methods and Applications Based on Functional Data Analysis
摘要: 在时间序列预测领域,精准的预测模型对于诸多实际应用场景具有重要意义。本文聚焦于基于函数型数据分析的时间序列模型预测方法,首先以构造小波基来拟合函数为例介绍了函数型数据分析在处理离散时序数据时进行降噪的方法,并阐述了主成分分析在面对线性和非线性的高维数据的降维方法,并以LSTM为模型对比了在多类数据集当中数据降维的效果。在此理论基础上,本文将所研究的方法应用于中国大兴安岭地区部分气象站的森林火险指数(Fire Weather Index, FWI)时序数据预测实践。通过对数据进行小波变换降噪、降维处理后,运用所构建的LSTM模型进行预测,并进一步对火灾风险进行科学评估。实验结果表明,所提出的基于函数型数据分析的时间序列预测方法在实际应用中展现出了较高的预测精度和良好的可靠性,为相关领域的时序预测与风险评估工作提供了新的有效途径和方法参考。
Abstract: In the field of time series forecasting, accurate predictive models hold significant importance for numerous practical application scenarios. This paper focuses on the forecasting methods of time series models based on functional data analysis. Firstly, it introduces the method of using wavelet basis construction to fit functions as an example, illustrating how functional data analysis can be applied to denoise discrete time series data. It also elaborates on the dimensionality reduction methods of principal component analysis (PCA) when dealing with high-dimensional linear and nonlinear data. Furthermore, the paper compares the dimensionality reduction effects of these methods on various datasets using LSTM models as a benchmark. Building on this theoretical foundation, the methods studied in this paper are applied to the practice of predicting the Forest Fire Weather Index (FWI) time series data from some meteorological stations in the Greater Khingan Region of China. After denoising and dimensionality reduction through wavelet transformation, the constructed Long Short-Term Memory (LSTM) model is employed for forecasting, followed by a scientific assessment of fire risk. The experimental results demonstrate that the proposed time series forecasting method based on functional data analysis exhibits high prediction accuracy and good reliability in practical applications, providing a new and effective approach and reference for time series forecasting and risk assessment in relevant fields.
文章引用:李童, 肖维维. 时间序列模型预测——基于函数型数据分析的方法与应用[J]. 应用数学进展, 2025, 14(3): 348-356. https://doi.org/10.12677/aam.2025.143122

1. 介绍

1.1. 引言

在现代数据分析领域,时间序列预测作为一种关键工具,广泛应用于金融市场、气象预测、工业生产等多个领域。随着数据量的激增和计算能力的提升,研究者们不断探索更为高效和准确的预测方法。传统的时序数据分析方法往往将数据视为离散的点序列,忽略了数据在时间上的连续性和内在的函数特性。这种处理方式在一定程度上限制了对时序数据深层次规律的挖掘和理解。近年来,随着函数型数据分析(Functional Data Analysis, FDA)理论的不断发展与完善,为时序数据的分析提供了一种全新的视角和方法。

时序数据函数化,即将离散的时间序列数据映射为连续的函数形式,不仅能够更自然地刻画数据随时间的动态变化,还能够充分利用函数的数学性质,如光滑性、导数等,从而更精准地捕捉数据中的潜在规律和特征。

主成分分析(Principal Component Analysis, PCA)作为一种经典的降维技术,其在时间序列数据处理中的应用日益受到关注。通过提取数据中的主要特征,PCA能够有效降低数据的维度,从而简化模型的复杂度并提高预测的准确性。

现如今PCA作为函数型数据分析的经典算法之一,在各类数据处理中被广泛使用。比如在风力发电方面,可以对风电历史数据进行降维,并提取出典型风电出力场景[1]。在面对不同的任务,包括分类、预测和回归等任务时,PCA降维后的数据都能在很多模型中有非常优秀的泛化性能[2]。尤其是在一些高度结构化的高维心电数据中以最低的维度最大限度地保留住数据本应该有的信息,并在预测任务中表现卓越[3]。在众多数据集当中,以高维度和高复杂性著称的交通数据中,PCA能够给各类深度学习模型减轻非常巨大的训练压力,并同样表现出了优秀的卓越性能[4]

1.2. 本文贡献

本文的主要贡献如下:

1. 介绍了基于函数型数据分析可以通过数据降维、离散数据函数化等手段来提高数据质量的方法,进而提高后续时序模型的预测效果。

2. 详细对比了主成分分析降维在处理各大类时序数据时的性能,这些数据涵盖了能源、金融、医疗、交通以及气象等方面。

3. 以大兴安岭地区部分气象站的FWI时序数据为例,通过对数据降维、预测,并最终对相关地区的未来一段时间的火灾风险进行评估。

2. 方法

2.1. 函数化时间序列数据

时序数据函数化是将离散的时间序列数据映射为连续的函数形式,这一过程不仅能够更自然地刻画数据随时间的动态变化,还能够充分利用函数的数学性质,如光滑性、导数等,从而更精准地捕捉数据中的潜在规律和特征。

对于给定数据集 { T ij } i=1 n ,其中i表示n个时间点的观测值,j表示当前时间点的j个特征。本文以小波基为例把时序数据的每组特征分别和时间轴进行拟合函数进而将时序数据函数化。对于给定的时序数据 { T ij } i=1 n ,进行一维的小波变换[5] [6]

T φ,j ( j 0 ,k )= T ij , φ j 0 ,k = 1 n i=1 n T ij φ j 0, k ( i )

T ψ,j ( j,k )= T ij , ψ j,k = 1 n i=1 n T ij ψ j,k ( i )

小波基函数和尺度函数可以通过缩放和平移构造,对于非2的幂次长度的信号,可以通过充零等方式来调整信号长度:

φ j 0, k ( i )= 2 j 0 2 φ( ik 2 j 0 )

ψ j,k ( i )= 2 j 2 ψ( ik 2 j )

由一维小波变换得到的系数可以重构原始特征信号:

T i,j = 1 n [ T φ,j ( 0,0 ) φ 0,0 ( i )+ j=0 J1 k=0 2 j 1 T ψ,j ( j,k ) ψ j,k ( i ) ]

于是对于每个特征j,得到最终拟合的函数为:

f j ( t )= 1 n [ T φ,j ( 0,0 ) φ 0,0 ( t )+ j=0 J1 k=0 2 j 1 T ψ,j ( j,k ) ψ j,k ( t ) ]

在对每个特征j的时序数据 { T ij } i=1 n 进行小波变换后得到的近似系数 T φ,j ( 0,0 ) 和细节系数 T ψ,j ( j,k ) 利用阈值处理方法进行处理,从而达到降噪:

T ψ,j ( denoised ) ( j,k )={ T ψ,j ( j,k )if| T ψ,j ( j,k ) |threshold 0if| T ψ,j ( j,k ) |<threshold

使用处理后的系数 T ψ,j ( denoised ) ( j,k ) 进行信号重构,得到降噪后的特征时间序列 { T ij ( denoised ) } i=1 n

T ij ( denoised ) = 1 n [ T φ,j ( 0,0 ) φ 0,0 ( i )+ j=0 J1 k=0 2 j 1 T ψ,j ( denoised ) ( j,k ) ψ j,k ( i ) ]

降噪后的特征时间序列 { T ij ( denoised ) } i=1 n 的最终表达式为:

T ij ( denoised ) = 1 n [ T φ,j ( 0,0 ) φ 0,0 ( i )+ j=0 J1 k=0 2 j 1 { T ψ,j ( j,k ),if| T ψ,j ( j,k ) |threshold 0,if| T ψ,j ( j,k ) |<threshold ψ j,k ( i ) ]

2.2. 数据降维

对于线型的特征数据,主成分分析(Principal Component Analysis, PCA)的核心思想是通过线性变换后将原始数据集当中的多个变量转换为少数几个不相关的主成分,从而减少数据的维度,并最大可能保留原始数据中的重要信息。

对一个数据集 x ij 来说,首先需要对原始数据进行标准化处理,以消除不同变量之间的量纲影响。标准化的公式为:

x i,j = x i,j x ¯ j s j

其中, x ij 是第i个样本的第j个特征, x ¯ j 是第j个特征的均值, s j 是第j个特征的标准差。

对标准化后的数据,计算协方差矩阵:

= 1 n1 i=1 n ( x i x ¯ ) ( x i x ¯ ) T

其中, x i 是第i个样本的特征向量, x ¯ 是所有样本的均值向量,n是样本数量。

接着对协方差矩阵进行特征值分解,得到特征值 λ k 和对应的特征向量 v k

v k = λ k v k

其中, k=1,2,,p p是特征总数。

最后根据特征值的大小,选择前d个最大的特征值及其对应的特征向量作为主成分,并将选择的d个向量 v 1 , v 2 ,, v d 组合成一个投影矩阵V

V=[ v 1 , v 2 ,, v d ]

将原始数据X投影到主成分空间,最后可得到降维后的数据Y

Y=XV

对于线性特征的主成分分析的降维过程如图1

在使用PCA进行数据降维的前提下,配置同一LSTM模型在不同数据集实现预测任务的优化效果如表1。(其中EI1是测试集PCA降维前后根据MAE计算的模型优化效率,EI2是测试集PCA降维前后根据RMSE计算的模型优化效率。)

Figure 1. Schematic illustration of dimensionality reduction process in linear principal component analysis

1. 线型主成分分析降维过程展示图

Table 1. LSTM prediction performance based on linear PCA dimensionality reduction

1. 基于线型PCA降维的LSTM预测效果

Model

LSTM (train)

LSTM (test)

LSTM_PCA (train)

LSTM_PCA (test)

EI1

EI2

Metric

MAE

RMSE

MAE

RMSE

RMSE

RMSE

MAE

RMSE

ETT

7.8818

10.6355

6.0992

7.0237

7.2431

9.9396

2.9939

3.8211

50.91%

45.60%

Exchange

0.0895

0.1075

0.0457

0.0553

0.0996

0.1207

0.0405

0.0484

11.55%

12.51%

illness

84,856

100,193

89,872

113,675

83,504

103,851

113,031

138732

−25.77%

−22.04%

traffic

0.0281

0.0339

0.0335

0.0406

0.0413

0.0464

0.0211

0.0316

37.09%

22.13%

weather

0.2046

0.26185

0.1825

0.2443

0.1923

0.2399

0.1795

0.2281

1.60%

6.68%

在面对非线性数据时不再沿用传统PCA,一般是使用核PCA (Kernel Principal Component Analysis, KPCA)。它的核心思想是通过核技巧将数据映射到高维空间,从而在高维空间中找到数据的线性结构,从而捕获原始数据的非线性结构,如图2

Figure 2. Schematic diagram of the dimensionality reduction process using kernel principal component analysis (KPCA)

2. 核主成分分析降维过程展示图

核PCA的核心是核函数 K( x,y ) ,常见的核函数包括高斯核:

K( x,y )=exp( x y 2 2 σ 2 )

多项式核:

K( x,y )= ( x T y+c ) d

Sigmoid核:

K( x,y )=tanh( α x T y+β )

对于一个给定的数据集 [ x 1 , x 2 ,, x n ] ,计算核矩阵K

K i,j =K( x i , y j )

为了消除数据的均值的影响,需要对核矩阵进行中心化处理。中心化后的核矩阵 K 可以通过以下公式计算:

K =K 1 n 1K 1 n K1+ 1 n 2 1K1

其中,1是全为1的矩阵。

对中心化后的核矩阵 K 进行特征值分解,得到特征值 λ i 和特征向量 α i

K α i = λ i α i

根据特征值大小选择前d个最大的特征值及其对应的特征向量,作为主成分。然后将原始数据投影到选定的主成分上,得到降维后的数据。对于新的数据点x,其在主成分上的投影可以通过下式计算:

ϕ ( x ) T v i = 1 λ i α i T K( x )

其中 K( x ) 是数据点x与数据集中所有点的核函数值组成的向量。

在使用KPCA进行数据降维的前提下,配置同一LSTM模型在不同数据集实现预测任务的优化效果如表2。(其中EI1是测试集PCA降维前后根据MAE计算的模型优化效率,EI2是测试集PCA降维前后根据RMSE计算的模型优化效率。)

Table 2. LSTM prediction performance based on KPCA dimensionality reduction

2. 基于KPCA降维的LSTM预测效果

Model

LSTM (train)

LSTM (test)

LSTM_PCA (train)

LSTM_PCA (test)

EI1

EI2

Metric

MAE

RMSE

MAE

RMSE

RMSE

RMSE

MAE

RMSE

ETT

7.8818

10.6355

6.0992

7.0237

6.00327

7.8269

1.5847

2.4387

74.02%

65.28%

Exchange

0.0895

0.1075

0.0457

0.0553

0.0952

0.1159

0.0282

0.0344

38.29%

37.83%

illness

84,856

100,193

89,872

113,675

72,649

80,242

81,933

95,442

8.83%

16.04%

traffic

0.0281

0.0339

0.0335

0.0406

0.0203

0.0248

0.0251

0.0309

25.17%

23.83%

weather

0.2046

0.2618

0.1825

0.2443

0.0465

0.0854

0.0545

0.0636

70.11%

73.96%

根据前面的实验的数据,观察到使用KPCA后进行预测的EI1、EI2在数据集ETT、Exchange、illness、weather上数值明显高于直接使用PCA进行预测的,这意味着对数据直接使用线型PCA降维后的数据对比使用KPCA降维后的数据显然丢失了更多信息,这是因为本次实验当中用的数据大部分特征在现实生活中基本为非线性数据,而交通数据traffic的大部分特征因涉及到交通量和道路容量等高度线性相关的量,因此更适合使用线型PCA,实验数据也确实表现如此,在traffic数据集上的KPCA明显丢失的信息要比线型PCA的多,因此前者的优化效率要比后者略低。

2.3. 小结

本章节介绍了函数型数据分析当中的函数化离散数据以及主成分分析法,其中将离散时序数据函数化是为了对数据进行平滑降噪以提升数据质量,主成分分析则是对高维的时序数据进行降维处理以最低维度来最大程度保留数据所包含的信息。

接下来以预测FWI时序数据为案例,使用所介绍的函数型数据分析的方法对数据进行处理并实现预测评估任务。

3. 应用——基于大兴安岭地区部分林区的林火预测

森林火灾对生态系统和人类社会构成了严重威胁,准确的林火预测是有效预防和管理森林火灾的关键。火险天气指数(FWI)系统是一种广泛应用于全球的森林火险评估工具,其通过气象数据计算火险等级,为火灾管理提供科学依据。FWI系统最初在加拿大开发,基于气象条件和可燃物含水率的变化,计算出细小可燃物湿度码(FFMC)、腐殖质湿度码(DMC)、干旱码(DC)、初始蔓延指数(ISI)、累积指数(BUI)和火险天气指数(FWI)六个组分。这些指标不仅反映了火灾发生的可能性,还指示了火灾的潜在强度和蔓延速度。

在中国,FWI系统已被引入并应用于多个地区,如大兴安岭、云南和福建等。研究表明,FWI系统在中国的适用性较高,尤其是在与加拿大森林系统相似的地区。例如,在大兴安岭地区,FWI系统能够有效反映森林火险状况,4月至6月期间的FWI、FFMC和ISI平均值较高,表明这段时间内火灾风险较高。此外,研究还发现,气候变化导致大兴安岭地区的火险期显著延长,春季和秋季的火险严重度指数(SSR)波动幅度较大。

本研究旨在通过气象站数据预测FWI指数,进而评估火灾风险。这种方法不仅提高了火灾预测的准确性,还为森林管理部门提供了及时的预警信息,有助于提前采取预防措施,减少火灾的发生和蔓延。通过综合运用气象数据和FWI系统,可以为森林火灾的风险评估提供科学依据,从而有效支持森林火灾的预防和管理工作[7] [8]

本次实验使用的数据集分别来自漠河气象站(52.9744˚, 122.5108˚),北极村站(53.4692˚,122.3783˚),塔河站(52.3481˚, 124.7183˚),呼中站(52.0361˚, 123.5722˚)。以上四个站点均属于大兴安岭林区的气象站,如图3

Figure 3. Geographical locations of the four meteorological stations

3. 四个气象站的地理位置

3.1. 数据预处理与特征工程

本次实验当中用到的数据的所有特征包括降水量(Precipitation, pre)、温度(Temperature, tem)、风速(Wind Speed, wind)、湿度(Humidity, hum)、细小可燃物湿度码(Fine Fuel Moisture Code, FFMC)、半腐层湿度码(Duff Moisture Code, DMC)、干旱码(Drought Code, DC)、初始蔓延指数(Initial Spread Index, ISI)、燃烧强度指数(Buildup Index, BUI)以及火险天气指数(Fire Weather Index, FWI)。

对数据中的每个特征使用小波基将离散数据函数化后,利用阈值处理对小波变换后的细节系数进行处理并进行信号重构得到降噪后的时序数据。由于所有特征均为非线性时序数据,除预测目标FWI外,其余特征使用KPCA进行降维,最终保留三个主成分和目标特征,数据形状如表3

Table 3. Denoised and dimensionality-reduced data

3. 降噪、降维处理后的数据

Date

PC1

PC2

PC3

FWI

20070101

−0.00209

−0.00106

−0.00344

2.146

20070102

−0.0022

−0.00112

−0.00366

1.697

20201231

−0.00222

−0.00114

−0.00372

0.176

3.2. 数据预测与评估

搭建LSTM模型对降噪平滑、降维后的数据集当中的FWI特征进行预测,预测与预警结果如图4

Figure 4. Prediction results of FWI data and warning line identification for the four meteorological stations

4. 四个气象站的FWI数据预测结果及预警线标识

根据研究表示[7],FWI值在10.1以上属于高火险值,当大于等于31.1时火灾危险极高。观察到2018年10月底到2020年年底为止,各个站点的FWI预测值均显示高火险时间段集中在每年的4~6月份,这与已知的部分研究相符,其中北极村站、塔河站、呼中站夏季尤其危险,个别FWI指数甚至已经达到了极高火险的程度,火灾一旦发生蔓延速度非常迅速,扑灭难度非常大,而林火的大部分非人为原因是雷击,占总火灾的57.1%属于不可抗力因素[8]。根据预测数据,相关部门需对照做出相应的实际动态预防措施,包括但不限于消防监管资源调配、公众预警、森林管理以及应急演练等各方面协同响应模块。

在使用KPCA对数据进行降维处理后,模型的拟合结果除个别日期外相差稍大,其余时间段拟合效果比较好,具有实际参考意义,可以作为根据FWI数据预测林火的方法之一。这些结果为评估气候变化对林火风险的影响提供了科学依据,有助于制定有效的林火管理策略。

NOTES

*通讯作者。

参考文献

[1] Yu, R., Gao, J., Yu, M., Lu, W., Xu, T., Zhao, M., et al. (2019) LSTM-EFG for Wind Power Forecasting Based on Sequential Correlation Features. Future Generation Computer Systems, 93, 33-42.
https://doi.org/10.1016/j.future.2018.09.054
[2] Gao, J. and Chen, Y. (2024) Revisiting PCA for Time Series Reduction in Temporal Dimension. arXiv preprint arXiv:2412.19423
[3] Suri, S. and Bailis, P. (2017) DROP: Dimensionality Reduction Optimization for Time Series. arXiv preprint arXiv:1708.00183
[4] 石敏莲, 刘志钢, 胡华, 汪景. 基于PCA-LSTM模型的城市轨道交通短时客流预测[J]. 智能计算机与应用, 2020(3): 155-159.
[5] Feng, Y. and Wang, X.H. (2006) Wavelet Transform Denoising and Its Matlab Implementation. Data Acquisition and Processing, 21, 37-39.
[6] Sun, W.L. and Wang, C. (2019) Denoising of Electric Power Signals Based on Improved Soft Threshold Wavelet Packet Network. Journal of Naval Engineering University, 4, 79-82.
[7] Tian, X.R., McRae, D.J., Jin, J.Z., et al. (2010) Changes of Forest Fire Danger and the Evaluation of the FWI System Application in the Daxing’anling Region. Scientia Silvae Sinicae, 46, 127-132.
[8] Jin, J.Z., Stocks, B.J. and Alexander, M.E. (1985) The Application of the Canadian Forest Fire Weather Index System in China. Canadian Journal of Forest Research, 15, 563-570.