基于差分自回归移动平均法预测苏格兰鲱鱼的迁移
Prediction of Scottish Herring Migration Based on Autoregressive Integrated Moving Average Method
DOI: 10.12677/MOS.2021.102048, PDF, HTML, XML, 下载: 398  浏览: 1,218  科研立项经费支持
作者: 王 睿, 张广运:北京建筑大学环境与能源工程学院,北京;梁一迪:北京建筑大学电气与信息工程学院,北京;白 羽:北京建筑大学理学院,北京;北京建筑大学建筑结构与环境修复功能材料北京市重点实验室,北京;北京建筑大学大数据建模理论与技术研究所,北京
关键词: 鲱鱼时间序列差分自回归移动平均法海洋表面温度Herring Time Series Autoregressive Integrated Moving Average Method Sea Surface Temperature
摘要: 作为苏格兰渔业经济支柱的鲱鱼,正在随着全球变暖而向北迁移。为研究鲱鱼种群分布位置的变化,把北大西洋苏格兰海域划分成28个区域,将过去167年间捕鱼季的海洋表面温度视为时间序列,建立了基于差分自回归移动平均法的海洋表面温度预测模型,得到了未来50年海表温度变化情况。结合鲱鱼的适宜生存条件,分析了鲱鱼的迁移路径及未来最有可能聚集的地点。研究结果为苏格兰地区的渔业经济管理与规划提供了参考和指导。
Abstract: Herring, the mainstay of Scottish fishing economy, is moving north in response to global warming. The Scottish North Atlantic is divided into 28 regions to study the change of herring population distribution. The sea surface temperature (SST) of the fishing season in the past 167 years is taken as a time series and the prediction model of SST based on the Autoregressive Integrated Moving Average (ARIMA) method is established to get the SST changes in the next 50 years. The migration routes and the most likely aggregation sites of herring in the future are analyzed based on the op-timal survival temperature of herring. The results provide reference and guidance for fishery economic management and planning in Scotland.
文章引用:王睿, 梁一迪, 张广运, 白羽. 基于差分自回归移动平均法预测苏格兰鲱鱼的迁移[J]. 建模与仿真, 2021, 10(2): 471-480. https://doi.org/10.12677/MOS.2021.102048

1. 引言

鲱鱼是苏格兰渔业的主要捕获品种之一 [1]。然而,随着全球海洋温度的升高,未来鲱鱼可能会向北迁移到温度更适宜自身繁衍生息的地方。研究海洋温度变化情况和鲱鱼的迁移路径,对渔业经济管理而言意义重大。

时间序列是指对某种统计指标依次按照时间顺序进行排列而形成的数值序列 [2]。与其他的评估模型相比,通过分析时间序列构造的模型,不仅更简单,而且拟合效果也更好 [3]。差分自回归移动平均法(ARIMA)是George Box和Gwily M Jenkins所创建的Box-Jenkins (B-J)方法 [4] 的进一步发展和改进 [5]。该方法将预测对象随时间推移而形成的数据序列视为一个随机序列,通过数学模型近似描述这个序列,模型一旦被识别,就可以从时间序列的过去值及现在值预测出未来值 [6]。由于ARIMA结合了一组复杂的参数,如自回归(AR)、积分(I)和移动平均(MA) [7],它对未来趋势的预测较为精确。

此前已有一些预测海洋温度和鱼群迁移的研究,李昊达等 [8] 通过反演得到了过去21年的海洋表面温度(SST)间断数据,并以此为基础建模预测未来50年的SST,此方法误差较大;范昊林等 [9] 建立了逐步灰色GM (1, 1)模型,处理后的温度数据中存在异常值,对后续预测造成了一定的干扰,不能准确表示出鱼群迁移的实际情况。

在前人研究的基础上,本文提取了过去167年鲱鱼捕鱼季的平均海洋表面温度,将其视为时间序列,通过ARIMA建立了SST预测模型。结合苏格兰鲱鱼的适宜生存条件,推测了未来50年鲱鱼最有可能出现的位置。

2. 数据处理

鲱鱼是浅层鱼类,在一段相当长的时间内,鲱鱼在经纬度上的水平迁移范围,远大于深度上的纵向迁移范围,因而海洋表层的水温变化是影响鲱鱼游动的主要因素。海洋表层温度数据来源于美国国家海洋和大气局在其网站上提供的NOAA ERSST V5 data [10] 数据集。该数据集给出了海表温度和经纬度、时间(月)的关系。

目前鲱鱼主要分布在欧洲西北部的大不列颠岛周围和挪威海海岸附近。根据鲱鱼的分布情况,把苏格兰附近的海洋按经度线和纬度线划分为网格状,一共得到了28个区域,如图1所示,每个区域选择一个观测点,观测点位置见表1,并用这一观测点的SST代表此区域的温度。

Figure 1. Distribution of observation points

图1. 观测点分布图

Table 1. Position of observation points

表1. 观测点的位置

另一方面,虽然鲱鱼在整个生命阶段中进行着南北洄游,其资源量会发生季节性变化,但鲱鱼在捕鱼季的迁移情况与渔业经济有着更直接且紧密的联系。考虑到苏格兰鲱鱼的捕鱼季主要集中在每年的6月至9月,因此提取了28个观测点在1854~2020年间每一年6~9月的平均温度数据,并将每个观测点这167年间的SST视为一个时间序列。目标海域内标记捕鱼点的第i个SST序列数据编号为 { u l t } ( l = 1 , 2 , , 28 ; t = 1 , 2 , , 167 ) 图2绘制出了各区域过去167年间的SST变化曲线,可以看出海洋表面温度的整体变化趋势呈现弱平稳性。

Figure 2. Sea surface temperature in past 167 years

图2. 过去167年的海洋表面温度

为了便于分析,做出以下假设。

1) 假设北大西洋的水质将保持在一个相对稳定的区间内,28个不同区域的海水盐度差异不大。

2) 假设未来50年不会爆发大规模致死鱼类的传染病,也不存在外来物种的入侵或天敌的影响。因为以上任何一种情况都可能导致鲱鱼的灭绝。

3) 假设鲱鱼在迁移过程中,种群整体数量相对稳定,不存在其他新的物种与鲱鱼构成捕食关系致使鲱鱼数量激增或锐减。

3. 海洋表面温度预测模型

一般地,差分自回归移动平均法记作ARIMA(p, d, q),其中p为自回归项数,d为时间序列成为平稳序列时所做的差分阶数,q为移动平均项数 [11]。ARIMA (p, d, q)的数学表达式为

( 1 i = 1 p ϕ i L i ) ( 1 L ) d y t = c + ( 1 + i = 1 q θ i L i ) ε t (1)

式中, y t 是t时刻观测值; L i y t = y t i 是滞后的时间序列,c是常数项, ϕ i ( i = 1 , 2 , , p ) 是自回归系数, θ i ( i = 1 , 2 , , q ) 是移动平均系数, ϕ p θ q 0 ε t 是随机误差,满足 E ( ε t ) = 0 V a r ( ε t ) = σ ε 2 E ( ε s ε t ) = 0 , s < t 。为了使用该方法建立海洋表面温度预测的数学模型,必须先确定p, d, q的值。

3.1. 平稳性检验

为了确定d的值,还需要采用平滑法进一步验证SST时间序列的平稳性,即对弱平稳时间序列进行差分。由于每进行一次差分运算,都会损失掉一部分的有效信息,所以对差分的阶数有所控制,一般情况下不会超过二阶差分。

分别取 l = 1 , 2 , , 28 ,对原始序列 { u l t } ( t = 1 , 2 , , 167 ) 进行了一阶差分和二阶差分,发现时间序列均呈现出了二阶差分波动幅度大,一阶差分更为平稳的现象。比如,任意取四个观测点3、15、17和28,它们的时间序列的一阶差分和二阶差分如图3所示。所以ARIMA选定一阶差分,即d =1。

Figure 3. Time series of first-order difference and Time series of second-order difference

图3. 一阶差分和二阶差分时间序列

3.2. 模型定阶

海洋表面温度预测模型中q通过观察自相关系数(ACF)确定,p通过观察偏自相关系数(PACF)确定。利用差分后的数据生成ACF和PACF图像,其中,在四个观测点8、18、19和22的图像如图4图5所示。不难发现,ACF和PACF分别在最初的一阶和五阶内明显大于2倍标准差范围,而后全部处于2倍标准差范围内。观察所有的观测点,结果显示95%的观测点的ACF和PACF具有相同现象,从而确定q = 1,p = 5,即海洋表面温度预测模型为ARIMA (5, 1, 1),任取 l = 1 , 2 , , 28 ,表达式为

( 1 ϕ l 1 L ϕ l 2 L 2 ϕ l 3 L 3 ϕ l 4 L 4 ϕ l 5 L 5 ) ( 1 L ) u l t = c l + ( 1 + θ l 1 L ) ε l t (2)

满足 E ( ε l t ) = 0 V a r ( ε l t ) = σ l ε 2 E ( ε l s ε l t ) = 0 , s < t

Figure 4. Sample autocorrelation function

图4. 自相关系数

Figure 5. Sample partial autocorrelation function

图5. 偏自相关系数

比如,在观测点7处,模型参数取值如表2所示,其中自回归系数 ϕ 7 i ( i = 1 , 2 , , 5 ) 和移动平均系数θ71对应的P值都比较小,说明了采用ARIMA (5, 1, 1)模型是可行的。

Table 2. Model parameters of the 7th observation point

表2. 观测点7处的模型参数

3.3. 白噪声检验

上面建立的海洋表面温度预测模型为ARIMA (5, 1, 1)。为判断模型建立的是否准确,对残差序列进行白噪声检验。如果残差序列通过了白噪声检验,就说明时间序列中有用的信息均提取完毕,可以使用模型进行预测,否则需要进一步提取信息。取横坐标为正态分布的分位数,纵坐标为残差的分位数,对每一个观测点画出残差分位数图。任取四个观测点8、11、16和23,它们的残差分位图如图6所示。可见,残差序列基本满足正态分布,可以通过白噪声检验,由此表明海表温度预测模型ARIMA (5, 1, 1)构建良好,精度很高,在此基础上进行的分析较为可靠。

Figure 6. Residual quantile-quantile plot

图6. 残差分位数

4. 鲱鱼迁移预测

4.1. 海洋表面温度变化情况

利用ARIMA (5, 1, 1)模型对海洋表面温度进行预测,在未来50年内,28个观测点的温度大部分呈现出了升高的趋势,往往随着纬度的升高,温度逐渐降低。部分观测点的温度变化如图7所示,50年后28个观测点海洋表面温度热力图如图8所示。但是也有例外的点,比如在观测点7处,50年后的温度要比现在的温度低,推测这可能是受到了洋流的影响。

Figure 7. Sea surface temperature projections for the next 50 years

图7. 未来50年海洋表面温度预测

Figure 8. Heat map of sea surface temperature after 50 years

图8. 50年后海洋表面温度热力图

4.2. 鲱鱼迁移区域

根据全球鱼类信息系统的资料 [12],鲱鱼的最低生存温度为1℃,最高生存温度为18℃,虽然保持在这一生存范围内鲱鱼就可以存活下来,但是还是存在一个最佳的生存温度区间。考虑到自然界尤其是生物界中,大多数事物的发展与因果规律都符合正态分布,因而假定鲱鱼的最佳生存温度区间为9℃~11℃。

根据预测的海洋表面温度未来50年内的变化情况,28个观测点中温度变化在9℃~11℃范围内的为观测点1、10、11、12、15、18和19,所以苏格兰鲱鱼将从目前的栖息地逐步迁移到最佳生存区域。鲱鱼的迁移路径最有可能为,先向北移动到挪威海62˚N~66˚N、4˚E~4˚W区域,然后一部分鲱鱼向66˚N~70˚N、8˚E~12˚E迁移,另一部分鲱鱼向66˚N~70˚N、0˚~12˚W迁移,并最终迁移至靠近格陵兰岛的70˚N~74˚N、16˚W~20˚W区域,如图9所示。因此建议苏格兰的渔业公司将现有资产逐步转移到苏格兰港口的北岸,从迁移路径可见未来那里的鱼类资源会更加丰富。

Figure 9. The migration route of herring

图9. 鲱鱼迁移路径

5. 结论

1) 基于28个观测点在1854~2018年6~9月的平均海洋表面温度数据,采用时间序列分析法建立了ARIMA (5, 1, 1)模型。预测海洋表面温度未来50年内整体呈现上升趋势,且纬度越高,温度越低。但也有一些例外的观测点,推测这些观测点的温度变化不符合一般规律可能是由于受到了洋流的影响。

2) 在足够长的时间内,鲱鱼会有向北迁移到挪威海的趋势。根据鲱鱼的适宜生存温度区间和海洋温度变化情况,预测了未来50年鲱鱼最有可能向66˚N~70˚N、8˚E~12˚E或66˚N~70˚N、0˚~12˚W迁移,还有一部分鲱鱼会迁移至靠近格陵兰岛的70˚N~74˚N、16˚W~20˚W区域。

3) 海洋表面温度预测模型的建立,是以过去167年的温度数据为基础的,庞大的数据量能够支撑起模型的精确度和可靠性。模型的优势在于使用了差分自回归移动平均法,从而有效消除SST预测中出现的随机波动。此模型具有一定的普世价值,将其应用到鱼群迁移和渔业经济预测中,有助于渔民更好的掌握鱼群分布情况以及未来的业务前景。

基金项目

北京市属高校基本科研业务费专项资金项目(X20142),北京建筑大学教育科学研究项目(Y2015),北京建筑大学研究生教学质量提升项目(J2020004)。

NOTES

*通讯作者。

参考文献

[1] 2020 COMAP’s Mathematical Contest in Modeling. https://www.comap.com/undergraduate/contests/mcm/contests/2020/problems/
[2] 刘清华. 时间序列模型在水文预报中的应用[J]. 湖南水利水电, 2007(3): 42+67.
[3] 孙秋霞, 王镇岭, 高齐圣. 我国人口时间序列拟合模型的比较与选择[J]. 数学的实践与认识, 2010, 40(2): 20-25.
[4] Box, G.P.E. and Jenkis, G.M. (1978) Times Series Analysis: Forecasting and Control. San Francisco Press, San Francisco.
[5] Brus, D.J. and de Gruijter, J.J. (1997) Random Sampling or Geostatistical Modelling? Choosing between Design-Based and Model-Based Sampling Strategies for Soil (with Discussion). Geoderma, 80, 1-44.
https://doi.org/10.1016/S0016-7061(97)00072-4
[6] 石美娟. ARIMA模型在上海市全社会固定资产投资预测中的应用[J]. 数理统计与管理, 2005(1): 69-74.
[7] Mbah, T.J., Ye, H.W., Zhang, J.H. and Long, M. (2021) Us-ing LSTM and ARIMA to Simulate and Predict Limestone Price Variations. Mining, Metallurgy & Exploration, 38, 913-926.
https://doi.org/10.1007/s42461-020-00362-y
[8] 李昊达, 王雪飞, 任咏琪. 基于SST反演的鱼类迁徙预测[J]. 江西水产科技, 2020(4): 3-5.
[9] 范昊林, 苏柏豪, 杨文玉, 等. 基于灰色马尔可夫预测模型的鱼类活动位置研究[J]. 数码世界, 2020(4): 117.
[10] NOAA Extended Reconstructed Sea Surface Temperature (SST) V5. https://www.esrl.noaa.gov/psd/data/gridded/data.noaa.ersst.v5.html
[11] 李标, 李雪梅, 古丽斯. ARIMA模型在手足口病预测预警中的应用[J]. 中国卫生产业, 2014, 11(23): 26-27.
[12] Whitehead, P.J.P. (1985) FAO Species Cat-alogue. Vol. 7. Clupeoid Fishes of the World (Suborder Clupeioidei). An Annotated and Illustrated Catalogue of the Herrings, Sardines, Pilchards, Sprats, Shads, Anchovies and Wolf-Herrings. Part 1—Chirocentridae, Clupeidae and Pristigasteridae. United Nations Development Programme, Rome, 470-471.