基于LSTM-RNN的苏格兰鱼群迁移问题研究
The Fish Migration Problem in the Scotland Based on LSTM-RNN
摘要: 本文旨在通过建立北大西洋研究海域海洋温度时间序列模型预测苏格兰鲱鱼和鲭鱼鱼群未来50年的迁移轨迹,给予周边渔业公司经营战略。首先,本文通过对影响鲱鱼和鲭鱼鱼群迁移的相关因素进行机理分析,选取适宜温度最佳阈值,接着结合研究海域的相关情况选取合适的样本点建立基于LSTM-RNN的海洋温度时间序列模型,从而给出了未来50年鱼群最可能出没的位置。同时根据预测得到的海水温度变化情况,给出鱼群位置变化的极端情况,进而为周边渔业公司提出经营策略。最后,综合考虑军事政治因素,验证了我们模型具有较强的适用性和合理性。
Abstract: In this paper, the migration of herring and mackerel in Scotland in the next 50 years is studied based on LSTM-RNN theory. By analysis of the corresponding factors, one model named time series model based on LSTM-RNN is given under some proper assumptions; based this model, the management strategy for the surrounding fishery companies is given according to the extreme situation of fish position. Ultimately, considering the military and political factors, our model is relatively applicability and feasible.
文章引用:于晗丹, 周璐鑫, 施雨晴. 基于LSTM-RNN的苏格兰鱼群迁移问题研究[J]. 应用数学进展, 2020, 9(6): 935-946. https://doi.org/10.12677/AAM.2020.96111

1. 引言

如果全球气温上升,苏格兰北大西洋渔业管理协会希望了解苏格兰鲱鱼和鲭鱼鱼群从其目前在苏格兰附近的栖息地迁徙的有关问题。由于小型捕捞公司没有船上制冷设备,将捕捞到的鲜鱼送至苏格兰渔港市场。鱼群位置的变化会在其经济上造成不确定的风险。

结合实际情况,要求建立数学模型来解答以下问题:

1) 假设水温将发生足够的变化使鱼群位置变化,识别未来50年内两种鱼类最可能的位置。

2) 根据海水温度的变化速度,以小型渔业公司无法捕捞到鱼为界,预测鱼群位置变化的极端情况和最可能所需要的时间。

3) 根据预测结果,判断小型渔业公司是否需要改变其经营方式。为其提供经营策略或提供不改变的理由。

4) 当一部分渔业迁移到另一个国家的领海范围内时,所提供经营的策略会受到的影响。

2. 模型假设

1) 假设北大西洋内这两种鱼的总量保持不变。

2) 假设只要鱼群还在公司的最远捕捞范围内渔船就一定能捕捞到,且捕捞过程时间不考虑。

3) 假设研究海域同一纬度的温度相同,且鱼群迁徙仅在经线方向上移动。

4) 假设鱼群对温度变化十分敏感。

3. 符号说明

4. 模型的建立与求解

4.1. 鱼类未来50年迁徙轨迹预测

全球变暖背景下,北大西洋海温变化大大影响了鲱鱼和鲭鱼的繁衍生息,导致鱼群迁移到其他更适合它们生存和繁殖的栖息地。由于海水温度的变化是引起鱼群迁徙的主要因素,为确定这两种鱼类在未来50年内最有可能出现的位置,我们可以通过研究苏格兰附近海域海水温度在未来50年内变化情况,根据两类鱼生存的适宜温度范围,来确定这两类鱼生存区域中心变化轨迹。

4.1.1. 数据处理

1) 研究海域范围确定

经过搜索资料得到苏格兰附近海域为如图1交叉阴影部分,经纬度范围大致为西经10.57˚~东经2.92˚,北纬54.45˚~60.56˚。由于苏格兰港口众多且大致在该片海域较南部的沿海地区,为了更好地研究该海域鱼群的迁徙我们取北纬55˚为公司的坐落位置。

Figure 1. The map of study sea area

图1. 研究海域示意图

2) 两类鱼适合的生存温度范围的确定

通过搜索资料得到鲱鱼的活动水深为25~200 m,鲭鱼的活动水深为50~200 m。由于海水温度在水深200 m处与海水表面温度相差不大,故得到这两种鱼合适的生存温度大致可由海水表面温度代替。并且通过两种鱼的活动海域和活动水深可以发现,这两种鱼的生活习性大致相同。故我们可以将这两种鱼的鱼群视为同一鱼群来进行研究。

假设渔业公司还未改变位置,捕捞海域没有发生变化,并且在北大西洋该鱼群种群数量恒定的情况下,年捕捞量主要与鱼群在捕捞海域范围内鱼群数量有关,又因为某地的鱼群数量大小主要与该地海水温度有关,所以由图2所示,我们可以根据1999~2017年该捕捞海域该鱼类捕鱼量情况 [1] 看出2004年北大西洋的鱼群捕捞量最大。这说明2004年该海域海水温度最适宜该鱼群的生存繁衍。

Figure 2. Histogram of mackerel production in the study area from 1999 to 2017

图2. 1999年~2017年研究海域鲭鱼生产量变化柱状图

由于鱼群在一年中会出现季节性洄游现象,其适宜温度变动范围大,因此若从整一年的鱼群适宜温度来确定鱼群适宜温度存在波动性较大准确性差等缺点,研究难以进行。根据相关资料显示 [2],北半球海洋鱼群在10~12月份基本进入越冬区。

又根据来自BOA_Argo的2004~2018月平均海表水温 [3] 以及2004~2018年平均海表水温 [3],得到如图3。从中可以看出该海域11月份海水表面温度与其年均温最接近,且11月份为越冬期鱼群较为稳定的月份,因此本文将选取2004年11月份海水表面温度近似作为该鱼群的适宜温度最低温度L (4.6398℃)。之后在研究鱼群迁徙情况时也依据每年该鱼群越冬区所在位置范围变化即最适宜温度范围所在位置的变动来判断。

Figure 3. Monthly average temperature of sea water surface in 2014 to 2018

图3. 2014~2018年海水表面月平均温度

3) 样本点的确立

从全球海洋温度特征图(如图4所示)中可以得到该海域温度分布在纬度上呈现明显差异,在经度上没有明显差别。为简化模型,我们将海水表面温度变化假设为仅在南北方向上变动。考虑到我们所要研究海域海岸线较为曲折,因此选择研究西经10˚方位上海水温度随纬度变化的变化趋势,并通过ERDDAP [4] 中的griddap datasets检索得到该经度方向上北纬54.025˚~60.025˚之间每隔0.05˚点处的2011~2018年各月海表温度值,将其作为模型的样本数据。

Figure 4. Distribution of global ocean surface temperature

图4. 全球海洋温度特征图

4.1.2. 基于LSTM神经网络海洋温度时间序列模型建立与求解

由于海表温度随时间变化的预测是一个时间序列预测问题,我们可以采用先前观测值来预测未来的温度。又因为下一时刻的值往往是基于当前的状态和先前的观测值,先前序列的长度越长,预测的效果也越好。所以,LSTM深层神经网络适合时间跨度长,累计信息多的预测情况。并且LSTM神经网络不论在短时间还是长时间都可以处理时间序列之间的相关性,适合本文研究的海表温度随时间变化预测。此外,出于对海表面温度观测信息会越来越多的考虑,来用LSTM神经网络来进行预测也有利于后续研究的改善和提高 [5]。

1) 模型建立

LSTM作为循环神经网络的变形,关键就是细胞状态,细胞状态在整个链上运行,即我们的信息在上面流传。大致的模型示意图如图5所示。

Figure 5. Schematic diagram of LSTM

图5. LSTM示意图

LSTM通过精心设计“门”来去除或者增加信息到链上的能力。“门”是一种让信息筛选通过的方式。LSTM包含三种“门”:

a) 忘记门:

有条件地决定丢弃什么信息。该门会读取上一层的输出值 h t 1 和新的输入值 x t ,其中 σ 为sigmoid函数。输出一个在0到1之间的概率值,作为需要保留的上一层的细胞状态 C t 1 的概率, b f 是偏置项。得到遗忘门值为

f t = σ ( W f [ h t 1 , x t ] + b f ) .

b) 输入门:

有条件地决定从输入中输入什么新信息到细胞状态中。首先由sigmoid函数决定更新值的概率,再由tanh函数创建新的输入值,得到的结果 C t ,会被加入到细胞状态中。得到输入门值和细胞状态分别为

i t = σ ( W t [ h t 1 , x t ] + b f ) ,

C t = tanh ( W c [ h t 1 , x t ] + b c ) .

c) 输出门:

根据先前的细胞状态和当前的输入结果有条件地决定输出。把旧状态 C t 1 与忘记门的概率结果 f t 相乘,加上输入门计算的结果 i t × C t ,得到新的细胞状态 C t

C t = f t × C t 1 + i t × C t .

然后通过将旧的输出值 h t 1 和新的输入值 x t 输入到输出门中,获得输出门的输出概率值 o t

o t = σ ( W o [ h t 1 , x t ] + b o ) .

最后乘上激活函数得到新细胞状态 C t ,得到最终的输出结果 h t

h t = o t × tanh ( C t ) .

2) 模型求解

本文采用反向传播算法,并运用迭代的方式进行逐点预测。算法步骤如下:

a) 根据前向传播,计算得到细胞输出值;

b) 运用反向传播得到细胞误差项;

c) 根据b)得到的误差项,计算每个权重的梯度;

d) 应用梯度优化算法更新权重值。

其中梯度优化算法本文采用Adam算法。由于Adam算法在当前时刻的梯度更新上利用了上一时刻的平方梯度的指数衰减均值和上一时刻的梯度的指数衰减均值,所以它能够又快又准的更新到最优解。

将处理得到的80%样本数据作为训练集对LSTM神经网络进行训练,并根据剩余20%的样本数据对训练得到的模型根据MSE进行检验检验,结果发现该模型的MSE为3.1912,表明模型准确度可信度较高。

下面以样本点1为例对模型进行检验,并预测得到部分检验结果如表1

Table 1. Prediction of SST (˚F) at (10˚W, 54.025˚N) from Jan. 2011 to Dec. 2011

表1. 2011年1月~2011年12月(10˚W,54.025˚N)处海表温度预测情况表(˚F)

根据上述算法流程训练得到的基于时间序列的海洋温度预测模型,我们对选取的144个样本点处未来50年各月海水表面温度进行预测。由于我们最终是根据每年11月份的温度来判断鱼群迁移轨迹,因此我们筛选预测得到未来50年每年的11月份的海水表面温度如表2所示。

Table 2. Prediction of SST (˚C) at sample points with interval of 0.5˚ from 2020 to 2070 (part)

表2. 2020年~2070年11月间隔为0.5度样本点海水温度预测部分情况表(˚C)

接着在每隔5年的样本点预测温度值之间寻找包含鱼群适宜温度值的区间范围,并将最接近的样本点作为当年鱼群最有可能的越冬区重心,即当年鱼群最有可能在的海域位置。最终模拟得到如图6所示未来50年中每5年鱼群最有可能所在位置。

Figure 6. The most likely position of fish in the next 50 years

图6. 未来50年内鱼群最有可能的位置

我们以5年为一间隔进行预测,从上鱼群迁移轨迹图可以看出鱼群在未来50年内总体向北迁移,但在近15年来移动范围不大,而预计在2040年鱼群将大幅度向北迁徙,即使在2040~2045年鱼群将呈现出向南迁徙的趋势。并预测在2045年后鱼群将持续向北快速迁徙。并在2065年左右将可能超出我们研究海域纬度范围进入另一片海域。

4.2. 公司位置预测

由于海水温度变化造成鱼群迁徙,会对依靠捕捞这两种鱼为主的小渔业公司造成了巨大的损失。为了公司能够长久经营下去,需要我们通过预测给出最佳、最差以及最有可能情况以供公司经营管理参考。在本节中通过上一节中预测得到的各样本点处在未来50年海水的温度情况,来计算各点的海水温度变化速度。再通过分析各年平均海水温度变化速度的最大值最小值以及最有可能的值,根据鱼群适宜温度并结合小渔业公司最有捕捞距离,可得到如果小型渔业公司继续在其当前位置外作业直至无法捕捞到鱼群的最佳、最糟糕情况以及最有可能经过的时间。

4.2.1. 数据处理

1) 渔船最远打捞距离的确立

通过查阅资料得到渔船满载航速为7.0~17.7 kn,约为12.97~32.79 km/h。本节中我们取22 km/h作为渔船航行速度来求得公司许可渔船到达的最远距离。我们规定公司要求出航渔船在工作时间内当天返航,假设不计渔船打捞时间,渔船单趟航行用时为2.5小时,那么公司允许渔船到达的最远捕捞距离为55 km。由于纬度1˚相当于111 km,故在经纬网中小渔业公司最北可以到达的55.5˚N。

2) 海水温度变化速度的计算

根据问题一中我们得到该海域内144个样本点未来50年的温度变化情况。可求得未来50年内每一年研究海域海水变化速度

v i = [ j = 1 144 P j ( i + 1 ) P j ( i ) ] / 144

其中 P j ( i ) 表示第i年第j个点的海水温度, v i 为第i年的海水温度变化速率。

具体计算结果如表3所示。

Table 3. Annual variation of sea water temperature in the past ten years

表3. 前十年海水温度年变化表

4.2.2. 各情况讨论求解

1) 最佳情况的确定

最终选择(i = 1:49)中最小的值最为最佳情况时研究海域总体海水温度上升速度为0.0107℃/年,此时若假设在未来50年内研究海域海水温度按的速率增长,绘制未来每5年各样本点处海水温度值曲线图如图7所示,从图中可以看出,若该海域温度按最小速率变化时,在未来10年左右鱼群最适宜温度4.6312℃线将超出小渔业公司能够捕捞范围上线,也就是若公司仍旧不搬移位置,则将会在未来10年后捕捞不到该鱼群的鱼,将会为公司带来一定损失。

2) 最糟糕情况的确定

选择vi (i = 1:49)中最大的值最为最差情况时研究海域总体海水温度上升速度Vm为0.107℃/年,此时若假设在未来50年内研究海域海水温度按Vm的速率增长,首先取步长为5年,绘制未来前10年各样本点处海水温度值曲线图如图8(a)所示,从图中可以看出,若该海域按最大速率变化时,在未来5年内就无法捕捞到鱼。为更精确找到最糟糕的情况下所经过的时间,对未来5年中每年的海水温度变化进行曲线绘制如图8(b),发现公司在1年后就将无法收获鱼群。

Figure 7. The best change of sea water temperature in the next 50 years

图7. 未来50年海水温度变化最佳情况

(a) in the first ten years (b) in the first two years

Figure 8. Worst case of SST change

图8. 海水温度变化最糟糕情况

3) 最有可能经过的时间确定

为确定未来50年内,若小渔业公司不搬移位置,由于受全球气候变暖而鱼群北移的影响导致公司无法捕捞到鱼最有可能经过的时间,可通过统计学分析得到未来50年内海水温度最有可能的年变化速率,接着根据鱼群适宜温度以及小渔业公司可捕捞距离最终判断得到最有可能经过的时间。

首先,通过对上述求得的50年内每年的海水温度变化速率绘制频数直方图,如图9所示,清晰得到在这50年内海水温度年变化基本落在0℃~0.025℃和0.05℃~0.075℃之间,即在未来50年海水温度将最有可能按这两个速度范围进行变化。

为了更加精确合理的确定最可能的变化速率,我们将对这两区域速率进行加权平均处理,可以通过计算得到这两区域的比重分别为64%与46%。最终得到最有可能的变化速率Vp为0.0413℃/年。

接下来,由于之前求得最佳情况是未来10年内公司都能正常运行,则为了简化计算,仅需计算研究海域的海水温度在未来10年内海水温度变化情况。首先以步长为5年绘制曲线图,如图10所示,发现

Figure 9. Frequency histogram of seawater temperature change rate

图9. 海水温度变化速率频数直方图

Figure 10. The most likely change of sea water temperature in the first ten years

图10. 前10年海水温度变化最可能情况

如按Vp速度进行变化,公司将在5年后无法捕捞到鱼群。

为精确得到最有可能的时间,对未来5年的海水温度变化情况做进一步分析。通过绘制未来5年内样本点处的温度值曲线图,如图11所示,并根据鱼群适宜温度以及小渔业公司最远可捕捞的范围,得到小渔业公司最有可能在未来4年左右将无法捕捞到鱼群。

Figure 11. The most likely change of sea water temperature in the first five years

图11. 前5年海水温度变化最可能情况

4.3. 公司经营策略改善

根据我们建立的预测模型得到了该公司在不变动坐落位置和不更新渔船渔具等技术设备的情况下,极有可能在未来4年以后就在其捕鱼范围内再也捕捉不到鲭鱼和鲱鱼,对公司造成极大的损失。四年的时间对一个公司的生存与发展显然是不够的,为改善公司未来的发展前景避免公司经济受到重创,小组提出改变公司的经营方式。主要从以下方式来改善公司的未来前景:

a) 将部分或全部公司捕捞资产从当前位置前移到两个鱼群都迁移的附近。

b) 使用一定比例的具有确保渔获物新鲜功能的渔船来捕获这两种鱼。

c) 投入一部分的资产进行该两种鱼的渔场养殖。

针对以上策略我们进行其实用性和经济效益的评估,由于策略一和策略二中该海域内鱼群的总量保持不变,所以可以一起考虑进行评估。

假设渔船捕捞始终在鱼群重心进行捕捞,那么捕得的这两种鱼产量相等,公司在这两种鱼上的收益保持不变,所以可以直接通过成本得比较来衡量策略的经济效益。

假设公司在海上的捕鱼成本不变所以在计算策略一和策略二的成本时不将此带入考虑。得到当公司不迁移仅更新渔船时捕捞这两种鱼成本为 C 1 ,公司迁移渔船不更新的成本为 C 2

C 1 = { v n c 1 , 1 n 4 v n c 2 + c 3 , n > 4

C 2 = n v c 4

其中 c 1 为未改进的渔船的行驶成本, c 2 为改进的渔船的行驶成本, c 3 为改进渔船的成本,n为该公司经营年份,v为这两种鱼群中心远离公司起始位置的速度, c 4 为该公司每公里的迁移成本。

随着年份的增加,比较策略一和策略二的成本,当 C 1 小于 C 2 时,在n年内公司都可以选择以改进渔船来维持对这两种鱼的捕捞。当 C 1 大于 C 2 时,在n年之后公司采取迁移部分资产的策略来维持对这两种鱼的捕捞。

策略一和策略二在一定时间范围内能达到较好的效果,但倘若,这两种鱼迁移入他国海域内或者公司迁移及渔船捕捞成本过大,那么策略一和策略二在实用性和经济上的优势将不复存在。所以,我们引入策略三,公司可以将一部分公司资产投入渔业养殖,既能扩大这两种鱼的产量增加收入又能将成本控制在可以接受的范围内。

4.4. 他国领海对策略的影响

由于在本文我们主要研究的是全球气候变暖对纬度方向上温度变化导致鱼群位置的变化,并且英国海岸线长且曲折,因此我们将距离其最北端外12海里内作为其领海研究对象,其纬度范围为61.025˚N~61.125˚N。则根据我们所建立的海水温度预测模型,预计在2065年左右这两种鱼群将会进入到另一国家的领海。

由于《联合国海洋法公约》规定渔船进入邻国海域进行捕捞需要通过严格的审批和遵守入渔国的相关规定,这会对苏格兰渔业造成一定的亏损 [6]。又因为在本国海域范围内的鱼群数量尤其是这两种鱼的数量将急剧减少,使得整个地区渔业总产值将会减少,同时由于物以稀为贵,市场鱼类价格将会上涨,让苏格兰在国际贸易中丧失这些鱼类的出口竞争优势,对苏格兰整体的经济造成巨大影响。

倘若当这些两种鱼进入他国境内,那么苏格兰部分小渔业公司难以通过公司地点搬迁和以及船只捕捞工具的改进等方法来继续捕捞这两种鱼群,公司鱼产量的减少可能导致公司缩减规模甚至倒闭,一大部分从事该行业的公司职员或者渔民失去工作或者转换行业,进而增大整个人才市场的就业竞争压力。

但是对于上一问中提出的策略三,当这些两种鱼进入他国境内,那么公司以及渔民进行养殖渔业的将会越来越多。促进国内养殖渔业的发展,改善渔民及公司的收入结构,缓解市场对这两种鱼的需求或找到这两种鱼的替代品,让全球变暖导致的渔产资源缺乏的危机找到新的转折点。

5. 模型优缺点

5.1. 优点

1) 通过鱼捕捞量最大年份的该海域海水温度和它的适宜活动水深能更科学地确定鱼的适宜温度。

2) 本文建立的时间序列模型是基于LSTM神经网络的,而LSTM不论时间长短都有可以处理时间序列之间的相关性,适合本文研究的海表温度随时间变化预测,并具有很强的推广性。

3) 本文采用Adam算法来进行梯度优化,具有高效性,提高模型求解速率。

4) 采用该海域样本点海水温度变化速度的密度分布,取得未来最有可能的海水温度变化速度,能更精准地预测公司的前景。

5) 对于让公司和渔民发展养殖渔业的策略,在鱼群迁徙到另一个国家海域或者出海捕捞成本较高的情况下仍有较好的实用性和经济效益。

5.2. 缺点

1) 在评估我们策略的实用性和经济效益时,收集得到经济数据较少,对策略评估造成一定难度。

2) 本文仅考虑了鱼类在纬度方向上的迁徙,在一定程度上存在误差。

参考文献

[1] http://www.fao.org/figis/servlet/TabSelector
[2] 牛明香, 李显森, 赵庚星. 黄海中南部越冬鳀鱼空间分布及其与水温年际变化的关系[J]. 应用生态学报, 2012, 23(2): 552-558.
[3] 李宏, 刘增宏, 许建平, 孙朝辉, 吴晓芬, 卢少磊. 全球海洋Argo网格数据集用户手册(BOAArgo) [R]. 26.
[4] http://erddap.emso.eu:8080/erddap/search/advanced.html?page=1&itemsPerPage=1000&protocol=griddap
[5] 蒋富俊. 基于长短期记忆神经网络的海冰范围预测[J]. 中国水运月刊, 2019, 19(3): 132-133.
[6] 李励年, 林龙山, 缪圣赐. 一场由气候变化引发的渔业资源争夺战——欧洲“鲭鱼战争”持续升温[J]. 渔业信息与战略, 2013, 000(1): 75-80.