1. 引言
近年来港口建设备受瞩目,多地港口建设不断取得各项成绩。部分地区的港口正在推行建设智慧绿色码头、升级航道设施、稳步推进重点基建项目。科技的进步使得港口的管理和运行更加合理、高效。我国近日还成立了港口码头标准化技术机构。这些事情说明了港口的高效运行受到了广泛重视,研究港口的船舶分布有一定程度上的实际意义。现代航运服务业在构建交通强国、海洋强国的进程中处于关键位置。研究恶劣天气船舶行为有助于相关部门对港口进行管理、保障港口的正常运行,从而促进现代航运服务业的发展。目前,机器学习在船舶行为识别方面已有许多应用研究,如陈家豪等[1]用主成分分析提取船舶运动特征,然后用支持向量机识别船舶异常行为。李高才等[2]人提出一种基于语义轨迹多维相似度的船舶轨迹聚类方法,并通过构建语义转换模型和核密度估计建模来检测船舶异常行为。此外,朱姣等[3]人提出了一种改进的DBSCAN算法,该方法采用增量式算法计算不同船舶的行为模式,借助统计方法挖掘不同模式的船舶行为特征,还给出了相应的研究案例。
关于船舶行为的研究,一般可分为行为识别、行为预测和行为影响三方面[4]。关于船舶行为预测方面,王冬海等[5]使用决策树、Bagging和随机森林的方法给出了预测船舶密度分布的大数据应用案例。此外,张睿等[6]提出了基于LSTM预训练-Transformer修正的船舶运动预报模型。杨红等[7]提出了CNN-BiLSTM神经网络模型。该研究先对AIS数据进行预处理,再构建模型并联合训练船舶行为识别与轨迹预测两个任务。此外,陈麒龙等[8]提出非等时距时序残差ARIMA模型的船舶行为预测方法。先进行AIS数据的分解和样条插值处理,利用模型对距离、真方位角、船位、航速和航向进行预测。实验结果表明,该模型预测精度较高,适应性良好。然而,如果要保证神经网络预测的精度,则需要进行充足的训练;如需对AIS数据进行挖掘,则要进行大量运算;使用海洋大数据技术时,则需部署传感器以获取相应数据[8],同时海洋大数据还面临着数据体量巨大、类型多样等问题[5]。
马尔可夫模型是一种典型的无记忆模型,下一状态仅与当前状态有关,与之前的状态无关。通过确定初始状态、分析状态转移概率,可以预测接下来的系统状态情况。目前马尔可夫模型已经被运用于天气预测、交通预测、股票价格预测等多个领域。当然,马尔可夫模型作为可用于预测的随机过程模型,也被用于预测船舶行为。张晓雷等[9]人通过对传统灰色模型进行改进,提出Markov-GM(1, 1)预测模型,通过借助该模型可实现对船舶交通流量的相对高效、准确预测。同时,相较于传统的预测模型具有更高的预测精度及稳定性。尹忠勋等[10]人提出一种可预测恶劣天气条件下船舶行为的马尔可夫模型。该模型将港区水域内船舶行为共划分为四种状态,并假设船舶能以一定概率转换至另一状态或保持当前状态,然后将经验风险最小化策略用于求解状态转移矩阵。借助所求得的矩阵可对恶劣天气下的船舶行为进行较准确的预测。该模型对港口管理具有一定参考价值。许智慧[11]提出了分别以误差绝对值之和最小化为目标、相对误差之和最小化为目标的优化模型,以求解马尔可夫状态转移概率矩阵,可应用于农业产值结构和企业销售额预测。
综上所述,目前船舶行为预测的方法中很多都需要一定量的数据,而且现有文献很多是研究船舶在未来一段时间内的行为、轨迹,少有文献研究港区内突发情况下的船舶行为、船舶分布问题。同时,尽管马尔可夫模型的应用已经比较广泛、成熟。然而,数据较少情况下马尔可夫模型预测船舶行为的研究还有待深入。为此,本文考虑利用许智慧[11]所提出的方法估算马尔可夫模型状态转移概率矩阵,在较少数据的情况下对恶劣天气状况的船舶行为进行预测。此外,本文还结合了许智慧[11]所提出的以误差绝对值之和最小为目标函数以此估算状态转移概率矩阵的优化模型,以及Bertsimas等[12]提出的解决目标函数含有绝对值情况的优化方法,得出了一个可估算状态转移概率矩阵的线性规划模型,利用该模型同样可估算马尔可夫模型状态转移概率矩阵,从而实现预测船舶行为。
2. 问题分析与数学模型
船舶行为包含了紧急突发状况下的船舶非常态航行行为、正常航行行为、船舶作业行为、船舶锚泊行为等[13]。通常情况下,可将港区水域中的船舶行为大致分为港外锚地锚泊、港内锚地锚泊、航道航行及靠泊,且船舶行为符合一定比例分布[10]。天气状况转恶劣时,港区水域船舶行为将以一定概率转换至不同状态或保持不变,则港区水域船舶行为的状态转移可用矩阵表示:
以上矩阵中的元素
表示由船舶行为状态
转换至状态
的概率。矩阵
的求解是预测天气恶劣时港区水域船舶行为的关键。
以下是关于数学模型的一些假设及符号说明。
假设港区船舶数量为
,其中处于航道航行状态的船舶数量为
,处于港外锚地锚泊状态的船舶数量为
,处于港内锚地锚泊状态的船舶数量为
,处于靠泊状态的船舶数量为
,则港区水域初始船舶行为分布为
设
为以
为初始状态,经
次转移后的港区水域船舶行为分布,由此可知经
次转移后有
 [10]。
3. 状态转移概率矩阵的求解
3.1. 相对误差之和最小为目标的求解方法
以下是许智慧[11]所提出的以相对误差之和最小化为优化目标的线性规划模型,即该文献中所提到的模型二,具体模型如下
其中,
表示向量
的第
个分量,它表示系统经
次转移后处于状态
的概率。而
,
,此处
,
为状态转移概率矩阵
的估计
中的元素。
3.2. 误差绝对值之和最小为目标的求解方法
此外,许智慧[11]还将误差绝对值之和最小设立为优化目标函数,以此建立求解状态转移矩阵的另一优化模型。具体模型展示如下
                          (1)
Bertsimas等[12]提出
可以表示为以下线性规划模型
                                   (2)
                    (3)
由以上过程可见,当目标函数是绝对值和的情形时,可将该模型转化为线性规划模型进行求解。受到以上两个模型的启发,本文发现可以根据以上线性规划模型(2)将优化模型(1)转化为以下的线性规划模型。
利用以上两个求解方法可估算马尔可夫状态转移概率矩阵,利用估算得到的状态转移概率矩阵即可对恶劣天气下船舶行为进行预测。
4. 数值实验
本节将通过计算机软件,在使用第二节中提到的两个预测模型的基础上,利用从相关文献获取的数据进行数值实验,从而实现对船舶行为进行预测,并计算预测误差以分析预测效果。
本实验所用数据为尹忠勋等[10]人文章中恶劣天气船舶行为分布数据表里的船舶行为分布数据,具体如表1所示。其中,第1次数据将用于计算状态转移概率矩阵
的估计值,第2~4次数据用于检验预测结果及分析误差。
Table 1. Data on the distribution of vessel behavior in adverse weather conditions
表1. 恶劣天气船舶行为分布数据
 
  
    | 次数 | 船舶行为 | 0 h | 2 h | 4 h | 6 h | 8 h | 10 h | 12 h | 
  
    | 1 | 航道航行 | 35 | 20 | 12 | 10 | 9 | 8 | 7 | 
  
    | 内锚地锚泊 | 28 | 42 | 50 | 51 | 51 | 52 | 52 | 
  
    | 外锚地锚泊 | 24 | 40 | 48 | 53 | 55 | 55 | 56 | 
  
    | 靠泊 | 98 | 82 | 74 | 70 | 69 | 69 | 69 | 
  
    | 2 | 航道航行 | 21 | 15 | 11 | 9 | 8 | 6 | 6 | 
  
    | 内锚地锚泊 | 28 | 40 | 45 | 48 | 49 | 50 | 51 | 
  
    | 外锚地锚泊 | 39 | 44 | 49 | 51 | 52 | 53 | 53 | 
  
    | 靠泊 | 88 | 77 | 71 | 68 | 67 | 67 | 66 | 
  
    | 3 | 航道航行 | 32 | 19 | 12 | 10 | 10 | 9 | 8 | 
  
    | 内锚地锚泊 | 40 | 50 | 54 | 55 | 55 | 55 | 56 | 
  
    | 外锚地锚泊 | 38 | 49 | 56 | 58 | 59 | 59 | 60 | 
  
    | 靠泊 | 89 | 81 | 76 | 75 | 74 | 75 | 74 | 
  
    | 4 | 航道航行 | 30 | 18 | 12 | 10 | 10 | 9 | 8 | 
  
    | 内锚地锚泊 | 40 | 50 | 55 | 56 | 57 | 57 | 57 | 
  
    | 外锚地锚泊 | 36 | 47 | 57 | 60 | 59 | 61 | 62 | 
  
    | 靠泊 | 95 | 87 | 78 | 76 | 76 | 75 | 75 | 
 4.1. 相对误差之和最小为目标优化模型下的船舶行为预测
利用模型二[11]可获得估算情况下的马尔可夫状态转移概率矩阵
结合所获的矩阵
以及表1的第2次数据进行预测,预测精度如表2所示。
Table 2. The comparison of predicted relative errors under the optimization model with the objective of minimizing the sum of relative errors
表2. 相对误差之和最小为目标优化模型下的预测相对误差对比
 
  
    | 船舶行为 | 2 h | 4 h | 6 h | 8 h | 10 h | 12 h | 
  
    | 航道航行 | 0.1474 | 0.1422 | 0.1104 | 0.0798 | 0.1761 | 0.1513 | 
  
    | 内锚地锚泊 | 0.0638 | 0.0567 | 0.024 | 0.0132 | 0.0037 | 0.0218 | 
  
    | 外锚地锚泊 | 0.0425 | 0.0347 | 0.0078 | 0.0044 | 0.0013 | 0.0038 | 
  
    | 靠泊 | 0.0198 | 0.01 | 0.0036 | 0.0036 | 0.0120 | 5.2820e-05 | 
 其中,表2使用的相对误差计算公式为
                (4)
数值实验的预测平均相对误差约为4.72%。
同理,结合矩阵
以及表1的第3、4次数据进行预测,计算得到的平均相对误差分别约为2.33%、2.36%。这个数据表明,利用该优化模型近似求解状态转移概率矩阵从而对船舶行为进行预测的结果比较准确。由此可见,确实可以通过这样的线性规划模型实现较少数据情况下的船舶行为的预测。
4.2. 误差绝对值之和最小为目标优化模型下的船舶行为预测
利用模型(3)可估算求得马尔可夫状态转移概率矩阵如下所示
.
此时,模型(3)的最优值为0.4593350E-01,从数值来看比较合理。
同样地,结合
以及表1中第2次数据进行预测,所得预测精度如表3所示。
Table 3. The comparison of predicted relative errors under the optimization model with the objective of minimizing the sum of absolute values
表3. 绝对值之和最小为目标优化模型下的预测相对误差对比
 
  
    | 船舶行为 | 2 h | 4 h | 6 h | 8 h | 10 h | 12 h | 
  
    | 航道航行 | 0.1474 | 0.1520 | 0.1234 | 0.0902 | 0.1672 | 0.1453 | 
  
    | 内锚地锚泊 | 0.0219 | 0.0361 | 0.0167 | 0.0102 | 0.0063 | 0.0251 | 
  
    | 外锚地锚泊 | 0.0127 | 8.8366e-04 | 0.0129 | 0.0183 | 0.0098 | 0.0141 | 
  
    | 靠泊 | 0.0101 | 3.9058e-05 | 0.0052 | 0.0109 | 0.0180 | 0.0051 | 
 表3使用的相对误差计算公式如(4)所示,数值实验的预测平均相对误差约为4.42%。类似地,结合矩阵
以及表1的第3、4次数据进行预测,经计算可知平均相对误差分别约为2.4%、2.18%。可见,该预测结果比较精确,利用模型(3)对于船舶行为进行预测具有一定的价值。
由数值实验和模型建立部分可见,本文提出的估算方法求解状态转移矩阵过程比较简便,并且利用本文第二节所提到的优化模型对船舶行为进行预测时精度较高。以上情况说明,本文提出的预测方法具有一定的实际意义和应用价值。
4.3. 与其他模型的对比
本文将运用GM(1, 1)模型进行实验并与模型(3)进行对比。对比实验所使用的数据为表1第2次数据中的0 h~6 h数据,本节实验希望以此预测表1第2次数据中8 h、10 h船舶分布。
下面是利用GM(1, 1)模型进行实验的结果。
为了预测8 h、10 h这两个时间点处于航道航行的船舶数量,现假设原始数据序列为
,同时计算
的级比
得
的界区是
,
所以
上述情况说明,可以利用GM(1, 1)建模进行预测。由于船舶数量为整数,所以本文利用GM(1, 1)预测并四舍五入取整得到8 h、10 h时处于航道航行的船舶数量分别为7和5。
同理,可基于表1中第2次数据中的内锚地锚泊、外锚地锚泊、靠泊数据进行实验。经计算发现以上情况的级比值均落入界区内,因此本节利用GM(1, 1)预测8 h、10 h时处于内锚地锚泊、外锚地锚泊、靠泊状态的船舶数量。将上述预测结果与真实值列表展示,可得表4。
Table 4. The actual quantity of ships and the predicted quantity of ships derived from the GM(1, 1) 
表4. 真实船舶数量与基于GM(1, 1)模型预测的船舶数量
 
  
    | 船舶行为 | 8 h (真实) | 10 h (真实) | 8 h (预测) | 10 h (预测) | 
  
    | 航道航行 | 8 | 6 | 7 | 5 | 
  
    | 内锚地锚泊 | 49 | 50 | 53 | 58 | 
  
    | 外锚地锚泊 | 52 | 53 | 55 | 59 | 
  
    | 靠泊 | 67 | 67 | 63 | 60 | 
 下面部分利用了模型(3)进行实验。
本次实验使用了表1中第2次0 h~6 h的数据来对状态转移概率矩阵进行求解,结果如下所示:
.
表5展示了利用本节所得的状态转移矩阵
,对表1第2次8 h、10 h的船舶行为分布数据进行预测所得结果,以及真实值。本节采用的是先计算8 h (或10 h)每个状态的船舶分布比例,再将相应比例乘以176 (第二次数据中的船舶总数),以此获得每个状态下的船舶数量。
Table 5. The actual quantity of ships and the predicted quantity of ships based on model (3)
表5. 真实船舶数量与基于模型(3)的预测船舶数量
 
  
    | 船舶行为 | 8 h (真实) | 10 h (真实) | 8 h (预测) | 10 h (预测) | 
  
    | 航道航行 | 8 | 6 | 8 | 7 | 
  
    | 内锚地锚泊 | 49 | 50 | 50 | 50 | 
  
    | 外锚地锚泊 | 52 | 53 | 52 | 53 | 
  
    | 靠泊 | 67 | 67 | 66 | 66 | 
 显然,由于模型(3)考虑了船舶之间的状态转移(并假定船舶总数量保持不变),所以预测的结果会比GM(1, 1)模型更接近现实,这也说明了模型(3)的预测准确性。
5. 结论
港口的高效运行是建设海洋强国基础。当港口的运行日益趋向智慧化、科技化,才能更好地发挥其用处,促进经济发展。而预测船舶行为可为有关部门进行港口调度提供帮助,对于港口的正常运行、发展具有一定实际意义。本文基于尹忠勋等[10]人的预测模型,采用了两种不同的线性规划模型对状态转移概率矩阵进行估算求解,可在较少数据情形下,较准确地预测恶劣天气下港口水域船舶行为分布。本文的研究结论可为恶劣天气情况下的船舶行为分布的预测提供一定的参考,具有一定的应用价值。
基金项目
广西科技师范学院2024年度校级教师科研基金项目(GXKS2024YB037)。
NOTES
*第一作者。
#通讯作者。