1. 引言
2018年7月25日,国务院颁布了被称为“史上最严格的围填海管控”的通知(国发〔2018〕24号),强调滨海湿地保护的重要性,指出长期大规模围填海活动对生态系统的损害,并要求各级部门加强保护,严格管控围填海活动,转变工作思路,实现海洋资源的严格保护、有效修复和集约利用。同时,提出了严控新增围填海造地、加快处理历史遗留问题和加强生态保护修复的具体要求。同年12月20日,自然资源部和国家发改委联合发布了更详细的实施意见(自然资规〔2018〕5号),提出了严控新增围填海、开展现状调查和提升监管能力三大举措,并明确了具体实施步骤。
2019~2022年度,自然资源部北海局根据部署,开展了“围填海历史遗留问题”和“海域使用疑点疑区核查”监管工作,通过“卫星遥感 + 无人机巡查 + 人工核查”的方式,实现了全覆盖无遗漏式的监管。
然而,目前海上围填海活动行为仍存在监管空白。由于活动区域大、隐蔽性强,且前期作业难以直接取证,监管人员难以确认违法事实。同样的问题也存在于海砂等海底自然资源监管领域。
为解决这一问题,北海局接入了海上AIS和雷达目标数据,为海上围填海活动行为监管提供了基础条件,有望填补海上围填海活动监管的空白,提高监管效率和准确性。
2. 国内外现状
时空大数据挖掘中,海洋船舶轨迹研究分析是一大难点,相较于陆地交通时空大数据,从海洋数据中提取有效信息更具挑战性。这主要因为船舶在海面航行间距大、行动无约束、时空跨度大且速度较低,导致轨迹数据特征异于陆地交通。同时,海洋地理信息特征不明显,加之远海区域数据质量低,使得从海洋数据中提取航道信息尤为困难。
针对轨迹数据处理,研究者们提出了多种方法。秦红星基于线性插值,结合速度、航向等动态信息,实现了缺失轨迹的修复[1]。姜佰辰则利用多项式卡尔曼滤波器拟合非线性系统,补偿数据缺失和更新慢等问题[2]。马杰通过提取相对距离和航向差特征,利用SVM实现会遇态势的自动提取[3]。左小将提出的SBucket和SMiniCon算法,能针对连续查询请求快速生成符合要求的服务组合计划[4]。
在轨迹统计分析方面,胡阳采用深度学习算法,利用视频信息对航道中船舶进行检测和跟踪[5]。张春玮设计了融合位置、航速等多个参量的船舶行为相似度模型,并基于此实现了船舶轨迹聚类[6]。李卓然则提出了一种基于四叉树的并行的精度自适应的船舶航道提取方法,有效提取了多精度船舶航道边界[7]。郑振涛利用随机森林分类模型,对船舶停留轨迹进行分类,分别得到锚地和泊位停留数据[8]。
船舶轨迹行为分析方面,徐婷等利用DBSCAN和LOF算法对施工区域进行识别,并利用ARIMA模型对船舶施工轨迹进行预测[9]。江玉玲采用改进型轨迹段DBSCAN聚类算法,结合离散Frechet距离,得出船舶运动典型轨迹[10]。王立林则利用多尺度卷积和LSTM网络,提高了船舶轨迹行为识别的准确率[11]。
数据可视化表现方面,孙梦竹基于VOS舰船轨迹点数据,利用DBSCAN密度聚类方法和GIS空间分析方法,对南海地区航道分布等信息进行挖掘,并结合可视化方法进行展示[12]。徐良坤则归纳了船舶轨迹聚类的方法,并讨论了面临的挑战和未来发展趋势[13]。
综上所述,轨迹聚类是研究船舶行为模式、发现交通规律的重要手段。结合船舶空间位置和运动行为特征,利用行为相似度模型实现船舶轨迹聚类分析,有助于解决海上目标行为模式不同和异常的轨迹分类辨识问题。
基于此,我们提出以下方案:首先,利用自适应阈值算法对AIS目标轨迹数据进行异常点检测和去噪预处理,获取规范原始数据集;其次,结合最优轨迹匹配算法对雷达数据进行拼接,构成完整和规范的数据集;最后,通过行为相似度算法,获取海上目标在重点关注区的运动特征分析结果,实现对围填海重点区域海上目标活动的监管。这一方案有望为海洋监管提供有力支持。
3. 研究目标及内容
3.1. 研究目标
基于岸基小目标雷达和AIS数据去噪,利用最优轨迹匹配算法融合两类数据,形成可靠连续轨迹。结合山东省海洋监控区域地理分布,通过行为相似度算法分析轨迹,实现自动化监管和预警,为加强海上监管、打击非法围填海提供支持。
3.2. 研究内容
通过对岸基小目标雷达数据和AIS数据原始数据前期处理,建设海上目标原始数据库。在入库数据基础上开展岸基小目标雷达数据和AIS数据融合算法研究,形成24小时为单位的海上目标轨迹融合数据。最后通过对海洋围填海监管高风险区域内海上目标轨迹的特征分析算法研究,甄别异常轨迹船舶,实现对海洋围填海监管高风险区的海上目标连续监管,填补当前山东省海洋围填海监管领域空白。
4. 研究方法与技术路线
4.1. 研究方法
拟采用文献法、数学算法及计算机大数据应用的研究方法综合加以实施。
首先对要研究的目标数据的特点进行充分分析,将项目涉及的两类数据在数据频率、数据精度、数据内容及数据可靠性方面进行综合分析。其次通过前期数据处理与测试环境准备,完成两类数据的海量数据分析准备,构成可以实现融合算法的数据开发与分析环境[14]。这个过程中需要落实支持整个流程化的数据运行环境、数据成果表现方法以及成果对外输出服务方法。最后在充分查阅和研究国内外相关权威文献资料的基础上,针对研究的对象提出解决问题的研究思路和研究方法,做到定性分析与定量分析充分结合,计算机数据处理技术与数学算法充分结合,规范分析与实证分析相结合,研究项目研究的特点与本质。
4.2. 技术路线
4.2.1. 数据处理流程
详细数据处理流程见图1。
对AIS数据点通过轨迹去噪后连接形成AIS数据线;
对雷达数据点通过滤除静止点后利用融合算法进行雷达数据融合处理,将数据形成雷达数据线与雷达数据点[15];
将AIS数据线与雷达数据线进行融合处理形成融合数据线;
将融合后的数据线叠加关注重点地理区域进行轨迹特征分析,并分析出需重点关注船只[16];
通过历史数据查找比对鉴定甄别输出可疑船舶[17]。
Figure 1. Flow chart of data processing
图1. 数据处理流程图
4.2.2. 基础数据准备(见表1)
Table 1. Analysis of the characteristics of the original data
表1. 原始数据特点分析
|
雷达数据 |
AIS数据 |
定位方式 |
回波定位 |
GPS定位 |
传输方式 |
互联网接收 |
AIS站接收,互联网传输 |
定位精度 |
粗 |
较准确 |
时效性 |
好 |
中 |
身份识别 |
无 |
唯一 |
轨迹生成 |
数学算法 |
MMSI号 |
数据频率 |
1分钟1次 |
约3分钟1次 |
噪声情况 |
高 |
低 |
小时数据量 |
45,408 |
1498 |
日数据量 |
980,635 |
3712 |
年数据量 |
357,931,775 |
1,354,880 |
注:AIS数据可能存在中断,也可能一整个月可以连续获取,所以日数据量(3712)并不是小时数据量(1498) * 24,这里不存在统计和计算误差。
4.2.3. 数据融合处理流程
(1) AIS信号异常点的检查
AIS由于定位技术的局限和外界干扰因素的影响(如设备故障、人为操作误差),轨迹数据中存在大量的异常点,产生严重偏离轨迹的不合理的采样点,严重降低数据质量(见图2) [18]。
Figure 2. AIS trajectory after denoising
图2. 去噪声后的AIS轨迹
(2) 雷达观测数据跟踪
雷达的探测距离远并且可以在恶劣环境下进行,收到的回波是大量的噪声,杂波和目标回波,而目标的回波能量往往要比噪声和杂波低得多(见图3),因此雷达的难点是在高杂波背景下检测目标。
Figure 3. Radar target data plot with heavy background noise
图3. 带有大量背景噪声的雷达目标数据图
(3) 雷达 + AIS融合
在各传感器存在不同的系统误差和漏检率的情况下,将各个传感器产生的本地航迹关联成融合系统中的一条航迹(见图4) [19]。
Figure 4. Trajectory plot after fusion of radar and AIS data
图4. 雷达与AIS数据融合后的轨迹图
(4) 船舶数据异常行为非法监测
根据输入的船舶运动相关数据对船舶的航速、航向、航迹进行分析,判断该船的运动是否符合正常的航行活动规律(见图5) [20],进而对船舶自身的安全,或者是否存在非法活动嫌疑进行识别,并对可能发生的危险进行评估和预警。
(5) 多源轨迹
不同系统中生成的轨迹具有不同的符号和路径,受工作原理、处理机制和不同传感器内部模式的影响[21]。同时,受传感器影响的轨迹在不同系统中会有不同的噪声和误差。由多个传感器对同一目标形成的船舶轨迹成为多源轨迹。由于多源轨迹时间不同且位置不同,轨迹的形状也不同。如图6所示,Tr是基于海岸的雷达的检测轨迹,Ta是AIS的报告轨迹。显然,不同传感器的轨迹数据在时间上并不统一[22]。
Figure 5. Suspicious trajectory in the Qingdao offshore Wenchang Fish reserve
图5. 青岛近海文昌鱼保护区的可疑轨迹
Figure 6. Schematic diagram of multi-source trajectories
图6. 多源轨迹示意图
(6) 多源轨迹匹配
由于多源轨迹的采样不确定性,如噪声和数据丢失,时间插值方法不适用于这种情况。多源轨迹点代表具有相同运动行为的两个轨迹的数据采样点,通常不可能同时记录相同的运动[23]。时空约束轨迹匹配的主要思想是在轨迹上找到尽可能多的“时空匹配点”。尽管轨迹数据可能受到错误、延迟、噪声和丢失等因素的影响,但不同传感器得到的目标测量结果仍然有许多关联。通过时空约束,轨迹匹配是在轨迹和相关轨迹之间找到一个相似点,使用相似点作为匹配点,并使用匹配点作为相似性计算的最小单位。只有满足时空距离的轨迹点才能被视为近似匹配点。匹配点在一定的时间和空间范围内。
其中
代表匹配点的匹配空间距离,
是匹配时间距离。i是Ta上的第i个点,j是Tr上的第j个点。
是使用欧几里得距离的不同传感器轨迹点的空间距离函数。
是使用时间差的不同传感器轨迹点的时间距离函数。
(7) 基于逐片时空约束的异步轨迹匹配方法
① 轨迹段分割
为了降低计算成本,本文采用Ramer-Douglas-Peucker (RDP)轨迹压缩算法将原始轨迹分割成长度较短且不重叠的子轨迹。RDP算法最初由Urs Ramer在1972年提出。Poiker和Douglas在1973年改进了该算法,随后许多学者对该算法进行了逐步改进。RDP算法通过提取多边形的特征点来近似原始多边形。它在船舶轨迹压缩中得到了广泛应用。
② 最优匹配点计算
在轨迹匹配过程中,满足时间和空间阈值的多个点将在时空约束的匹配点出现。满足时空约束的点构成一组匹配点。提出最优匹配点以计算准确性。通过计算集合中点的时空距离,取距离最小的点作为最优时空匹配点。
③ 轨迹相似性计算
基于找到最优匹配点,由两个不同传感器形成的轨迹的相似性,计算出后,再确定匹配。由于时间阈值
和空间阈值
,Ta上的某些点与Tr上相关点不匹配。在本文中,Ta无法在Tr上匹配的点的相似性计算结果为0,以满足最终的计算需求。
④ 同步轨迹匹配
在计算了AIS和雷达轨迹之间的相似度之后,可以通过轨迹之间的相似度来定量评估两个轨迹是否为同一轨迹的可能性。这种评估方法可以用于轨迹匹配和关联。TA和TR分别是AIS和雷达生成的目标轨迹集合。
5. 结语
由于海上目标具有不同于陆地运动对象的运动特征,轨迹聚类是研究船舶行为模式、发现船舶交通规律的重要手段,可以为船舶行为监控和异常行为检测提供参考依据,结合船舶空间位置特征和船舶运动行为特征,利用融合位置、航速、航向等多个运动参量的船舶行为相似度模型实现船舶轨迹聚类分析,可以在一定程度上解决指定空间区域内海上目标行为模式不同和行为异常的轨迹的分类辨识。由于违法作业船舶常采用关闭AIS或伪造AIS的方式规避执法和监管,因此将雷达数据和AIS数据进行结合,可以实现以海上目标活动轨迹的无缝持续监控。本研究利用基于自适应阈值算法对AIS获取的目标轨迹数据进行异常点检测并去噪预处理,获取较为规范的原始数据集,结合最优轨迹匹配算法对雷达数据进行拼接后,构成较为完整和规范的数据集,再通过行为相似度算法,获取对海上目标在重点关注区的运动特征分析结果,甄别异常轨迹船舶,实现对海洋围填海监管高风险区的海上目标连续监管,填补当前山东省海洋围填海监管领域空白。
基金项目
山东省海洋生态环境与防灾减灾重点实验室开放基金资助项目:基于分段时空约束航迹匹配算法的海上目标信息特征分析算法研究及在围填海监管中的应用(202211),自然资源部北海局海洋科技项目:海洋监管巡查记录系统采集数据在一张图系统中的集成应用(2023B02)支持。
NOTES
*通讯作者。