摘要: 在探讨水下导航系统的区域适配性标定问题时,本研究首先对所提供的重力异常值数据集执行了插值算法,以增强基准图的分辨率。随后,采用Python编程语言实现的k-means聚类算法对数据进行空间分割,并对各个子区域进行精确标定。通过对标定结果进行编码,并选取与研究目标密切相关的13个关键指标,运用主成分分析(PCA)方法进行降维处理,以简化模型复杂度并提取最具代表性的特征。进一步构建了逻辑回归模型,通过两次迭代优化,提高分类准确性。通过将模型预测结果与实际值进行比较,构建了接收者操作特征(ROC)曲线,以评估模型的预测性能。通过与标准编码的比较,验证了模型在预测分类区域适配性方面的有效性。在模型迁移性预测方面,对新数据集执行了相同的预处理流程,并在此基础上对仿真参数进行了调整,具体包括上下5%和10%的变动。通过灵敏度分析,绘制了参数变化与模型准确率之间的关系图,从而深入探讨了模型参数对预测结果的影响,进一步验证了模型的鲁棒性和适用性。综合分析结果表明,在推动“海洋强省”建设的战略背景下,实现海洋经济发展规划的关键之一在于海洋高新技术领域的创新。其中,水下导航与定位技术的适配区分类预测技术是核心技术之一。水下航行器在执行任务时,需确保自主性、无源性、高隐蔽性、不受地域和时间限制以及高精度的导航与定位能力。重力辅助导航技术是实现上述要求的有效方法之一。本研究的成果为水下导航系统的适配性标定提供了科学的方法论和技术支持,对于提升水下航行器的导航与定位能力具有重要意义。
Abstract: When exploring the regional adaptability calibration issue of underwater navigation systems, this study first performed interpolation algorithms on the provided gravity anomaly value dataset to enhance the resolution of the reference map. Subsequently, the k-means clustering algorithm, implemented in the Python programming language, was used to spatially segment the data and precisely calibrate each sub-region. The calibration results were encoded, and 13 key indicators closely related to the research objectives were selected for dimensionality reduction using Principal Component Analysis (PCA) to simplify model complexity and extract the most representative features. A logistic regression model was further constructed, and its classification accuracy was improved through two iterations of optimization. By comparing the model’s predicted results with actual values, a Receiver Operating Characteristic (ROC) curve was constructed to assess the model’s predictive performance. The effectiveness of the model in predicting regional adaptability was verified by comparing it with standard encoding. In terms of model translatability prediction, the same preprocessing procedures were performed on a new dataset, and simulation parameters were adjusted accordingly, including variations of 5% and 10% up and down. Through sensitivity analysis, a relationship diagram between parameter changes and model accuracy was plotted, thereby deeply exploring the impact of model parameters on prediction results and further verifying the model’s robustness and applicability. The comprehensive analysis results indicate that one of the keys to promoting the construction of a “Marine Strong Province” under the strategic background of ocean economic development planning lies in innovation in the field of marine high-tech. Among them, the classification prediction technology of adaptive areas for underwater navigation and positioning technology is one of the core technologies. Underwater vehicles need to ensure autonomy, passivity, high concealment, unrestricted by geography and time, and high-precision navigation and positioning capabilities when performing tasks. Gravity-assisted navigation technology is one of the effective methods to achieve the above requirements. The results of this study provide a scientific methodology and technical support for the adaptability calibration of underwater navigation systems, which is of great significance for enhancing the navigation and positioning capabilities of underwater vehicles.
1. 引言
在海洋经济发展和海洋强国建设的背景下,水下导航与定位技术的重要性日益凸显。其中,惯性导航系统(INS)和重力辅助导航系统因其独特优势成为研究热点。惯性导航系统(INS)以其独立生成导航信息的能力、对外部信号的不依赖性、以及对电磁干扰的高度免疫性,展现出其独特的优势[1] [2]。INS以其自主性、隐蔽性以及对环境影响的最小化,被广泛采用于各类水下导航任务。近年来,INS与其他导航技术的融合成为研究重点,目的在于实现更高精度的自主式无源导航。
重力匹配导航系统测量并比对所在位置的重力特征值与预先储存的海洋重力场基准图,依据特定的匹配原则,精确确定水下运载体的位置[3]。当前研究主要集中在提高重力传感器精度、优化匹配算法和改进海洋重力场模型等方面。然而,重力匹配导航系统的性能与所处区域的重力场特征密切相关[4] [5]。因此,适配区的识别与优化成为提升系统定位精度的关键。研究人员正致力于开发更先进的适配区分类预测技术,以应对不同海域的复杂地理环境。一方面,新型惯性导航系统的出现使得水下导航更加精准和可靠;另一方面,重力辅助导航技术的发展也为水下导航提供了新的解决方案[6] [7]。此外,研究人员还在探索将其他传感器技术应用于水下导航中,以提高整体性能和可靠性。未来,利用人工智能技术提高匹配算法的适应性;开发新型高精度重力传感器;以及构建更精确的全球海洋重力场模型。这些进展将有助于进一步提升水下导航与定位技术的性能,为海洋经济发展和海洋强国建设提供有力支持。
2. 数据来源与分析
本文研究和分析辽宁省数学建模竞赛中提出的水下导航系统中各区域适配性分类预测问题。通过构建和验证一个分类预测模型,旨在识别和选择具有高匹配性的导航区域,以增强重力辅助导航系统的可靠性和精度。数据集来源于该竞赛所提供,经过数据预处理和特征工程,确立了适用于该问题的分类预测模型。在重力辅助导航系统中,适配性高的区域意味着重力特征值的差异性较大,这有助于提高导航系统的定位精度和匹配成功率。因此,我们目标是开发一个能够准确预测各区域适配性的分类模型,以便为水下航行器的导航任务提供最优的导航区域选择。通过机器学习算法和统计分析方法,不仅提高了对导航区域适配性的理解,而且为水下导航系统的优化提供了科学依据。通过精确的分类预测模型,可以有效识别出具有高适配性的导航区域,从而为水下航行器提供更加可靠和精确的导航支持。
3. 模型的建立与求解
3.1. 各区域适配性的标定
在应用Python编程语言实现的k-means聚类算法框架中,算法初始化阶段涉及随机选择k个数据点作为聚类中心。通过计算每个样本点到这些中心点的欧几里得距离,为每个样本点分配到最近的聚类中心,形成初始的聚类划分。整个过程包括绘制初始聚类中心点以及每个聚类的边界。将这些分类结果存储于一个新的数据表中,以便进一步分析。在保留初始聚类结果的基础上,对聚类中心进行迭代优化。采用肘部法则来评估不同聚类数量k对聚类质量的影响。如图1所示,随着k值的增加,聚类内差异性度量(如总平方误差SSE) J逐渐减小。当k小于4时,J的下降趋势较为显著;而当k大于4时,J的下降趋势放缓。由此推断,k = 4时,聚类结构达到一个相对稳定的状态,确定聚类数量为4,将插值处理后得到的160,000个数据点根据其适配性结果分配到相应的聚类区域中,并更新至新数据表中,数据如下表1所示。
Figure 1. Using the elbow method to find the number of clusters
图1. 利用肘部法求聚类个数图
Table 1. Data after interpolation
表1. 插值处理之后的数据
序号 |
经度 |
纬度 |
重力异常值 |
0 |
115.0083 |
9.0045 |
17.7 |
… |
… |
… |
… |
5221 |
115.1136 |
9.069738 |
5.358586122 |
… |
… |
… |
… |
29990 |
116.9632 |
9.375854 |
−11.39751088 |
… |
… |
… |
… |
70000 … 109999 … 131313 … 159999 |
115.0083 … 117.0083 … 115.5747 … 117.0083 |
9.882702 … 10.37951 … 10.6505 … 11.0068 |
48.05290971 … −1.653021273 … −18.6764793 … 44.9 |
通过应用k-means聚类算法,采用肘部法则对数据集进行聚类分析,将数据集划分为四个显著不同的类别。在这一过程中,每个类别的样本表现出独特的重力波动特征,这些特征通过计算得到并具有统计学意义上的区分度。每个聚类中心的地理位置(纬度和经度)以及对应的重力波动值被精确计算并记录下来。这些聚类中心的坐标连同其对应的重力波动值被整合并导入到一个新的数据表中。通过这种方式,可以更有效地对数据进行管理和查询,同时也为后续的地理信息系统分析和可视化提供了基础数据支持。根据研究假设,重力波动值的幅度与定位精度呈正相关,即重力波动值较大时,对应的地理位置的确定性更高,从而定位精度更高;相反,重力波动值较小则意味着定位精度较低。
3.2. 预测分类模型的建立
(1) 数据处理
在地理信息系统(GIS)和空间数据分析中,根据重力异常的变化情况(即重力波动值)对适配区进行分类,以定义不同的精度等级,包括特高精度区、高精度区、中精度区和低精度区。为了将适配性标定纳入数学模型进行计算,必须对这些标定进行量化处理。鉴于计算机系统以二进制形式处理数据,采用二进制编码对适配性标定进行量化,具体编码规则如下:特高精度区编码为01,高精度区编码为00,中精度区编码为10,低精度区编码为11。
在进行空间数据分析时,由于选取的指标数量较多,直接进行分类分析可能会导致计算复杂度显著增加。我们采用主成分分析方法对数据进行降维处理。由于适配性标定已经通过二进制编码转换为0和1的形式,我们构建了逻辑回归模型来处理这些二进制数据。通过比较预测精度、召回率、F1分数等指标,可以对模型的性能进行量化分析,从而判断模型是否能够有效地进行分类预测。
接下来需要依据各个点的指标,分类出适配性标定,对前面适配性区域进行二进制编码,这里采用两次逻辑回归模型进行结果组合,与真实结果进行比较,以此来验证是否有效分类推测。通过逻辑回归的模型,并能用这个模型进行分类预测。分析,xij坐标点,i = 1,2,…159999,j = 1,2,…13,经过迭代计算出来参数β。
(2) 检验模型的有效性
将处理好的数据代入上面建立的逻辑回归模型,先对坐标的第一个位置的编码进行分类,与真实结果进行对比,正数对的即为True1,正数错的就是False1,负数对的就是True2,负数错的就是False2,再求PPP与FFF,以及AU的值,第二位同理,绘制出第一次与第二次的ROC曲线如下图2所示。
(a) 第一次分类的ROC曲线 (b) 第二次分类的ROC曲线
Figure 2. ROC curve
图2. ROC曲线
如图2(a)和图2(b)所示,对第一次和第二次分类的接收者操作特征曲线进行观察,可以发现第一次分类的ROC曲线下面积为0.6071,该值接近于1,表明模型具有一定的区分能力。第二次分类的ROC曲线下面积达到0.9378,这是一个非常高的值,表明模型具有出色的区分能力,从而验证了先前建立的模型的准确性。为了进一步验证模型的预测能力,将两次逻辑分类模型的结果进行整合,并与预先标定的准确编码进行比较。通过Python编程语言进行仿真实验,得到的模型准确率为75.6%,这一结果表明本文所建立的模型能够有效地对区域适配区进行预测分类。
3.3. 迁移性预测以及适用性的判定
对于新数据集,我们执行了与之前相同的预处理步骤。将计算得到的参数与新指标应用于分类算法,以预测各点的适配性分类。我们进行了灵敏度分析,通过系统地改变模型参数,观察准确度的变化情况。在分析过程中,调整了逻辑回归模型的参数,以确定模型对参数变化的敏感程度。为了确保分析的效率,仅对参数进行了上下5%和10%的调整,并绘制了相应的图形。分别得出分类准确度的变化趋势如图3所示。
Figure 3. Relationship between the change of two logistic regression parameters and accuracy
图3. 两次逻辑回归参数变化与准确度的关系图
对于逻辑回归模型的灵敏度分析,模型灵敏度(1)的准确率随着模型参数的调整而变化的趋势相对平缓,且该准确率值非常接近于1,表明模型对于参数变化的敏感度较低。模型灵敏度(2)的准确率虽然在特定参数区间内表现出较为明显的波动,但整体上也维持在接近1的水平,这进一步证实了模型的鲁棒性。从图3中可以观察到,在参数调整过程中,准确率的变化幅度较小,且始终维持在接近最优值1的范围内,这表明模型参数的变动对模型预测性能的影响是有限的。它支持了问题二中建立的系统F对于新数据集同样具有适用性的假设。即使在面对新的、未见过的数据时,该模型也能够保持较高的预测准确性,这表明模型具有良好的泛化能力。
4. 结论
本研究通过对水下导航适配区分类预测模型的开发和分析,得出了以下主要结论:
1) 数据预处理的重要性:通过对原始数据集进行插值处理和适配区的二进制编码,显著提高了数据的空间分辨率和可用性,为后续分析奠定了坚实基础。
2) 多算法融合的有效性:结合主成分分析、k-means聚类和二分类逻辑回归等多种算法,成功构建了一个能够有效分类水下导航适配区的预测模型。
3) 模型的实用价值:开发的预测模型不仅提高了水下导航系统的精度,还增强了其在复杂海洋环境中的可靠性和稳定性。这对水下航行器的导航和定位具有重要的实际应用价值。
4) 适配区分类的关键作用:研究表明,准确识别和分类水下导航适配区对确保水下航行器的导航精度至关重要。这一发现为未来水下导航系统的设计和优化提供了新的思路。
综上所述,本研究不仅开发了一个高效的水下导航适配区分类预测模型,还为提升水下导航系统的整体性能提供了重要的理论和实践依据。这为推动水下导航技术的进步和拓展其应用领域具有重要意义。