基于海洋声速剖面数据的多插值方法拟合及误差分析
Research on Fitting Degree and Error Analysis of Multi-Interpolation Method Based on Ocean Sound Velocity Profile Data
DOI: 10.12677/ams.2025.124025, PDF, HTML, XML,   
作者: 孙月明:海军大连舰艇学院军事海洋与测绘系,辽宁 大连
关键词: 声学剖面数据插值方法误差分析Acoustic Profile Data Interpolation Method Error Analysis
摘要: 本文基于某次海试测点CTD获得的声速剖面数据,利用拉格朗日插值、最优点插值、样条插值和kriging插值法,得到某测点的声剖曲线,与实测数据进行拟合,通过拟合曲线误差分析,得到各插值法处理海洋声剖数据的优缺点。拉格朗日插值易在跃层区过拟合,偏离实测值。最优点插值法通过增加龙格现象抑制,能有效减少振荡。样条插值法中B样条更适配浅水区,线性与三次样条可兼顾全水深,最近邻样条平滑性最差。kriging插值拟合的声速剖面曲线整体分布上表现更均匀,出现极端误差值的概率最低,但其局部精确度上弱于其他插值方法,累计误差高且均匀分布于各个深度。
Abstract: Based on the sound speed profile data obtained by CTD at a certain sea trial station, this study employs Lagrange interpolation, optimal point interpolation, spline interpolation, and Kriging interpolation to generate sound speed profile curves for the station. These curves are fitted with the measured data, and the advantages and disadvantages of each interpolation method in processing marine sound speed profile data are derived through fitting curve error analysis. Lagrange interpolation is prone to overfitting in the thermocline region, leading to deviations from the measured values. The optimal point interpolation method can effectively reduce oscillations by adding Runge phenomenon suppression. Among spline interpolation methods, B-spline is more suitable for shallow water areas, linear and cubic splines can balance the entire water depth, and nearest neighbor spline has the poorest smoothness. The sound speed profile curves fitted by Kriging interpolation show a more uniform overall distribution and the lowest probability of extreme error values, but their local accuracy is weaker than that of other interpolation methods, with high cumulative errors evenly distributed across all depths.
文章引用:孙月明. 基于海洋声速剖面数据的多插值方法拟合及误差分析[J]. 海洋科学前沿, 2025, 12(4): 238-247. https://doi.org/10.12677/ams.2025.124025

1. 引言

海水声速剖面直接反映声波在海洋中的传播路径、衰减规律,对水下声学设备的性能、海洋调查任务的精度及水下作战体系保障等方面均发挥重要作用。实际海洋调查中难以获取连续声速剖面数据,因此基于有限离散的观测数据,通过插值法在已知测点数据中填补缺失的声速剖面数据,实现数据的连续性和完整性,成为海洋声学领域亟待解决的关键技术问题之一[1]-[7]

近年来,国内外诸多学者开展了相关研究。Geyer F等[6]将拉格朗日插值用于补全离散的北极弗拉姆海峡声速观测数据。罗宇等[8]为修正超短基线定位中声速不均匀导致的声线弯曲问题,先用线性插值对声速剖面数据加密,再通过二次多项式拟合声速,构建声线跟踪模型。周芃希等[6]提出结合拖曳设备离散测点数据的声速剖面重构方法,本质是优化后的最优点插值思路,即筛选三组拖曳温深传感器的关键数据点,通过构建DHNM基函数计算系数,实现深海声速剖面重构。马海波等[9]通过距离分组试验确定Kriging插值的变异函数,将其与反距离加权法等对比,得出Kriging插值在潮间带声速关联的测深数据插值中拟合精度更高的结论。Chen P等[10]指出,传统Kriging插值在水下地形和关联声速数据处理中存在过度平滑问题,通过引入分形补偿改进后,适用于与地形强相关的近海底声速数据插值场景。

本文基于某次海上观测任务中实测的标准化1 m间隔的CTD数据,利用经典声速经验公式[11] [12],得到声速剖面图,重点是用各插值方法进行拟合,进行曲线对比和误差检验分析,优选声剖数据的插值处理方法。

2. 原理

2.1. 拉格朗日插值法原理

过两点(x1, y1)、(x2, y2)确立一条直线,

α( x )=ax+b (1)

为确定参数ab,把两点坐标代入公式(1)

两点式:

α 1 x= y 0 x x 1 x 0 x 1 + y 1 x x 0 x 1 x 0 (2)

一次插值基函数,分别记为 l 1 = x x 1 x 0 x 1 l 2 = x x 0 x 1 x 0

插值函数 α 1 ( x ) 是这两个基函数的线性组合形式,这种形式里的组合系数就是对应点上的函数值。此时,插值函数 α 1 ( x ) 称为拉格朗日(Lagrange)插值[13]-[15]

点斜式:

α 1 ( x )= y 0 + y 1 y 0 x 1 x 0 ( x x 0 ) = y 0 + f( x 1 )f( x 0 ) x 1 x 0       (3)

由于函数 f( x ) x i x j 处的一阶均差为

f x i , x j = f( x i )f( x j ) x i x j (4)

因此,(2.4)公式中的 f( x i )f( x j ) x i x j f( x ) x 1 x 0 处的一阶均差 f[ x 1 , x 0 ] 。由于均差的对称性, α 1 ( x ) 公式的正确表述方法为

α 1 ( x )=f( x 0 )+( x x 0 )f[ x 0 , x 1 ] (5)

2.2. 最优点插值法原理

计算Chebyshev节点

x k  =cos ( 2k1 ) 2n π,k=1,2,,n (6)

其中,  n 是多项式的度数加一,   x k 是区间  [ 1,1 ] 上的第k个Chebyshev节点。

得到Chebyshev节点后,推导最优点插值的关键在于对插值多项式的误差进行分析。对于插值多项式 P n ( x ) ,其在某个函数   f( x ) 上的插值误差可表示为:

E n( x )  = f( x )  P n( x ) (7)

 f( x ) 在插值区间上具有足够的连续导数时,根据插值理论,误差可以写为:

E n( x )  = f ( n+1 )  ( ξ x )  ( n+1 )! n i=1 ( x x i ) (8)

其中, ξ x 是一个位于 x 和插值节点间的某个未知点, n i=1 x x i 是节点 ξ 的有关 x 的多项式,代表 f ( n+1 )  ( ξ x )  ( n+1 )! 的最大值。当使用Chebyshev节点时,在 [ 11 ] 这个区间内这个多项式的值是最小的,而 f ( n+1 ) ( ξ x )   表示 f( x )  (  n+1 ) 阶导数在某个点 ξ 的值[15]-[19]

因此,如果 f( x )  (  n+1 ) 阶导数在 [ 1,1 ] 区间上存在且连续,使用Chebyshev节点会使插值误差的上界最小化。

2.3. 样条插值法原理

以三次样条插值为例:假设1个数据点集 [ ( x 1 , y 1 ),( x 2 , y 2 ),,( x n , y n ) ] ,其中 x 1  <  x 2  < <  x n 。目标是找到一个函数S (x),在每个 [ x 1 , x ( i+1 ) ] 上是一个三次多项式,并且在整个定义域上连续的基础上,一阶和二阶导数也连续[20]-[24]

下一步,构建构造三次多项式。在每个区间  [ x i , x ( i+1 ) ] 上,样条函数   S i( x )

S i( x )  =  a i  +  b i  ( x   x i )+  c i   ( x   x i ) 2  +  d i   ( x   x i ) 3 (9)

其中 a i , b i , c i , d i 均为系数,需要通过边界条件和连续性条件推导,而边界条件则需计算得出样条函数在每个数据点上的函数值必须等于该点的函数值,即 S i ( x i )=  y i   S i ( x ( i+1 ) )=  y ( i+1 )

下一步,确保一阶导数和二阶导数连续和进行边界条件的选择。确保连续需要相邻多项式的一阶导数和二阶导数在数据点处必须相等,即 S i ' ( x ( i+1 ) ) =  S ( i+1 ) ' ( x ( i+1 ) ) S i '' ( x ( i+1 ) )=  S ( i+1 ) '' ( x ( i+1 ) ) ;选择正确恰当的边界条件,需选择合适的条件来确定曲线两端的二阶导数。常见的选择是自然样条,其要求两端的二阶导数为零,即 S 1 '' ( x 1 )= 0 S ( n1 ) '' ( x n )= 0

最后,联立上述公式解方程组,求出所有的三次多项式系数 a i , b i , c i , d i 。将系数代入多项式,获得三次样条插值函数的预测模型。

2.4. Kriging插值法原理

核心在于假设数据存在空间自相关性,即空间和数值的相近和相似是依照一定的函数关系同步变化的,这种函数关系可以通过设置变异函数γ (h)来量化,它描述了样本点随着距离增加而变化的半方差[25]-[27]

γ( h )= 1 2N( h ) i=1 N( h ) ( Z( x i )Z( x i +h ) ) 2 (10)

其中,  Z( x ) 是位置 x 的随机变量,  h 是样本点之间的距离, N( h ) 是具有相同距离 h 的样本对数。

目标是确定估计未知点 Z( x 0 ) 处的值的最优权重   λ i 。这些权重应当满足无偏估计和最小方差的条件。估计值   Z ^ ( x 0 )  可以表示为:

Z ^ ( x 0 )=  n i=1 λ i Z( x i ) (11)

为得到最优估计值进行权重 λ i 的选择,一般则是通过最小化估计值的方差 σ 2 来实现的,即:

σ 2  = Var [ Z ^ ( x 0 ) Z( x 0 ) ] (12)

方差可以根据权重和变异函数展开。针对于Kriging法需要无偏、最小的方差条件,分别可得:

依照无偏条件,能够得到权重 λ i ( i = 1, 2, 3…)满足关系式

i=1 n λ i =1 (13)

依照无偏条件,Kriging方差 σ 2 为最小,可以得到求解权重 λ i 的方程

i=1 n λ i C( x i , x j )μ=C( x 0 , x j )       ( j=1,2,,n ) (14)

联立公式(2.13)与(2.14),可求得待定权系数 λ i 的值。

3. 插值法拟合曲线对比

基于某次海上观测任务中CTD得到的1米间隔的声速剖面调测实验数据,已经过预处理,格式统一。基于1 (11.6949 N, 95.195 E)、2 (11.4005 N, 94.9003 E)、3 (11.4007 N, 95.4959 E)、4 (11.1005 N, 95.2004 E)四个坐标测点在深度0 m~881 m区间内均匀分布的声速剖面数据片段,对处于5 (11.401 N, 95.1935 E)坐标的测点声速剖面使用拉格朗日插值法、最优点插值法(在反距离平方加权插值基础上,增加了龙格现象抑制)、样条插值法、Kriging法进行拟合。其中Kriging法常见的趋势函数分零阶、一阶、二阶多项式三种,而所使用的半变异函数则包含指数函数、广义指数函数、高斯函数、线性函数、球状函数、三次样条函数六种。对应生成各拟合数据与实测数据的曲线对比图。

Figure 1. Comparison of fitting curves by lagrange interpolation

1. 拉格朗日插值拟合曲线对比图

Figure 2. Comparison of fitting curves by optimal point interpolation

2. 最优点插值拟合曲线对比图

图1所示,2站、3站拉格朗日插值法对于声速剖面的拟合曲线在0 m~100 m、150 m~300 m处显著偏离实际声速值。4个站位在0 m~400 m有显著异常偏离,极值出现在200 m处,因为200 m附近是海洋声速跃层区,4个站位拉格朗日是3次多项式拟合,跃层处声速差做高次插值,导致结果在跃层区出现过拟合。

图2所示,在最优点插值法反距离平方加权插值基础上,增加龙格现象抑制,使得拟合曲线相比拉格朗日插值更贴近实测数据,0 m~100 m和150 m~300 m处振荡减少,更平滑。

Figure 3. Comparison of Fitting Curves by Different Spline Interpolation Methods

3. 不同样条插值法拟合曲线对比图

图3所示,四种样条插值方法中,线性样条与三次样条拟合趋势相近且全水深偏差规律一致,最近邻样条整体拟合最不平滑,B样条在0 m~160 m拟合度最优但中深层存在分层偏差,浅水区插值优先选B样条,全水深兼顾稳定性可选线性或三次样条。

注:分别为kriging法的零阶,一阶回归模型在不同半变异函数处理情况下拟合声剖值与原始数据的对比曲线图。其中,大写字母表示使用的半变异函数,从A到F依次为指数函数、广义指数函数、高斯函数、线性函数、球状函数和三次样条函数;小写字母代表回归模型,a为零阶,b为一阶。

Figure 4. Comparison of fitting curves for sound speed profile data by kriging method

4. kriging法拟合声速剖面数据的曲线对比图

图4所示,不同函数搭配下的kriging插值法在处理声速剖面数据方面均有良好的拟合效果,但随着函数的变化,拟合效果也存在差异。

4. 误差检验分析

引入平均绝对误差(MAE)、平均相对误差(MRE)和均方根误差(RMSE)作为误差评价指标。其中,MAE是预测值与实际观测值之间差异的平均值,对异常值不敏感,也不能反映出误差的分布情况;MRE是预测值与实际观测值之间相对差异的平均值,与MAE不同,MRE考虑了观测值的数值,能反映估计值对于观测值的准确度:RMSE是预测值与实际观测值之间差异的平方的平均值的平方根[16] [17],可反映估计值的灵敏度与极值。三种误差指标的表达式为:

MAE= i=1 n ABS( y i y i ^ ) n (15)

MRE= 1 n i=1 n | ABS( y i y i ^ ) y i | (16)

RMSE= 1 n i=1 n ( y i y i ^ ) 2   (17)

其中, y i y i ^   分别是所预测站点声速剖面在深度 i 处的实际观测值和预测值, n 为参与误差检验的总点数。对上述各插值方法生成的曲线进行误差统计分析,得:

表1~4所示,常见插值方法中,最近邻样条插值最优(MAE 0.474, MRE 0.031%, RMSE 0.828),线性和三次样条插值次之,拉格朗日插值误差最大(MAE 5.198, MRE 0.345%, RMSE 7.802)。Kriging插值以零阶多项式和指数函数组合最优(MAE 2.4403, MRE 10.8515%, RMSE 0.9183)。

Table 1. Error analysis of curve fitting by common interpolation methods

1. 常见插值方法拟合曲线的误差分析

MAE

MRE (%)

RMSE

拉格朗日插值

5.198

0.345

7.802

最优点插值

0.770

0.051

1.181

线性样条插值

0.661

0.051

0.966

三次样条插值

0.665

0.044

1.112

最近邻样条插值

0.474

0.031

0.828

B样条插值

0.587

0.039

3.446

Table 2. MAE value of fitting data set by different functions of Kriging method

2. Kriging法不同函数设置拟合数据的MAE值

回归模型

指数函数

广义指数函数

高斯函数

线性函数

球状函数

三次样条函数

零阶多项式

2.4403

3.5019

3.5019

3.5019

3.5019

3.5019

一阶多项式

3.5019

3.5019

3.5019

3.5019

3.5019

3.5019

Table 3. MRE value of fitting data set by different functions of Kriging method (%)

3. Kriging法不同函数设置拟合数据的MRE值(%)

回归模型

指数函数

广义指数函数

高斯函数

线性函数

球状函数

三次样条函数

零阶多项式

10.8515

10.905

10.905

10.905

10.905

10.905

一阶多项式

10.905

10.905

10.905

10.905

10.905

10.905

Table 4. RMSE value of fitting data set by different functions of Kriging method

4. Kriging法不同函数设置拟合数据的RMSE值

回归模型

指数函数

广义指数函数

高斯函数

线性函数

球状函数

三次样条函数

零阶多项式

0.9183

0.9183

0.9212

0.9228

0.9228

0.9228

一阶多项式

0.9206

0.9206

0.9225

0.9226

0.9226

0.9226

最近邻样条、线性、三次样条、最优点插值更适配声速剖面数据的层状连续分布特征,其MAE、MRE均处于0.031%~0.051%的低误差区间,体现了声速场空间相关性的局部化特点;而拉格朗日插值因高次多项式特性易产生龙格震荡,导致误差(MAE 5.198, RMSE 7.802)显著偏高;Kriging插值依赖数据空间相关性建模,其最优组合(零阶多项式 + 指数函数)的MAE (2.4403)和MRE (10.8515%)仍远高于最优传统插值,核心原因是声速剖面的垂直分层相关性与Kriging假设的空间连续相关性不匹配。

5. 总结

海洋声速剖面数据具有跃层突变与层状连续的特征,不同插值方法的适配性存在差异:拉格朗日插值法易在跃层区产生过拟合,导致拟合曲线显著偏离实测值;最优点插值通过反距离平方加权与龙格现象抑制,可有效降低振荡,拟合更贴近实测;样条插值中,B样条拟合浅水区更适配;线性与三次样条能兼顾全水深,更稳定;最近邻样条平滑性最差;kriging插值拟合的声速剖面曲线整体分布上表现更均匀,出现极端误差值的概率最低,但其局部精确度上弱于其他插值方法,累计误差高且均匀分布于各个深度,因此关键点是要对声速数据随深度分层,以及继续调配变异系数和回归模型。总而言之,声速剖面插值需规避高次多项式过拟合风险,浅水区优先选择B样条,全水深兼顾稳定性可选线性样条、三次样条或Kriging插值,对振荡抑制有需求时可选用最优点插值。

需要补充的是,本文结论是对于深度较浅海域的声速剖面插值处理得到的,而且不存在无条件适用的最优方法。另外,参与计算剖面数据较少,结论会受到偶然性影响。后续应在不同海洋环境下进行更多深海声速剖面数据的计算整理,反复尝试,一定能够建造更加精确的插值拟合模型,进一步提高拟合声速剖面曲线的准确性和稳定性。

参考文献

[1] Huang, W., Lu, J.P., Lu, J.J., et al. (2025) STNet: Prediction of Underwater Sound Speed Profiles with an Advanced Semi-Transformer Neural Network. Journal of Marine Science and Engineering, 13, Article 1370. [Google Scholar] [CrossRef
[2] Zhang, W., Jin, S.H., Bian, G., et al. (2024) A Method for Full-Depth Sound Speed Profile Reconstruction Based on Average Sound Speed Extrapolation. Journal of Marine Science and Engineering, 12, Article 930. [Google Scholar] [CrossRef
[3] Yuan, Q. and Xu, W.M. (2025) A Deep Sea Sound Velocity Profile Inversion Method Combining World Ocean Atlas 2023 Data and Real-Time Surface Sound Velocity. International Conference on Remote Sensing, Mapping, and Image Processing (RSMIP 2025), Sanya, 17-19 January 2025, 136501C. [Google Scholar] [CrossRef
[4] Yang, X., Tartakovsky, G. and Tartakovsky, A.M. (2021) Physics Information Aided Kriging Using Stochastic Simulation Models. SIAM Journal on Scientific Computing, 43, A3862-A3891. [Google Scholar] [CrossRef
[5] Taylor, R.T. (2023) Inference of the Ocean Sound Speed Profile Using Ambient Vertical Beam Noise. University of Texas.
https://hdl.handle.net/2152/121139
[6] 周芃希, 胡涛, 王臻, 等. 基于拖曳设备稀疏深度感知的深海声速剖面重构及声场预报[J]. 声学学报, 2025, 50(3): 622-633.
[7] Geyer, F., Gopalakrishnan, G., Sagen, H., Cornuelle, B., Challet, F. and Mazloff, M. (2023) Data Assimilation of Range-And Depth-Averaged Sound Speed from Acoustic Tomography Measurements in Fram Strait. Journal of Atmospheric and Oceanic Technology, 40, 1023-1036. [Google Scholar] [CrossRef
[8] 罗宇, 程梦迪, 李倩倩, 宋熙昭, 施剑. 基于二次多项式拟合的超短基线声线修正方法[J]. 海洋通报, 2023, 42(1): 42-47.
[9] 马海波, 来向华, 胡涛骏, 等. 基于无人机摄影测量的潮间带单波束测深空间插值精度评估[J]. 海洋学研究, 2024, 42(1): 83-90.
[10] Chen, P., Li, Y., Su, Y. and Chen, X. (2014) The Improved Kriging Interpolation Algorithm for Local Underwater Terrain Based on Fractal Compensation. Mathematical Problems in Engineering, 2014, Article 289521. [Google Scholar] [CrossRef
[11] 孙晓芳, 张世崧. 基于Bellhop的中尺度涡声传播特性分析[J]. 海洋科学前沿, 2023, 10(3): 145-151.
[12] 刘伯胜, 黄益旺, 陈文剑, 等. 水声学原理[M]. 北京: 科学出版社, 2019: 21-23.
[13] 张仁和. 中国海洋声学研究进展[J]. 物理, 1994(9): 513-518.
[14] 贲晛烨. 基于线性插值的特征模板构造的步态识别算法[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工程大学, 2009.
[15] Brezinski, C. and Redivo-Zaglia, M. (2024) A Family of New Generating Functions for the Chebyshev Polynomials, Based on Works by Laplace, Lagrange and Euler. Mathematics, 12, Article 751. [Google Scholar] [CrossRef
[16] Abdullayev, F.G. and Imashkyzy, M. (2022) On the Growth of Derivatives of Algebraic Polynomials in a Weighted Lebesgue Space. Ukrainian Mathematical Journal, 74, 664-684. [Google Scholar] [CrossRef
[17] 曹可劲, 马恒超, 朱银兵, 李豹. 多项式插值算法处理GNSS精密钟差数据适应性研究[J]. 舰船电子工程, 2019(9): 171-175.
[18] 陈兆林, 张书毕, 佟瑞菊. 用拉格朗日多项式内插计算GPS卫星位置[J]. 全球定位系统, 2007(2): 33-35.
[19] Zhao, T.T., Ye, T.G., Chen, Y.H., et al. (2024) A Fast Chebyshev Spectral Approach for Vibroacoustic Behavior Analysis of Heavy Fluid-Loaded Baffled Rectangular Plates with General Boundary Conditions. Thin-Walled Structures, 196, Article 111518.
[20] Duan, B.S., Zhou, S., Li, L.Z., et al. (2024) Improving Monthly Mean Land Surface Temperature Estimation by Merging Four Products Using the Generalized Three-Cornered Hat Method and Maximum Likelihood Estimation. Remote Sensing of Environment, 302, Article 113989. [Google Scholar] [CrossRef
[21] Ciesielski, M. (2024) Numerical Algorithms for Approximation of Fractional Integrals and Derivatives Based on Quintic Spline Interpolation. Symmetry, 16, Article 252. [Google Scholar] [CrossRef
[22] Hong, Q.Z., Niu, Y., Wang, Q.Y., et al. (2024) Prediction of Flow Stress in Isothermal Compression of Hydrogenated TC17 Alloy Using Multiple Prediction Models. Materials Today Communications, 38, Article 108011. [Google Scholar] [CrossRef
[23] Zhang, F., He, Y.L., Zhou, K.P., et al. (2024) Error Analysis and Correction Method of Multi-Core Fiber Sensing. Optical Fiber Technology, 82, 103649.
[24] Wang, D., Pei, L., Zheng, J., Wang, J., Wang, L., Hou, W., et al. (2024) Comparative Experimental Study of Different Fetch Distances, Interpolation Algorithms, Source Substrate Noise, Sampling Point Counts, and Resolution for NF of BDFA. Optics & Laser Technology, 176, Article 111043. [Google Scholar] [CrossRef
[25] 李俊晓, 李朝奎, 殷智慧. 基于ArcGIS的克里金插值方法及其应用[J]. 测绘通报, 2013(9): 87-90+97.
[26] Miao, C. and Wang, Y. (2024) Interpolation of Non-Stationary Geo-Data Using Kriging with Sparse Representation of Covariance Function. Computers and Geotechnics, 169, Article 106183. [Google Scholar] [CrossRef
[27] Gómez, L.J., Pastoriza, T.F., Álvarez, G.E., et al. (2020) Comparison between Geostatistical Interpolation and Numerical Weather Model Predictions for Meteorological Conditions Mapping. Infrastructures, 5, Article 15. [Google Scholar] [CrossRef