1. 引言
当平差系统不包含粗差且性态良好(非病态系统)时,经典最小二乘估计可以获得参数的最优估计值[1] [2],但是,当平差系统观测值中包含粗差时,观测值服从某种污染分布[3],此时,经典最小二乘估计解不再是最优的。关于粗差处理,大致可分为两种途径,即将粗差影响归入函数模型的均值漂移模型和将粗差影响归入随机模型的方差膨胀模型[4] [5]。前者通过假设检验法检测定位和删除粗差[5]-[7],后者通过残差“表现”采用分段定权的方式抑制粗差对数据处理结果的影响[8]-[10]。上述两种粗差处理方式,无论采取哪一种方式进行数据处理,其本质上都需要经过对粗差进行识别和定位的过程[4],在这个过程中,粗差识别总是以残差绝对值是否满足事先设定的阈值范围为依据判定粗差。然而,这样的粗差识别过程忽略了粗差边界的模糊性。一般认为,粗差是一种比正常条件下最大误差还要大的误差[11],其显著特征是“离群”,然而,无论是“大得多”还是“离群”都是一种相对模糊的概念,应当采用模糊数学的思想对粗差处理才比较合理。例如,若事先设定以2倍后验残差中误差为粗差判定的阈值标准,则当某一残差绝对值等于1.99999倍其后验残差中误差时被认为是正常值予以保留,而当另一残差绝对值等于2.00001倍其后验中误差时即被判定为粗差加以剔除,二者只相差0.00002,一般这样小的差异对于实际工程测量并不会造成任何影响,但是,二者在数据处理中却得到截然不同的处理方式,这显然是不合理的。本文旨在将模糊数学中的隶属度概念及隶属函数引入粗差处理中,以最大程度受粗差污染的标准化残差的模糊子集的隶属度值代替IGGIII抗差方案中直接以标准化残差绝对值为依据的等价权确定过程,理论及数值结果都表明,利用隶属度函数改进的IGGIII粗差处理方案(为方便,本文将改进的方法记为MF-IGGIII,意即Membership Function IGGIII)抗差性能更优,参数精度更高,结果更可靠。
2. 最大程度受粗差污染的标准化残差的模糊子集及其隶属函数
前文已述及粗差是一种比正常条件下最大误差还要大的误差,这种所谓“比最大误差还要大的误差”是一种模糊概念,因为对“最大误差”本身的判定并没有严格分明的界线,使得当给出1个误差时,能借以明确无误地得出该误差属于或不属于“最大误差”的结论。然而,此时,若引入隶属度概念,并根据某种规则给出其隶属度值,以此判定该误差多大程度属于“比正常误差还要大的误差”则是比较合适的,这就是模糊集合的基本思想。模糊集合可以用隶属函数来表示,根据模糊数学中关于模糊子集的相关理论[12],最大程度受粗差污染的标准化残差的模糊子集及其隶属函数定义如下:
设
为最大程度受粗差污染的标准化残差W的模糊子集,标准化残差绝对值
为论域U,则称映射
(1)
确定了一个U上的模糊子集
,映射
称为
的隶属函数,
称为
对
的隶属度。由上述定义可知,当
时,
完全属于
,即观测值
最大程度上受粗差污染,当
时,
完全不属于
,粗差对观测值
完全没有影响。随着
趋近于1,
属于
的程度也增大。大量实践及经验都表明,不同的模糊模型,其隶属函数曲线形状各不相同[12],但就测量平差中最大程度受粗差污染的标准化残差模糊子集的隶属函数而言,正常模式下,由系列
所描绘的曲线应当是一条以0和1为渐近线的二维平面曲线,该曲线表示标准化残差属于粗差的程度由小变大的过程,后文的算例分析将给予展示。
3. MF-IGGIII抗差估计原理
3.1. MF-IGGIII等价权函数
IGGIII抗差估计是我国学者周江文教授1989年提出的一种粗差处理方法[13],其本质上与其他稳健M估计一样,通过构建等价权函数利用选权迭代过程降低粗差对整个平差系统的不良影响。IGGIII估计将权函数分为三段,即正常段、可疑段和淘汰段,正常段保持原权不变,仍采用最小二乘估计,可疑段采用降权方式对大误差对参数估计的影响加以抑制,淘汰段则对超大误差给予剔除处理,具体IGGIII等价权函数表达式如式(2)所示[14]:
(2)
式中,
为观测值Li的残差Vi的标准化残差的绝对值,i表示迭代次数,k1和k2通常取经验值1.5和2.5,其含义是迭代过程中,各残差最小二乘估计验后中误差的1.5倍和2.5倍。
显然式(2)给出的IGGIII抗差方案是根据最小二乘残差在数值上是否位于或超过事先设定的残差范围定义等价权函数的,其依据是若观测误差无异常,即近似服从正态分布时,误差落在1.5倍中误差之外的概率仅为0.13,而落在2.5倍中误差之外的概率则降为0.01,据此,正常模式下,观测误差应具有一个明显合理的范围,若超出这个范围,则应予以降权或剔除。事实证明,IGGIII抗差方案是一种比较符合测量实际的粗差处理方法,能很大程度抑制粗差干扰带来的不良影响。但是,IGGIII抗差估计忽略了粗差本身是一个模糊变量的客观事实,模糊变量必然具有模糊性质,采用硬阈值对粗差进行分类处理可能会受最小二乘估计“均摊”效应(残差本身未超限但因粗差污染而超限)影响而出现“不公正”降权现象发生。针对此问题,本文受文献[15]启发,提出采用模糊数学中模糊子集隶属函数值代替式(2)中的标准化残差进行选权迭代过程。由于隶属度从概念上是一个弹性界线,不同于硬阈值,它可以将属于粗差程度大致相同的标准化残差给予相同的降权幅度,所以利用最大程度属于粗差的模糊子集的标准化残差隶属函数值代替标准化残差本身进行分段定权,可以极大改善受粗差污染的其它观测值残差被不合理赋权的问题。此时,相应的MF-IGGIII等价权函数定义变为:
(3)
式中,
表示由式(1)定义的标准化残差最大程度属于粗差的模糊子集的隶属函数,为避免迭代过程中权阵发生奇异,在淘汰段将权值用10−10代替。
3.2. MF-IGGIII中的隶属度函数
不同的模糊问题中其模糊子集的隶属函数是不同的,隶属函数确定方法也多种多样[12]。测量中的误差具有鲜明的特性,那就是观测误差一般都服从某种有界分布[4],文献[15]据此通过模糊统计的方法经过反复试验,最终给出一种符合测量误差实际的隶属函数,其具体形式如下:
(4)
式中
(5)
根据式(3)给出的等价权函数定义,MF-IGGII抗差估计步骤如下:
步骤1 根据具体平差问题确定观测值初始权阵,若为等精度,则直接用单位阵代替初始权阵,然后利用最小二乘估计获取初始残差V并计算获取标准化残差
;
步骤2 根据(4)式计算各标准化残差的隶属函数值,带入式(3)计算等价权;
步骤3利用步骤2获取的等价权,根据选权迭代停止条件
(本文取
),重复步骤1工作,更新参数和残差估值;
步骤4 结束迭代过程,输出参数估值。
4. 算例及分析
4.1. 算例描述
采用文献[11]例7~9观测数据。有一测角网,如图1所示,网中A、B、C、D是已知点,P1、P2是待定点,同精度观测获取了18个角度观测值,起算数据及观测值详见文献[11]。为分析本文方法的抗差性能,在数目不同的观测值上附加不小于
(其中
为单位权中误差)的粗差,进行如下粗差处理实验:
实验1:在观测序号为2、11、15、17的4个观测值上附加大小分别为−7.0″、7.0″、−5.6″、5.6″的粗差;
Figure 1. Reference [11] Angle measurement network
图1. 文献[11]测角网
实验2:在观测序号为2、7、11、15、17的5个观测值上附加大小分别为7.0″、6.8″、7.0″、−5.6″、5.6″的粗差;
实验3:在观测序号为2、7、10、11、15、17的6个观测值上附加大小分别为7.0″、6.8″、−6.8″、7.0″、−5.6″、5.6″的粗差;
针对以上3个数值实验,分别采用如下3种方案进行平差计算:
方案1:最小二乘估计;
方案2:IGGIII抗差估计;
方案3:MF-IGGIII抗差估计。
以上3种方案参数估计结果列于表1,为方便比较,可将未附加粗差的参数最小二乘估计结果
作为参数真值,并以各方案参数估值与真值之差的范数
作为各方案精度优劣的衡量指标,一并列入表1中。另外,为展示正常模式下标准化残差属于最大程度受粗差污染的标准化残差模糊子集的隶属函数曲线特性,本算例还绘制了不附加粗差情况下的最小二乘估计标准化残差的隶属函数曲线,如图2所示。
Figure 2. Membership curve of normal standardized residuals
图2. 正常模式下标准化残差的隶属度曲线
Table 1. Parameter estimation results
表1. 参数估计结果
实验 |
方案 |
参数估值 |
|
实验1 |
方案1 |
|
0.9688 |
方案2 |
|
0.9286 |
方案3 |
|
0.5952 |
实验2 |
方案1 |
|
1.0213 |
方案2 |
|
0.9742 |
方案3 |
|
0.6654 |
实验3 |
方案1 |
|
1.2887 |
方案2 |
|
1.2942 |
方案3 |
|
0.8704 |
4.2. 算例分析
从图2可以看出,当观测值中不包含粗差时,最大程度属于粗差的模糊子集
的标准化残差的隶属函数
是以0和1为渐近线的二维平面曲线,且当
时,
缓慢增加,从
增加到
;
时,
急剧增加,从
增加到
。特别地,若以2倍中误差作为淘汰界线,此时,计算
,
,说明MF-IGGII利用标准化残差的隶属函数进行分段定权,能很好地处理以2倍中误差为阈值的模糊界线问题;
时,
缓慢增长,例如
,
,
,
,
,直至以0为渐近线。可见,正常模式下,本文采用的标准化残差隶属函数与测量实际以及现行测量规范关于测量限差的规定都是非常吻合的。
从表1给出的数值实验结果来看,在实验1和实验2中,方案2和方案3的参数估计结果都一致地优于方案1,表明最小二乘估计不具备抗差能力;就方案2和方案3估计结果来看,当观测粗差从实验1的4个增加到实验2的5个时,方案3都比方案2的参数估计结果更优,这说明当量级相同且粗差个数相同时,MF-IGGIII抗差方法优于IGGIII抗差方法;而在实验3中,当观测粗差增加至6个时,方案1和方案2估计结果的精度相当,且参数估值与真值相比都发生扭曲,说明当粗差数目较多(达到总数的1/3)时,IGGIII抗差估计结果变得很不可靠,而方案3此时仍保持了与实验1中只有4个粗差时IGGIII抗差的精度水平,说明方案3具有更稳定的抗差性能。
5. 结论
1) 经典IGGIII抗差估计将残差分为正常、可疑和淘汰3段进行选权迭代过程,忽略了最小二乘残差是属于粗差这一概念本身具有模糊性的特点,应当采用模糊数学的方法处理粗差更为合理;
2) 本文引入最大程度受粗差污染的标准化残差的模糊子集的概念,并提出利用标准化残差属于该模糊子集的隶属函数值代替IGGIII抗差估计中直接以标准化残差为依据定义等价权函数的MF-IGGIII改进抗差估计方法,新方法充分顾及了残差属于粗差这一概念本身的模糊性,有效解决了以往硬阈值条件下属于粗差的程度近似相同但降权幅度却差异较大甚至被错误淘汰的不合理情况发生;
3) 观测值中包含粗差的个数、量级大小对于抗差估计的影响显著,粗差量级越大,数目越多,抗差估计结果会随之变差,但当粗差数目较少时,MF-IGGII参数估计结果及精度都显著地优于IGGIII;当粗差数目达到上限(本文实验3粗差个数达到6个,占观测值总量的1/3)时,IGGIII抗差性能急剧下降,仅与最小二乘估计结果相当。MF-IGGII抗差参数估计结果及精度较实验1和实验2也相对变差,但仍然达到了与实验1中仅包含4个粗差的IGGIII抗差结果的精度水平。总体来看,3种不同数目的粗差处理实验结果表明,与传统IGGIII抗差估计方法相比,参数估计值与真值差值范数指标在三个实验中,其精度分别提升了35.9%、32.5%和32.7%,表明其抗差性能相对比较稳定,结果更加可靠。
基金项目
1. 贵州省科学技术基础研究计划项目(黔科合基础[2017]1054);
2. 贵州省科技厅科技支撑计划项目:高分四号卫星和CYGNSS协同的贵州多云山区土壤湿度智能反演方法研究(黔科合支撑[2022]一般204);
3. 资源与环境测绘工程研究生工作站(2024GZZ17)。
NOTES
*通讯作者。