1. 引言
人工神经网络在陆地水文资源应用较深入,而在土壤水盐环境预测方面比较薄弱。国外学者对人工智能与地质统计学做了大量应用研究[1] -[12]。国内区域土壤水盐和地下水动态预报方面如杨建强(1999)[13] 、赵辉(2000)[14] 对地下水(盐)与相关因素的关系进行分析后,建立了预报地下水(盐)动态的人工神经网络模型。屈忠义(2002,2003)[15] -[16]就人工网络技术在区域土壤水(盐)预报中的运用进行了系统研究,建立了地下水(盐)、土壤水(盐)动态预报模型,但仅局限于一维空间。刘全明(2006)[17] 使用BP神经网络进行了区域性土壤水盐动态监测研究。研究发现神经网络较传统统计分析方法也有某些不足之处,如它不具有统计分析的显著检验性,常用的BP算法学习训练收敛缓慢,算法不完备性,网络容错能力差,以致预测效果有时不好。
非参数统计理论的代表方法指示克立格法自创立以来,在国外广泛用于地质(Fytas和Chaouai,1990)[18] 、土壤(Gooyaerts,Webster和Dubois,1997)[19] 、水文(Neuman,2003)等领域,成为一种直接估计局部区域品位分布的数学地质新方法。20世纪90年代开始在我国地学及土壤学科应用,鲜有报导:如地质矿产(侯景儒 1990)[20] 、土壤水文(李保国,胡克林2001)[21] ,水库工程地质(吴容,周志芳2004)[22] ,农业水土工程(徐英、陈亚新 2006)[23] 均有一定成效,但多为局部估计的初步试探。
参数的统计分析如普通克立格法等是以数据服从正态分布的统计假设为前提,而这些假设实际往往难以成立,如要事先预知其线性或非线性程度是困难的,且评价模型不具有应变能力。学者在引进非参数理论如指示克立格、析取克立格法后有了一定改善,可在不处理特异值的前提下进行无分布统计分析,但统计分析法完全沿着固有路径去解决非线性问题较难,而用人工智能技术就能较好解决,需借鉴新兴学科的人工智能思想和方法充实改造统计分析。但人工神经网络较统计分析也有不足之处,它不具有统计分析的显著检验性,需要将两者融合起来,使两者在保持原有功能的基础上,扩充新的额外功能并融为一体,这正是目前学科前沿发展的需要与薄弱之处。由于水科学和土壤科学是当今资源科学中最具有活力和发展生产的重要基础,已成为经济建设和社会发展广泛关注的热点,有必要专门研究[24] -[26]。
本文在非参数统计与人工智能技术的应用研究基础上,探讨了指示克立格与BP神经网络技术的融合,提出了人工神经指示克立格新技术,发现其继承了指示克立格与人工神经网络的优点,可用于空间估计。
2. 人工神经指示克立格原理
将非参数统计与人工智能技术融合的主要思路有:一是基于统计分析的神经网络。如用统计分析对训练样本进行预处理,通过统计量来刻划样本之间或网络节点之间的相似性,确定最佳隐节点(如自构BP网络),将统计分析的显著性检验思想移植到网络输出中,增加网络解释功能。二是基于神经网络的统计分析。对一些输入与输出关系明显的问题,利用这种手段是非常有效的。融合原理的研究是利用两者的不同点,将两者的优势结合起来,使两者在保持原来功能的基础上扩充额外的特殊功能,也基于两者的相似点,即将两者在某一相似点的重叠使两者融为一体,是改变和补充传统研究思维的新途径,已经引起国内外空间变异研究者的关注。融合处理在国外理论研究虽有少数成绩,但在向应用研究过渡方面还比较薄弱。Rizzo等(1994)[1] 首先提出了用于含水层特性和土壤物理化学的ANN-Kriging法,形成一种新的数据驱动方法,在不需要地统计学的协方差函数时也能给出空间变异资源品位的简便估计和空间格局,重现区域化变量的变异图形,由于这种ANN可以完成普通克立格法的运算目标,也称人工神经Kriging法,它可以产生相对样本偏差的无偏估计,实质上具有类似指示克立格法的功能,虽研究指出该法也具有条件模拟的功能,但在其成果中尚未有具体案例。
本研究的思路是按照指示克立格的思想,选定n − 1个阈值,将空间划分为n个类型,原始数据属于某类型则其指示概率值为1,否则为0,如此把原始采样数据转换为n个类型的0、1型数据,对转换后指示概率数据,直接采用BP神经网络技术计算未知点属于n个类型的概率;然后利用各属于n个类型的原始数据,用BP神经网络技术在未知点处估值;最后将未知点属于某类型的概率乘以其估值求和即为该点的融合估计结果。该方法仅采用了指示克立格法使用阈值划分空间类型的思路,不涉及指示变异函数与指示克立格方程组的复杂解算,充分借助BP神经网络技术对未知点进行属于某空间类型的概率及估值。
设在任一研究区域例如某灌区试验区D内,取样并测定其含水率或含盐量,若该区域内选定的临界值(即阈值)为
,则小区D被阈值划分为
个水分或盐分分布类型
,样品点属于
类型的数量分别为
个,D内每一个样品点
上可定义一个阶梯函数:
(1)
公式(1)中
表示空间点
属于
类型的概率,此处用BP神经网络技术获取
的估计量
,也可以理解为条件概率。
用
周围属于
类型的样品值
估计空间点
在
类型域的值
,考虑融合继续用BP神经网络技术进行估计。最后按式(2)计算未知点
的估计值
:
(2)
3. 案例分析
3.1. 采样系统设计
研究区域设在黄河河套灌区内的沙壕渠实验区。野外采样面积为4 km2,用手持GPS接收机定位。以基本滞后距h = 200 m间隔(采样点数为121个,中等田间尺度)网状进行采样,并在纵、横两条中线上将采样点间隔加密为50 m(加密采样点数为60个),主要用于外部可靠性检验与土壤水盐空间变异的尺度效应分析研究。采样分两层取土,深度为0~20、20~40 cm,土样的测定分析项目为含水率
和电导率EC、pH值,反映土壤的水盐变化。采样点布置见图1。
3.2. 人工神经指示克立格与其他方法的比较
篇幅所限,本文以0~40 cm层土壤盐分模拟为例,将人工神经指示克立格融合方法与普通克立格(Ordinary Kriging,简写为OK)、指示克立格(Indicator Kriging,简写为IK)、析取克立格(Distinctive Kriging,简写为DK)及BP神经网络估计方法进行比较分析。在指示克立格阈值选择研究[21] 的基础上盐分阈值选择0.2 ms/cm、0.4 ms/cm、0.6 ms/cm、0.8 ms/cm四个,按所选阈值将盐分空间划分为小于0.2 ms/cm、0.2 ms/cm~0.4 ms/cm、0.4 ms/cm~0.6 ms/cm、0.6 ms/cm~0.8 ms/cm和大于0.8 ms/cm五个空间类型。按照五个类型将0~40 cm层土壤盐分原始数据进行非参数转换,获取121个采样点盐分所属空间类型的指示概率,见表1。以表1所示五个类型121个采样点指示概率建立BP神经网络模型,经学习训练与误差检验
Figure 1. Sample net map of Sha Hao Qu test region
图1. 沙壕渠实验区采样点网格图
Table 1. Indicator probability of raw salt in 40 cm soil layer
表1. 0~40层土壤盐分原始数据指示概率
后,按50 m间隔内插求得
的估计量
,也即条件概率,见表2。以五个类型采样点盐分值(数量不同)建立BP神经网络模型,经学习训练与误差检验后,按50 m间隔内插求得
的估计量
,见表3。按公式(2),将表2、表3对应行相乘求和即为人工指示克立格估计结果,见图2。
Table 2. Indicator probability estimate value of salt in 40 cm soil layer(Units:%)
表2. 0~40层土壤盐分概率估值(单位:%)
Table 3. Salt estimate value in 40 cm soil layer (Units: mS/cm)
表3. 0~40层土壤盐分估值(单位:mS/cm)
Figure 2. Artificial Neural Indicator Kriging estimate value of salt in 40 cm soil layer
图2. 0~40层土壤盐分人工神经指示克立格估值
经误差检验发现OK法、IK法、DK法平均检验误差均为0.20 ms/cm,图3所示误差曲线分布较相似。而BP法平均检验误差最大为0.28 ms/cm,误差曲线波动较大;融合法平均检验误差最小为0.13 ms/cm,误差曲线波动较小。检验误差超过0.50 ms/cm的个数OK法3个、BP法17个,而IK法、DK法、人工神经指示克立格法均为6个;检验误差超过1.00 ms/cm的个数OK法0个、BP法11个,而IK法、DK法、人工指示克立格法均为1个。可见人工神经指示克立格法具有估计误差小且均匀的特点,减弱了BP法估计误差较大且分散的弱点,具有非参数统计IK法、DK法受特异值影响小的优点。对五种方法估计数据进行统计分析见表4。表4数据表明五种估计方法的均值与实测值相同或接近,BP与人工神经指示克立格法的估计范围与实测值较相近,且标准差与实测值在一个数量级,而OK法、IK法、DK法估计范围较窄且标准差较小,具有某种数据平滑趋势。可见人工神经指示克立格法综合了BP与IK的优点。
4. 结论
人工神经指示克立格法具有指示克立格的优点,即对数据无统计假定,不涉及特异值识别与处理,又可以高度逼近线性与非线性函数,很好地解决非线性估值问题,具体表现为人工神经指示克立格法具有估计误差小且均匀的特点,减弱了BP法估计误差较大且分散的弱点,估计范围与实测值较相近,且标准差与实测值在一个数量级,具有非参数统计法受特异值影响小的优点,可用于土壤水盐监测与评价工作中。
Figure 3. Error verifying map of salt in 40 cm soil layer
图3. 0~40层土壤盐分误差检验图
Table 4. Statistic analysis results of five methods for salt in 0-40 cm soil layer (Units: mS/cm)
表4. 0~40层土壤盐分五种方法估计结果统计分析(单位:mS/cm)
基金项目
国家自然科学基金项目(51249007)、内蒙古自然科学基金项目(2013MS0609)资助。

NOTES
作者简介:刘全明(1973-),男,内蒙古四子王旗人,硕士生导师,副教授,博士,国家注册测绘师,国家注册土地估价师,主要从事测绘工程教学与科研,以及水土资源的空间变异理论与应用研究。