基于IWOA-BP的草原土壤湿度预测研究
Research on the Prediction of Grassland Soil Moisture Based on IWOA-BP
摘要: 本研究针对传统BP神经网络模型表达能力和预测精度较低的问题,提出了一种基于鲸鱼优化算法(WOA)的改进神经网络预测模型。通过构建时间序列预测模型,对降雨量、NDVI和LAI等缺失数据进行修补,显著提升了数据完整性和模型预测能力。优化后的模型被用于预测2022年和2023年不同深度土壤湿度数据,为草原状态监测提供了精确的基础数据支持,具有重要的应用价值。
Abstract: In this study, an improved neural network prediction model based on Whale Optimization Algorithm (WOA) is proposed to address the problem of low expressive ability and prediction accuracy of traditional BP neural network model. By constructing a time series prediction model and patching the missing data such as rainfall, NDVI and LAI, the data completeness and model prediction ability were significantly improved. The optimized model was used to predict soil moisture data at different depths in 2022 and 2023, which provides accurate basic data support for grassland condition monitoring and has important application value.
文章引用:张鹤. 基于IWOA-BP的草原土壤湿度预测研究[J]. 建模与仿真, 2025, 14(3): 326-336. https://doi.org/10.12677/mos.2025.143226

1. 引言

草原生态系统是全球陆地生态系统的重要组成部分,不仅在碳循环、水资源调节等方面发挥着重要作用,还直接影响区域生态平衡与经济发展[1]。然而,随着人类活动的加剧,草原生态系统面临着日益严峻的退化威胁,其中放牧强度的不合理控制是草原退化的主要原因之一。研究表明,草原放牧策略显著影响草原的健康状况,尤其是动物的进食行为与降雨量对草原植被覆盖和土壤湿度具有关键作用[2]。土壤湿度不仅是衡量草原健康的重要生态指标,还在植被生长、碳储量平衡等方面具有重要意义。然而,长期过度放牧往往会引发植被退化、土壤水分流失和土壤沙化,从而导致草场生产力下降甚至土地荒漠化,这对区域生态系统和人类活动都构成了严重威胁[3]

当前,获取草原生态监测数据的技术手段逐渐成熟,但由于野外监测条件复杂,数据缺失问题仍然广泛存在,尤其是土壤湿度等多维生态指标的长期动态变化缺乏精准的预测与评估[4]。同时,传统的预测模型,如BP神经网络,在处理非线性和多变量生态数据时存在模型表达能力不足、预测精度不高等局限性。因此,开发一种高效、精准的预测模型以修复关键生态数据并提升预测精度,对草原生态管理与恢复具有重要意义[5]

本研究针对上述问题,基于时间序列预测模型,结合鲸鱼优化算法(WOA)对BP神经网络进行改进,构建了一种能够精准预测土壤湿度的模型。通过对降雨量、植被指数(NDVI)和叶面积指数(LAI)等关键生态数据的修复与预测,研究计算了2022年和2023年不同深度土壤湿度的动态变化。研究结果不仅为草原生态状态监测提供了可靠的基础数据支持,还为优化草原放牧策略、防止草场退化和土地荒漠化提供了科学依据。

2. 模型建立

2.1. 时间序列预测模型

ARIMA模型(自回归移动平均模型)被广泛应用于时间序列数据分析[6],是一种预测精度较高的预测方法,其实质是差分运算与ARMA模型的组合,公式如下:

Φ( B ) Δ d X t =Θ( B ) ξ t (1)

E( ξ t )=0,Var( ξ t )= δ ξ 2 ,E( ξ t ξ s )=0,st (2)

E x s ξ t =0,s<t (3)

式中,B为延迟算子, X tp = B p X t Δ d = ( 1B ) d 为时间序列d阶差分。 Φ( B )=1 ϕ 1 B ϕ p B 为平稳可逆ARIMA模型的自回归系数多项式,p为自回归阶数。 Θ( B )=1 θ 1 B θ q B q 为平稳可逆ARIMA模型的移动平滑系数多项式,q为移动平滑阶数。化简的ARIMA模型为:

Δ d X t = Θ( B ) Φ( B ) ξ t (4)

(1) 参数d的确定

时间序列平稳性可通过自相关函数(ACF)和偏自相关函数(PACF)判断。若一个截尾、另一个拖尾,则序列平稳;若均拖尾,则为非平稳序列。非平稳序列需差分处理,以消除趋势性或周期性影响,使其平稳。差分后需重新绘制ACF和PACF图检验,若仍非平稳,则继续差分,直到满足平稳性条件。通常,差分阶数(d值)控制在1或2,以避免引入噪声。最终确定合适的d值,为后续ARIMA建模提供基础。

(2) 参数pq的确定

在ARIMA时间序列预测中,参数pq的确定依赖于ACF和PACF的特征。若PACF在某一阶数截尾,而ACF拖尾,则可选该截尾阶数作为p。若ACF截尾而PACF拖尾,则q取ACF的截尾阶数。若二者均拖尾,可能需要较高阶的ARMA模型或进一步差分处理,合理确定pq有助于提高ARIMA模型的预测精度和稳定性。

2.2. 改进的鲸鱼算法

(1) 鲸鱼算法

鲸鱼算法(Whale Optimization Algorithm)是基于模仿自然界中座头鲸独有的捕猎方式而诞生的一种元启发式群体智能优化算法。算法包括包围猎物、搜索猎物和气泡网攻击3个阶段。

i) 包围猎物

鲸鱼算法中每头鲸鱼的位置向量代表一个解,随迭代次数增加,鲸鱼个体不断更新位置朝猎物靠近,实现收缩包围猎物,计算公式如下

X k j+1 = X k * A 1 D k (5)

D k =| C 1 X k * X k j | (6)

A 1 =2a r 1 a (7)

C 1 =2 r 2 (8)

a=2 2t t max (9)

其中, a 随着迭代次数的增加线性递减, A 1 C 1 为系数, r 1 r 2 是[0, 1]间的随机数。

ii) 搜索猎物

当鲸鱼在随机选择位置时,算法设定当 A>1 时,随机选择一个搜索代理,根据随机选择的位置来更新其他鲸鱼的位置,迫使鲸鱼偏离选择的猎物,去寻找更合适的猎物;当 A<1 时,选择最优位置的鲸鱼执行局部搜索,加强算法的寻优能力有利于鲸鱼算法的全局搜索。

D=| C X rand Xt | (10)

X( t+1 )= X rand AD (11)

iii) 气泡网攻击

鲸鱼群确定目标,通过不断更新自身位置和收缩包围来攻击目标猎物,螺旋式更新位置表示过程如下

X( t+1 )=D e bl cos( 2πl )+ X * ( t ) (12)

式中, l 为[0, 1]之间的随机数, b 为常数参数。

(2) 鲸鱼算法的改进

为加强鲸鱼算法种群多样性并提高算法的寻优效率,IWOA算法采用混沌映射初始化种群策略。利用混沌变量的随机性、遍历性特点,生成多样性较好的混沌初始种群。选择迭代速度、遍历性和均匀性更好的Logistic-Tent混沌映射初始化种群。将混沌映射生成的混沌序列映射到解空间内得到多样性更好的初始鲸鱼种群,从而扩大算法寻优搜索范围。

Logistic-tent混沌映射原理:

y i+1 ={ mod[ r y i ( 1 y i )+ 4r 2 y i ,1 ], y i [ 0,0.5 ) mod[ r y i ( 1 y i )+ ( 4r )( 1 y i ) 2 ,1 ], y i [ 0.5,1 ] (13)

式中,r为控制参数, r( 0,4 ) y i [ 0,1 ] ,混沌序列产生:即在 y i [ 0,1 ] 内生成第i个混沌值,由式(11)生成共N个混沌值,组成混沌序列。根据式(12)将混沌序列映射到初始种群搜索空间内:

x ij =l b j + y ij ( u b j l b j ) (14)

保存y序列并映射到解空间内得到鲸鱼初始种群,进入鲸鱼算法主循环。

图1给出TCM算法与随机数之间的比较,其中蓝色圆圈和红色三角分别表示采用混沌模型和随机数进行初始化的结果。从图中可以看出:随机数取值集中在椭圆框内,而在矩形框内几乎没有取值,这表明随机数可能会导致种群的单一性和局限性。为了维持种群的多样性和覆盖性,避免算法陷入局部最优解,可以使用TCM模型对鲸鱼初始种群进行生成。TCM模型能够在解空间中实现种群的均匀分布,从而增强算法的全局搜索能力,提高搜索效率。

Figure 1. Comparison between TCM algorithm and random numbers

1. TCM算法与随机数之间的比较

由于传统BP神经网络在提高模型的表达能力和预测准确性相对较差[7],因此通过引入改进的鲸鱼算法优化神经网络,可以有效地提高训练效率和模型收敛速度,使得神经网络能够更快地学习和适应不同的任务[8]

鲸鱼算法优化BP神经网络的核心是利用鲸鱼算法优化BP神经网络的初始权值和阈值[9],然后将BP神经网络的训练误差作为个体适应度值,将得到最优神经网络权值和阈值传递给BP神经网络训练模型,从而达成BP神经网络收敛速度和精度提升的目的。

IWOA-BP新型智能算法的具体过程如下:

1) 初始化:初始化鲸鱼种群,种群由一组候选解组成,这些候选解代表BP模型的参数值(C, g, p),根据每个参数可以取值的范围定义搜索空间,初始种群在搜索空间内随机生成,完成初始化;

2) 适应度评估:使用BP模型评估每个候选解的适应度,选择验证集中预测值和实际值之间的均方误差作为适应度函数,BP模型在一组训练数据上进行训练,并在一组验证数据上评估适合度;

3) 选择:从种群中选择最佳候选解决方案,该选择基于候选解决方案的适应度值;

4) 复制:将上一步选择的最优解决方案复制,来创建新的候选解决方案,复制过程是类似于领头鲸(最优解)的自然选择过程,吸引更多的跟随鲸(待选解),从而达到繁殖目的;

5) 突变:随机修改候选解的一些参数,以将多样性引入种群,确保算法不会陷入局部最优,并且可以有效地探索搜索空间;

6) 终止:重复上述步骤,直到满足停止标准,即达到期望的适应度MSE达到最小值;

7) 输出:输出算法找到的BP最佳解。

具体的IWOA-BP新型智能算法预测模型的寻参优化流程如图2所示。

Figure 2. Flowchart of parameter-seeking optimization for IWOA-BP prediction model

2. IWOA-BP预测模型的寻参优化流程图

3. 模型求解

3.1. ARIMA模型求解

将原始时间序列数据导入SPSS软件中进行平稳性检验,原始数据PACF图如图3所示,系数围绕零轴上下小范围波动,因此判定原始时间序列为非平稳序列。1阶差分后数据趋于稳定,原始序列一阶差分后ACF、PACF分别为1阶、2阶截尾。由平稳性检验可得(p, d, q)为(1, 1, 2)。

Figure 3. PACF plot of raw data

3. 原始数据PACF图

由于受到外部环境和监测水平因素的制约,使得部分数据缺失,缺失数据会对模型精确度产生干扰,甚至导致输入量缺失,无法对模型进行求解。通过ARIMA时间序列预测对植被覆盖率的缺失值进行修补,结果如表1所示。

Table 1. Vegetation cover patch data for 2021

1. 2021年植被覆盖率修补数据

经度

纬度

覆盖率

时间

115.375

44.125

0.3

2021-09-10

115.375

44.125

0.264

2021-09-20

115.375

44.125

0.196

2021-09-30

115.375

44.125

0.136

2021-10-10

115.375

44.125

0.08

2021-10-20

115.375

44.125

0.048

2021-10-31

115.375

44.125

0.044

2021-11-10

115.375

44.125

0.040

2021-11-20

115.375

44.125

0.036

2021-11-30

115.375

44.125

0.032

2021-12-10

115.375

44.125

0.028

2021-12-20

115.375

44.125

0.024

2021-12-31

利用LAI历史数据、气候历史数据等进行计算可求出2020~2022年不同放牧强度下的土壤含水率,结果如图4所示。

Figure 4. Soil water content at different grazing intensities

4. 不同放牧强度下的土壤含水率

图4可知,不同放牧强度下土壤含水率存在一定差别,并非随着放牧强度的增强而下降,而是呈现出“N”形变化,在无牧和中度放牧的情况下土壤湿度较高,这与羊草等植物的变化趋势一致,故体现出放牧强度影响着植被生物量,间接影响土壤湿度,如图5所示。放牧活动间接的作用于土壤,牧群踩踏会踏实影响土壤的容重,降低土壤含水率,这种效应需要时间积累,土壤湿度的变化会随着放牧强度的变化而变化,但存在一定的延时效应。

Figure 5. Plot of soil moisture relationship

5. 土壤湿度关系图

3.2. IWOA-BP模型求解

土壤湿度是由土壤蒸发量,土壤降水量等多种变量共同作用的结果。其中,输入变量8组,包括“土壤降水量”、“LAI”、“NDVI”等数据。输入层节点数为8,输出层节点数为1,即土壤湿度。

隐含层节点的选取公式为:

m= i+j +c (15)

式中, m 为隐含层的节点数, i 为输入层的节点数, j 为输出层的节点数,其中, c 为常数。

根据公式可得,隐含层的节点范围为(4, 12),为寻找最优隐含层节点数。对隐含层节点数从4开始训练,一直训练到12,对比分类预测回归质量寻得最优节点数为7。因此,IWOA-BP神经网络模型的结构为8-7-1,模型运算回归曲线如图6所示:

Figure 6. Soil moisture regression curve

6. 土壤湿度回归曲线

利用IWOA-BP预测模型对2022年4月~12月10 cm、40 cm、100 cm和200 cm深度的土壤湿度进行预测,得到土壤湿度预测值如图7所示。

由图可知,IWOA-BP数据预测效果极好,对于100 cm与200 cm的土壤湿度,预测值基本接近真实值,波动不大;对于周期性变化较小的40 cm处土壤湿度的预测精度也较好,由于10 cm处周期性波动较大,因此预测精度略微有所下降,但仍在允许的范围内。

(a) 10 cm土壤湿度预测值 (b) 40 cm土壤湿度预测值

(c) 100 cm土壤湿度预测值 (d) 200 cm土壤湿度预测值

Figure 7. Projected soil moisture in 2023

7. 2023年土壤湿度预测值

4. 结果与讨论

本文分别建立了用于缺失数据补全的时间序列预测模型与土壤含水量预测模型,可以对土壤湿度进行求解,得到了不同深度土壤湿度的计算值与预测值(仅选取部分结果展示),如图8所示。

由图可知,传统公式计算得到的土壤湿度值与实际观测数据存在较大偏差,整体精度较低,尤其是在浅层土壤(如10 cm处),误差较为明显。而基于IWOA-BP (改进鲸鱼优化算法–反向传播神经网络)的预测模型在不同深度的土壤湿度预测中表现更优,与实际值的吻合度较高,尤其是在100 cm和200 cm深度处,预测结果与实测数据基本一致,表明模型具有较好的适应性和泛化能力。

在较深的土壤层(100 cm及200 cm),由于土壤环境相对稳定,受外界干扰因素较少,如牧群踩踏、植被根系吸收及蒸散作用等对其影响有限,同时深层土壤水分具有较长的滞后效应,累积效应显著,使得土壤湿度在较长时间尺度内保持较高且稳定的水平。因此,IWOA-BP预测模型在深层土壤湿度的拟合度较高,误差较小。然而,在10 cm浅层土壤,由于直接暴露于外部环境,其湿度受降水、蒸发、风速、温度变化以及牧群活动等因素影响较大,导致土壤水分呈现明显的周期性波动。这种波动不仅幅度较大,而且短期内变化剧烈,给预测模型带来了较大的不确定性和挑战。因此,相较于深层土壤,浅层土壤的预测误差较大,精度略有下降。但从整体上看,IWOA-BP预测模型仍然较好地捕捉到了土壤湿度的变化趋势,证明该模型在锡林郭勒草原土壤湿度预测方面具有较强的适用性和可靠性。

(a) 10 cm土壤湿度趋势图 (b) 40 cm土壤湿度趋势图

Figure 8. Soil moisture results map

8. 土壤湿度结果图

将数据代入预测模型,得到原有放牧策略下2022年、2023年不同深度土壤湿度的预测结果,如表2所示。

Table 2. Projections of different soil moisture levels in 2022 and 2023

2. 2022年、2023年不同土壤湿度预测表

年份

月份

10 cm湿度(kg/m2)

40 cm湿度(kg/m2)

100 cm湿度(kg/m2)

200 cm湿度(kg/m2)

2022

04

13.74

47.36

94.18

164.47

05

15.38

46.77

94.22

164.45

06

16.98

46.21

94.25

164.26

07

18.77

48.48

94.26

164.01

08

17.61

48.80

94.27

163.70

09

17.00

47.71

94.28

163.39

10

15.94

46.58

94.28

163.14

11

14.43

46.05

94.28

163.04

12

13.45

45.55

94.29

163.03

2023

01

14.16

45.54

94.27

163.08

02

15.17

45.54

94.32

163.10

03

16.20

45.53

94.35

163.11

04

17.03

45.53

94.36

163.10

05

17.50

45.53

94.37

163.08

06

17.58

45.52

94.37

162.89

07

17.31

45.52

94.37

162.65

08

16.84

45.52

94.38

163.34

09

16.34

45.52

94.39

163.04

10

15.92

45.51

94.40

161.79

11

15.67

46.52

94.40

161.68

12

15.60

46.51

94.53

161.66

参考文献

[1] 余波, 丁红梅. 基于多源数据融合的草原放牧综合管理模式研究[J]. 滁州学院学报, 2024, 26(2): 81-86+108.
[2] 曹颖, 张雪, 王小丹, 等. 放牧牲畜行为对高寒草地土壤-植物系统的影响研究进展[J/OL]. 生态与农村环境学报, 1-21.
https://doi.org/10.19741/j.issn.1673-4831.2024.0825, 2025-03-18.
[3] 吉思融, 陈霏璐, 李敏. 资源禀赋对牧户草地保护意愿与行为悖离的影响研究——基于生态认知的调节效应[J/OL]. 草地学报, 1-22.
http://kns.cnki.net/kcms/detail/11.2422.TN.20250102.1429.027.html, 2025-03-18.
[4] 张蕊. “双碳”目标下绿色生态循环畜牧业发展策略研究[J]. 饲料研究, 2025(1): 237-240.
[5] 王凯, 李重. 放牧策略对土壤与植被的影响及土壤湿度预测研究[J]. 软件工程, 2024, 27(9): 67-72.
[6] 张金涛, 程明月, 刘芷町. 融合分解与转置策略的多变量时间序列预测模型[J]. 南京大学学报(自然科学), 2025, 61(1): 58-70.
[7] 原佳林, 刘得星. 基于GA-BP神经网络的退役动力锂电池健康状态快速分选模型研究[J]. 科技创新与应用, 2025, 15(3): 29-32.
[8] 刘芳. 基于BP神经网络的建筑工程造价的快速预测研究[J]. 价值工程, 2025, 44(2): 23-25.
[9] 冯建鑫, 李昊阳, 巩建雄, 等. 基于改进鲸鱼优化算法的超声电机自抗扰控制[J/OL]. 系统工程与电子技术, 1-9.
http://kns.cnki.net/kcms/detail/11.3362.S.20241223.1103.006.html, 2025-03-18.