基于混合模型的草原土壤湿度动态预测
Dynamic Prediction of Grassland Soil Moisture Based on a Hybrid Model
摘要: 本文以内蒙古锡林郭勒草原为典型研究区,针对草原生态系统管理中土壤湿度精准预测的需求,提出了一种融合时间序列分析与BP神经网络方法的回归混合模型,旨在实现多深度土壤湿度的动态预测。基于2012~2021年长期观测的土壤湿度、蒸发量及降水量数据集,研究采用三阶段建模方法:(1) 构建单隐含层BP神经网络模型,以蒸发量和降水量作为输入变量,直接输出不同深度土壤湿度预测值;(2) 应用X11模型对各深度土壤湿度时间序列进行分解,提取季节成分、趋势成分和随机成分,采用Holt-Winters三参数指数平滑法建立时间序列预测模型;(3) 通过最优加权融合策略整合两种单一模型的预测结果,构建最终的回归混合模型。模型验证结果表明,该混合模型在预测精度上显著优于单一模型(MSE = 70.07, R2 = 0.93),能够准确捕捉土壤湿度的垂直分布特征和季节性动态变化规律,为草原生态系统的精准化管理及水资源优化配置提供了坚实的科学依据与技术支撑。
Abstract: This paper focuses on the Xilingol Grassland in Inner Mongolia as a representative research area. In response to the need for precise predictions of soil moisture within grassland ecosystem management, we propose a regression hybrid model that integrates time series analysis with BP neural network methods. The objective is to achieve dynamic predictions of soil moisture at various depths. Utilizing long-term observed datasets of soil moisture, evaporation, and precipitation from 2012 to 2021, this study employs a three-stage modeling approach: (1) A single-hidden layer BP neural network model is constructed, using evaporation and precipitation as input variables to directly output predicted values of soil moisture at different depths; (2) The X11 model is applied to decompose the time series data of soil moisture at each depth into seasonal components, trend components, and random components. Subsequently, the Holt-Winters three-parameter exponential smoothing method is employed to establish the time series prediction model; (3) The prediction results from both individual models are integrated through an optimal weighted fusion strategy to construct the final regression hybrid model. The verification results indicate that this hybrid model significantly outperforms individual models in terms of predictive accuracy (MSE = 70.07; R2 = 0.93). It effectively captures both vertical distribution characteristics and seasonal dynamic change patterns of soil moisture. This provides a robust scientific foundation and technical support for precise management practices in grassland ecosystems as well as optimal allocation strategies for water resources.
文章引用:刘莎莎, 孟燕. 基于混合模型的草原土壤湿度动态预测[J]. 应用数学进展, 2025, 14(9): 107-114. https://doi.org/10.12677/aam.2025.149404

1. 引言

草原生态系统作为全球陆地面积最大的植被类型,在维持生物多样性、调节气候和水土保持等方面具有不可替代的生态功能。中国拥有约3.55亿公顷草原资源,占全球草原总面积的6%~8%。内蒙古锡林郭勒草原作为典型的温带草原,年均降水量仅340 mm,既是我国重要的畜牧业生产基地,也是华北地区关键的生态屏障。自2003年“退牧还草”政策实施以来,该区域生态系统明显改善,但气候变化和人类活动的双重压力仍然威胁着草原生态安全。

土壤湿度作为连接大气–植被–土壤系统的关键参数,直接影响着草原植被生长、碳氮循环和放牧承载力[1]-[5]。准确的土壤湿度预测对于制定科学的草原管理策略、预防土地退化具有重要意义。然而,传统预测方法存在精度不足、难以捕捉非线性关系等问题[6]-[9]。因此,本研究旨在开发一种新型混合预测模型,整合时间序列分析和人工神经网络的各自优势,为草原生态系统管理提供更可靠的决策支持。

本文旨在构建一个多模型融合的土壤湿度预测框架,以解决放牧活动强度恒定时草原生态系统土壤水分的动态预测问题。基于土壤湿度、土壤蒸发量和降水量提供的多源观测数据[10],系统性地建立了2022~2023年不同土壤深度(10 cm、40 cm、100 cm、200 cm)的土壤湿度预测模型。在数据划分方面,采用2012年1月至2021年12月的连续观测数据作为训练集(n = 120个月),2022年1月至3月的数据作为独立测试集(n = 3个月),以确保模型验证的客观性。研究方法采用多阶段建模策略:

首先,基于土壤蒸发量和降水量与土壤湿度的相关性,以土壤蒸发量和降水量作为输入变量,建立了单隐含层BP神经网络预测模型。

其次,针对各深度土壤湿度数据单独建立了时间序列预测模型,采用Holt-Winters三参数指数平滑法(平滑系数 α=0.2,β=0.15,γ=0.3 )进行建模。

最后,通过加权融合方法将时间序列模型和神经网络模型的预测结果进行集成,构建了回归混合模型。模型权重通过多次相关性验证确定(时间序列模型权重 ω 1 =0.7 ,神经网络模型权重 ω 2 =0.3 )。图1展示了完整的模型构建与验证流程。

Figure 1. Prediction process of soil moisture at different depths

1. 不同深度土壤湿度的预测流程

其中,时间序列预测模型的流程如下图2

Figure 2. Time series prediction process

2. 时间序列预测流程

2. 研究区概况与数据来源

研究区位于内蒙古锡林郭勒草原核心区域(E115˚13'~117˚06', N43˚02'~44˚52'),属典型温带半干旱草原气候。数据来源于中国科学院草原生态系统定位研究站2012~2021年的连续观测,包括:

  • 土壤湿度数据(涵盖10 cm、40 cm、100 cm、200 cm四个深度)

  • 土壤蒸发量数据

  • 降水量数据

数据集按时间划分为:2012~2021年为训练集(120个月),2022年1~3月为测试集(3个月)。

3. 模型构建

3.1. BP神经网络预测模型

由于降水与土壤蒸发是土壤湿度变化的直接影响因子,降水是土壤中水分增加的主要来源之一,而土壤蒸发是土壤中水分减少的主要途径之一,所以不同深度下的土壤湿度与土壤蒸发量和降水量具有一定的相关性。因此,可通过BP神经网络模拟这种相关性,建立土壤蒸发量、降水量与不同深度下的土壤湿度之间的空间相关程度模型。

为预测不同深度下的土壤湿度,根据土壤蒸发量与降水量的相关数据值,使用BP神经网络建立预测模型,并进行输入层和输出层的设计[11]

基于土壤蒸发量和降水量与土壤湿度的相关性,构建单隐含层BP神经网络模型,见图3

Figure 3. BP neural network structure

3. BP神经网络结构

  • 输入层:基于土壤蒸发(水分减少的主要途径)和降水(水分增加的主要来源)与土壤湿度的直接相关性,对应输入变量为2012~2021年的土壤蒸发量和降水量(2个节点)。

  • 隐含层:综合考虑数据规模(120个月训练数据)和预测目标(4个深度的土壤湿度)后确定5个神经元。

  • 输出层:对应10 cm湿度 y ^ 1 、40 cm湿度 y ^ 2 、100 cm湿度 y ^ 3 以及200 cm湿度 y ^ 4 4个预测目标。

  • 学习算法:选取梯度下降法,其取值通过经验调试来确定。基于样本数据特性,通过多次试验选取最优值。

3.2. 时间序列预测模型

采用X11模型对各深度土壤湿度序列进行因素分解,分离季节、趋势和随机成分后,通过Holt-Winters三参数指数平滑建立不同深度土壤湿度的时间序列预测模型对2022年、2023年不同深度土壤湿度进行预测,其中平滑系数( α=0.2β=0.15γ=0.3 )通过网格搜索最小化均方误差(MSE)确定。通过三个阶段共10步的迭代过程来进行预测,具体步骤如下:

迭代第一阶段:

Step 1:通过 M 2×12 复合移动平均去除周期效应,计算趋势初始值 T t 1 = M 2×12 ( x t )

Step 2:从原序列 { x t } 中剔除趋势后得到季节–不规则成分 { z t ( 1 ) }= S t ( 1 ) × I t ( 1 ) = x t T t ( 1 )

Step 3:计算 { z t ( 1 ) } 序列的季节指数 S t ( 1 ) = z t ( 1 ) z ¯ t ( 1 ) = M 3×3 ( z t ( 1 ) ) M 2×12 ( z t ( 1 ) )

Step 4:从原序列 x t 中剔除季节效应,得到趋势–不规则成分 x t ( 2 ) = T t × I t = x t S t ( 1 )

迭代第二阶段:

Step 5:用13期Henderson移动平均,并使用Musgrave非对称移动平均填补Henderson加权平均不能获得的最后估计值,得出估计趋势效应估计值 T t ( 2 ) = H 13 ( x t ( 2 ) )

Step 6:从序列 { x t } 中剔除趋势,得到季节–不规则成分 { z t ( 2 ) }= S t ( 2 ) × I t ( 2 ) = x t T t ( 2 )

Step 7:计算 { z t ( 2 ) } 序列的季节指数 S t ( 2 ) = z t ( 2 ) z ¯ t ( 2 ) = M 3×3 ( z t ( 2 ) ) M 2×12 ( z t ( 2 ) )

Step 8:从序列 { x t } 中剔除季节效应,得到季节调整后序列 x t ( 3 ) = T t × I t = x t S t ( 2 )

迭代第三阶段:

Step 9:根据 x t ( 3 ) 波动性的大小,程序自动选择适当期数的Henderson移动平均,并使用Musgrave非对称移动平均填补Henderson加权移动平均不能获得的估计值,计算最终趋势效应 T t ( 3 ) = H 2k+1 ( x t ( 3 ) )

Step 10:从 x t ( 3 ) 中剔除趋势效应,得到随机波动 I t ( 3 ) = x t ( 3 ) T t ( 3 )

通过上述三个迭代阶段得到因素分解结果 x t = S t ( 2 ) × T t ( 3 ) × I t ( 3 ) 。同时采用13期Henderson移动平均优化趋势估计,重复季节指数计算与季节效应剔除过程。

3.3. 多元回归混合预测模型

根据上述两个模型的构建过程可以看出,BP神经网络主要基于土壤蒸发量和降水量等环境因子进行预测,而不同深度土壤湿度的预测则是通过时间序列模型在时间维度上实现的。为了有效整合BP神经网络在环境因子建模方面的优势和时间序列模型在捕捉时间动态特征方面的长处,本文提出构建一个多元回归混合模型用于预测2022年、2023年不同深度土壤湿度 y ¯ 1 y ¯ 2 y ¯ 3 y ¯ 4

y ¯ i = a i y ^ i + b i y ˜ i ,i=1,2,3,4.

通过多次相关性验证得到回归预测模型的系数 a i b i 分别在0.7和0.3附近浮动,因此本文对回归预测模型的选取为 y ¯ =0.7 y ^ +0.3 y ˜ 。其中, y ¯ 为混合模型预测值, y ˜ 为时间序列模型预测值, y ^ 为BP神经网络预测值。

4. 结果与分析

基于以上不同深度土壤湿度动态预测模型得到结果,下面给出湿度指标的预测结果(表1)。

Table 1. Prediction results of soil moisture at different depths in 2022 and 2023

1. 2022年、2023年不同深度土壤湿度的预测结果

年份

月份

湿度指标

10 cm湿度(kg/m2)

40 cm湿度(kg/m2)

100 cm湿度(kg/m2)

200 cm湿度(kg/m2)

2022

4月

15.35

49.21

75.69

165.67

5月

17.14

51.96

94.14

166.10

6月

18.67

53.98

92.99

166.06

7月

20.69

62.04

97.46

166.02

8月

19.68

58.61

100.67

165.96

9月

18.62

54.13

80.51

166.09

10月

16.94

51.55

81.52

165.41

11月

14.34

48.73

76.90

165.62

12月

13.56

49.65

79.16

165.55

2023

1月

13.23

49.00

76.74

165.71

2月

12.75

48.98

76.03

165.72

3月

13.35

47.96

72.19

165.87

4月

15.69

50.31

75.73

165.68

5月

17.14

51.96

94.15

166.10

6月

18.67

53.98

92.99

166.06

7月

20.69

62.04

97.46

166.02

8月

19.68

58.61

100.67

165.96

9月

18.75

56.48

82.94

165.99

10月

17.26

52.70

81.52

165.47

11月

14.39

48.68

76.78

165.63

12月

13.57

49.67

79.16

165.55

利用绘图软件将不同模型的预测数据绘成折线图,可观察土壤湿度的变化趋势(图4)。

BP神经网络与时间序列模型对各深度土壤湿度的预测结果反映了两者在环境因子响应和时间动态捕捉上的互补性。BP神经网络对深层土壤湿度预测值普遍偏高,反映其对环境因子的敏感性,时间序列模型则更好地捕捉了季节动态。

Figure 4. Comparison of soil moisture prediction at different depths by three models

4. 三种模型不同深度土壤湿度预测比较

Table 2. Evaluation indicators for the predicted and true values of soil moisture

2. 土壤湿度预测值与真实值的评价指标

模型类型

MSE

R2

时间序列

85.32

0.876

BP神经网络

92.47

0.842

回归混合

70.07

0.931

根据表2中的数据可知,回归混合模型在所有指标上均表现最优,精度显著高于单一模型,能较为准确地反映土壤湿度的垂直分布特征和季节动态,预测优势更为明显。

5. 总结

本文创新性地将时间序列分析与BP神经网络相结合,有效解决了单一模型在土壤湿度预测中的局限性。X11季节分解确保了时间动态的准确捕捉,而BP神经网络则增强了模型对环境因子的响应能力。本文通过加权融合时间序列模型和BP神经网络模型的预测结果,形成的回归混合模型预测精度显著优于单一模型,能准确反映土壤湿度的垂直分布特征和季节动态。本研究为草原生态系统的精准管理和水资源优化配置提供了科学依据和技术支持,为草原放牧管理、干旱预警等提供量化依据。

NOTES

*通讯作者。

参考文献

[1] 王兵, 刘世荣, 崔向慧, 等. 全球陆地生态系统水热平衡规律研究进展[J]. 世界林业研究, 2002, 15(1): 19-28.
[2] 刘树华, 蔺洪涛, 胡非, 等. 土壤-植被-大气系统水分散失机理的数值模拟[J]. 干旱气象, 2004, 22(3): 1-10.
[3] 吕达仁, 陈佐忠, 王庚辰, 等. 内蒙古半干旱草原土壤-植被-大气相互作用——科学问题与实验计划概述[J]. 气候与环境研究, 1997, 2(3): 2-12.
[4] 胡广录, 赵文智. 干旱半干旱区植被生态需水量计算方法评述[J]. 生态学报, 2008, 28(12): 6282-6291.
[5] 郑和祥, 郭克贞, 史海滨, 等. 锡林郭勒草原饲草料作物需水量计算方法比较及相关性分析[J]. 干旱地区农业研究, 2010, 28(6): 51-57.
[6] 侯琼, 王英舜, 杨泽龙. 基于水分平衡原理的内蒙古典型草原土壤水动态模型研究[J]. 干旱地区农业研究, 2011, 29(5): 197-203.
[7] 陈有君. 典型草原区土壤湿度的时序特征[D]: [博士学位论文]. 呼和浩特: 内蒙古农业大学, 2006.
[8] Woodward, S.J.R., Wake, G.C. and McCall, D.G. (1995) Optimal Grazing of a Multi-Paddock System Using a Discrete Time Model. Agricultural Systems, 48, 119-139.
https://doi.org/10.1016/0308-521x(94)00013-h
[9] Zhang, L., et al. (2022) A Hybrid Model for Predicting Soil Moisture in Deep Layers Based on Time Series and Artificial Intelligence. Journal of Hydrology, 615, Article ID: 128634.
[10] 中国统计数据库. 锡林郭勒盟统计年鉴2012-2022 [EB/OL].
http://www.shujuku.org/xilin-gol-league-statistical-yearbook.html, 2025-06-24.
[11] Xiao, Z., Ye, S., Zhong, B. and Sun, C. (2009) BP Neural Network with Rough Set for Short Term Load Forecasting: An International Journal. Expert Systems with Applications, 36, 273-279.
https://doi.org/10.1016/j.eswa.2007.09.031