玉米产量预测研究综述
Review of Research on Maize Yield Forecasting
DOI: 10.12677/airr.2024.134077, PDF, HTML, XML,   
作者: 孔德耀, 刘靖宇*, 丁云鸿:哈尔滨师范大学计算机科学与信息工程学院,黑龙江 哈尔滨
关键词: 玉米产量预测作物预测系统模型机器学习深度学习Maize Yield Prediction Crop Prediction System Model Machine Learning Deep Learning
摘要: 玉米作为全球最重要的粮食作物之一,其产量预测在确保粮食安全、优化农业管理以及支持政策制定方面具有重要意义。本文系统综述了当前玉米产量预测领域的主要方法,包括传统的作物预测系统模型、数据驱动的机器学习模型以及近年来迅速发展的深度学习模型,深入分析了气候、土壤、遥感和社会经济等多种预测变量对产量预测精度的影响。通过对现有研究的成果进行总结,本文揭示了不同模型的优劣势,并指出了现阶段研究中存在的不足,如模型泛化能力有限、多模态数据融合的挑战等。最后,本文对未来研究提出了展望,建议进一步探索多源数据的整合、优化模型的适应性以及提升预测的解释性,以推动玉米产量预测技术向更精准、智能化方向发展。本文为未来的玉米产量预测研究提供了有价值的理论基础和实践指导。
Abstract: Maize is one of the most important crops globally, and accurate yield prediction is crucial for food security, agricultural management, and policy decisions. This paper reviews key methods for maize yield prediction, including crop prediction models, machine learning, and deep learning. It analyzes the impact of variables like climate, soil, remote sensing, and socioeconomic factors on prediction accuracy. By summarizing current research, this paper highlights the strengths and limitations of these models and addresses challenges such as limited generalization and multimodal data integration. Finally, it proposes future directions for improving model adaptability and prediction precision, offering valuable insights for further research.
文章引用:孔德耀, 刘靖宇, 丁云鸿. 玉米产量预测研究综述[J]. 人工智能与机器人研究, 2024, 13(4): 758-764. https://doi.org/10.12677/airr.2024.134077

1. 引言

玉米是中国种植最广泛的粮食作物之一,覆盖了全国多个农业大省,其种植面积和产量在国内农作物中占据重要地位[1]。作为重要的粮食和饲料来源,玉米不仅直接影响着人们的饮食结构,还对畜牧业和工业生产有着重要支撑作用[2]。因此,准确获取各地作物信息并进行科学的产量预测研究显得尤为关键。

早期的作物产量预测主要依赖于经验模型,这些模型基于农业专家的知识和历史数据来进行预测[3]。农民和农业专家通过观察作物生长情况、天气变化和土壤条件,结合过去的种植经验,估计未来的产量。这些模型虽然在一定程度上有效,但其准确性和科学性较低,因为它们高度依赖于个人经验,无法充分考虑所有影响因素[4]。随着系统化的作物预测系统逐渐完善,作物生长模型应运而生。例如,作物生长模型可以模拟作物在不同气候和管理条件下的生长过程,提供详细的生长动态和产量预测[5]。这些模型通过模拟作物的生理过程,能够提供比经验模型更精确的预测。但是,由于其模型需要特定区域数据及大量参数校准。因此该类模型的泛化能力较弱[6]。进入21世纪以后,随着科学技术的进步与发展,机器学习以其优异的预测精度以及卓越处理多元特征之间非线性关系的能力让人们所熟知[7]。上述模型均在作物产量预测领域表现出杰出的性能。对于提高模型精度与多模态数据的融合要求提高,近年来,深度学习技术在计算机视觉和自然语言处理等领域取得了显著成就[8],并逐步应用于农业领域。深度学习模型在处理高维和复杂的农业数据方面展现了优异的表现[9]。不同于传统方法,深度学习模型在粮食产量预测中可以更深入地挖掘数据之间的关系,在提升预测精度的同时,更深入地探索各个变量之间的相互关系[10]

本文其余部分结构安排如下:第二部分对玉米作物产量预测模型的概述;第三部分是常见模型在玉米产量预测的应用介绍;第四部分为本文的总结。

2. 作物模型与机器学习模型概述

在玉米产量预测中,作物模型和机器学习模型是两类常用的预测方法。作物模型基于作物的生理过程和环境条件,通过模拟作物的生长动态来预测产量。这类模型综合考虑气候、土壤、水分、养分等多种因素,提供较为全面的预测。常见的作物模型包括CERES-Maize、AquaCrop、APSIM和WOFOST。这些模型在特定区域的预测精度较高,但通常需要大量的区域性数据进行校准,在跨区域应用时泛化能力较弱。

机器学习模型则通过数据驱动的方式进行预测,依赖历史数据的训练来发现数据中的模式和规律。常用的机器学习算法包括随机森林、支持向量机、极限梯度提升(XGBoost)等。这些模型能够处理气象、遥感、土壤等多源数据,不依赖于对作物生长过程的详细理解,适合在不同区域条件下进行灵活应用。

深度学习作为机器学习的一部分,近年来在玉米产量预测中发挥了越来越重要的作用。常见的深度学习模型如卷积神经网络(CNN)和长短期记忆网络(LSTM),擅长处理高维和复杂数据,尤其适用于遥感图像和时间序列数据的分析。与传统机器学习方法相比,深度学习能够自动提取数据特征,捕捉复杂的非线性关系,从而提高预测的精度和适用性。

3. 常见模型在玉米产量预测中的应用

3.1. 早期经验模型

早期经验模型主要依赖于农业专家的知识和历史数据进行预测,这些模型通过观察作物生长情况、天气变化和土壤条件,结合过去的种植经验,估计未来的产量[11]。虽然这种方法简单易用且基于实地观察,但其准确性和科学性较低,因为它高度依赖于个人经验,难以系统地考虑所有影响因素[3] [12] [13]。此外,早期经验模型在处理复杂的非线性关系和多变量影响时效果有限,无法满足现代农业对精确预测的需求[14]

3.2. 作物预测系统模型

3.2.1. CERES-Maize模型

CERES-Maize模型是一种作物生长模拟工具,用于预测玉米在不同气候和管理条件下的生长过程和产量[15]。该模型通过模拟光合作用、呼吸作用、水分和养分吸收等生理过程,方便研究人员优化农业生产管理[16]

Jin等人[17]利用CERES-Maize模型,优化模型参数用以更好地模拟水分胁迫条件下的玉米生长和产量。该研究基于2013年至2015年间,在中国关中平原地区内收集玉米作物从播种到成熟的不同生长阶段的叶面积指数(LAI)、地上生物量、籽粒重量、产量和土壤水分含量的数据。研究发现,在充分灌溉条件下,模型能够较好地模拟这些变量,而在水分胁迫条件下,尤其是幼苗期的水分胁迫处理,模拟效果较差。杨晓娟等人[18]在陕西长武进行了基于CERES-Maize模型的玉米水分关键期干旱指数天气保险研究。该研究在长武进行连续三年的雨养玉米观测试验,收集了玉米生长、气象、土壤和田间管理数据,利用这些数据对CERES-Maize模型进行了参数校正和验证。结果表明,CERES-Maize模型的校正和验证结果显示,平均绝对相对误差(ARE)和相对均方根误差(RRMSE)均小于10%,满足作物模型模拟精度的要求。模拟的干旱指数(DI)与玉米减产率(y, %)间呈显著的线性关系,公式为 y=0.55DI+107.17

3.2.2. AquaCrop模型

AquaCrop模型是由联合国粮食及农业组织(FAO)开发的一种用于模拟作物产量与水分关系的作物模型[19]。它特别适用于水资源有限条件下的作物生产评估,相比CERES-Maize模型,其具有参数较少、操作简便、精度较高等特点。AquaCrop模型主要通过模拟作物生长、蒸腾和水分利用过程,预测作物的生物量和产量[20]。具体来说,模型考虑了气象条件、土壤特性、作物类型和管理措施等多种因素。AquaCrop模型结构示意如图1所示。

任聪哲等人[21]结合2021~2022年塔额盆地的实测数据,对模型中的保守参数和产量模块的标准水分生产力(WP)和参考收获指数(HI0)进行了校准和验证。通过设置起始灌水时间、灌溉定额和灌水周期三个因素的交叉试验,模拟了夏玉米的产量,并分析了产量和作物水分利用效率在不同灌溉条件下的变化情况。研究表明,推荐的最优灌溉方案为起始灌水时间5月20日,灌溉定额470毫米,灌水周期为7天,总共灌水11次。在该方案下,夏玉米的水分利用效率为2.005千克每立方米,产量为9.423吨每公顷。

Figure 1. Structure of the AquaCrop model

1. AquaCrop模型结构图

以2022年夏玉米的实际播种面积1633公顷为参考,通过模型模拟并预测了2022年及未来4年的夏玉米产量和节水总量。徐昆等人[22]采用AquaCrop作物生长模型,结合中国五大玉米种植区的气象数据、土壤数据、作物数据和管理数据,对241个玉米种植城市进行研究。结果表明,五个区域的玉米干旱脆弱性曲线均呈“S”形,当干旱强度指标达到0.2时,产量损失率迅速增加;当干旱强度指标达到0.6时,损失率接近最大值。

3.3. 机器学习预测回归模型

随着科学技术的进步,许多机器学习方法被提出用于预测农作物产量[7] [8] [23]。机器学习能够利用大量的历史数据进行训练,从而发现数据中的模式和趋势,并减少资源浪费,提高经济效益。与传统作物预测系统模型相比,机器学习方法具有更高的准确性和灵活性,能够适应不同的环境和条件,提供更可靠的预测结果。

Chen等人[24]利用Cubist、随机森林(RF)、支持向量机(SVM)和极限梯度提升(XGBoost)四种机器学习模型,结合气候数据、卫星数据和气象指数,对2000年至2015年间中国213个城市的玉米产量进行了预测。研究发现,结合所有数据源可以达到最高预测准确性,其中Cubist模型表现最佳。Khanal等人[25]利用遥感技术获取高分辨率图像,包括土壤压实、夹行(由机械轮胎压过的行)、玉米产量等数据。该研究还考虑了包括海拔、坡度、粗糙度、方位和流向在内的地形变量,以及基于遥感图像计算的植被指数,使用了六种机器学习模型来预测玉米籽粒产量。结果表明,立方体算法在所有场地的产量预测中表现最佳,R2分数分别为0.76、0.61和0.88。Cheng等人[26]使用多指标结合机器学习模型(随机森林回归和梯度提升决策树)对中国县域玉米产量进行了早期预测。结果显示,随机森林回归模型比梯度提升决策树表现更好,综合使用GPP、ET、地表温度和LAI四个指标预测玉米产量的效果最佳,R2达到0.77,rRMSE为16.15%。Dhillon等人[27]利用月平均温度、最高温度、最低温度和降水量等气候因素来研究和预测美国俄亥俄州县级范围内玉米的产量变化。研究采用了随机森林回归模型,结果表明,七月的最高气温对玉米产量产生负面影响,而八月的降水量对大豆产量产生积极影响。Guo等人[28]利用回归分析、HLM模型和机器学习算法(如随机森林、XGboost等),结合多传感器数据,开发了农业种植结构预测模型,研究了老龄化人口、气候变化和经济因素对种植结构的影响。

3.4. 深度学习

深度学习是机器学习的一个分支,通过模拟人脑的神经网络结构来处理和分析复杂的数据[29]-[31]。其作用机制包括多层神经网络的构建、通过反向传播算法进行参数调整,以及利用大规模数据集进行模型训练。而在农业领域,特别是农作物产量预测中,深度学习已被广泛应用,通过整合遥感数据、气象数据和土壤信息,提供更为精确和实时的产量预测,从而优化农业管理和决策[32]。深度学习模型结果如图2所示。

Figure 2. Deep learning model structure

2. 深度学习模型结构图

目前,多模态数据的使用已成为深度学习应用的趋势,通过融合气象数据、遥感影像、土壤信息、地理位置和种植管理等多种数据源,模型能够更全面地捕捉影响作物产量的多重因素。Cao等人[33]使用线性回归模型(LASSO)、随机森林(RF)和长短期记忆网络(LSTM)模型,整合多源数据(如卫星植被指数、气象指数和土壤属性),在中国县级范围内预测水稻产量。研究结果显示,LSTM模型在预测性能上优于RF和LASSO。Li等人[34]提出了一种基于多模态数据的深度学习模型,用于预测2002年至2015年中国县域的玉米产量。该模型采用两阶段特征学习结构,结合多源卫星数据,提升特征表示能力。模型通过字典矩阵学习省份的空间多样性。交叉验证结果显示,该方法能解释82%的产量变化,预测未来的RMSE为1006 kg/ha,MAPE为17.1%。Ma [35]等人使用了卫星遥感数据(如EVI、GCI、NDWI)、气候数据(如气温、降水量)和土壤数据来预测玉米产量。采用了贝叶斯神经网络,能够在预测玉米产量的同时提供不确定性分析。结果显示,BNN模型的预测精度较高(R2为0.77),且对异常气候年份表现稳定,预测结果的不确定性随时间推移逐渐减少。

4. 结语

本文总结了当前在玉米作物产量预测领域的相关研究,重点阐述了两种主要的预测方法:作物预测系统模型和机器学习回归模型。作物预测系统模型在特定区域的预测中表现出较高的精度,但其泛化能力受限。相比之下,机器学习回归模型凭借其良好的泛化能力以及处理多源数据和多模态数据的优势,正在成为玉米产量预测的主流趋势。结合现有研究表明,气候、遥感等对作物产量的影响越来越被重视,并被广泛应用于产量预测模型中。展望未来,随着科学技术的不断进步,农业将与计算机技术领域更加紧密结合,先进的机器学习和深度学习技术有望进一步提升作物产量预测的精度与效率。

在未来的研究中,进一步挖掘多源数据的潜力,优化数据融合方法,并探索更具解释性和稳健性的深度学习模型,将是推动玉米预测领域发展的重要方向。通过持续改进模型的泛化能力和时效性,研究人员可以应对复杂多变的环境条件,提升产量预测的准确性和稳定性。此外,随着大数据、人工智能和遥感技术的不断进步,智能农业将逐渐实现精准化、数据驱动化和可持续化,为全球粮食安全和农业生产提供更有力的支持。因此,深度结合农业和计算机科学的跨学科研究,将在农业产量预测领域中扮演不可或缺的角色,推动农业生产向智能化方向迈进。

NOTES

*通讯作者。

参考文献

[1] 钱凤魁, 王化军, 王祥国, 等. 基于WOFOST模型与遥感数据同化的县级尺度玉米估产研究[J]. 沈阳农业大学学报, 2024, 55(2): 138-152.
[2] 田谧, 张尚美, 于冷, 等. 生物技术应用在经济结构以及资源环境上的作用研究——基于DNDC-CGE模型的玉米种植影响模拟[J]. 现代管理科学, 2017(1): 66-68.
[3] 张婷, 赵明, 马树庆, 等. 基于理论-经验模型的春玉米产量丰歉动态气象评估[J]. 气象与环境科学, 2024, 47(2): 86-93.
[4] 蒙继华, 王亚楠, 林圳鑫, 等. 作物生长模型研究现状与展望[J]. 农业机械学报, 2024, 55(2): 1-15, 27.
[5] 李荣平, 周广胜, 张慧玲. 植物物候研究进展[J]. 应用生态学报, 2006, 17(3): 541-544.
[6] 韩少宇. 基于多平台遥感数据的冬小麦长势监测和产量预测[D]: [博士学位论文]. 郑州: 河南农业大学, 2023.
[7] 罗浩田. 基于混合神经网络的冬小麦产量预测方法研究[D]: [硕士学位论文]. 郑州: 郑州大学, 2022.
[8] 陈博謇. 基于深度学习的农作物产量品质监测及模型可解释性研究[D]: [硕士学位论文]. 杭州: 杭州电子科技大学, 2022.
[9] 吉文翰, 郑恒彪, 王迪, 等. 基于无人机影像和卷积神经网络的水稻育种材料产量预测研究[J/OL]. 南京农业大学学报: 1-13.
http://kns.cnki.net/kcms/detail/32.1148.S.20240616.0000.002.html, 2024-07-18.
[10] 黄成龙. 人工智能及云计算在智慧农业教学中的应用[J]. 科教文汇(上旬刊), 2020(4): 71-72.
[11] 王辉, 付虹雨, 岳云开, 等. 基于气候变量的苎麻产量SSA-BP预测模型[J]. 中国农业科技导报, 2024, 26(1): 110-118.
[12] 赵龙才, 李粉玲, 常庆瑞. 农作物遥感识别与单产估算研究综述[J]. 农业机械学报, 2023, 54(2): 1-19.
[13] 朱炯. 冬小麦单产遥感多尺度估算方法实验研究[D]: [硕士学位论文]. 北京: 中国科学院大学, 2021.
[14] 林用智. 耦合多类辐射传输模型的农作物参数定量反演[D]: [硕士学位论文]. 南充: 西华师范大学, 2023.
[15] 刘玉汐, 赵柠, 任景全, 等. 基于CERES-Maize模型的吉林春玉米遗传参数调试[J]. 中国农学通报, 2017, 33(24): 12-19.
[16] 郭恩亮. 多模型耦合下的玉米涝灾风险动态评价研究[D]: [博士学位论文]. 长春: 东北师范大学, 2017.
[17] Song, L. and Jin, J. (2020) Improving Ceres-Maize for Simulating Maize Growth and Yield under Water Stress Conditions. European Journal of Agronomy, 117, Article ID: 126072.
https://doi.org/10.1016/j.eja.2020.126072
[18] 杨晓娟, 张仁和, 路海东, 等. 基于CERES-Maize模型的玉米水分关键期干旱指数天气保险: 以陕西长武为例一[J]. 中国农业气象, 2020, 41(10): 655-667.
[19] 李思琪, 王俊洁, 孟明雪, 等. 三江平原白浆土区雨养玉米AquaCrop模型模拟研究[J]. 首都师范大学学报(自然科学版), 2024, 45(5): 74-80.
[20] 马超, 吴天傲, 章伟忠, 等. 基于AquaCrop模型的水稻多目标灌溉制度优化研究[J]. 灌溉排水学报, 2024, 43(1): 9-16.
[21] 任聪哲, 范文波, 乔长录, 等. 基于AquaCrop模型的塔额盆地夏玉米节水潜力分析[J]. 干旱地区农业研究, 2024, 42(2): 140-149, 209.
[22] 徐昆, 朱秀芳, 刘莹, 等. 采用AquaCrop作物生长模型研究中国玉米干旱脆弱性[J]. 农业工程学报, 2020, 36(1): 154-161.
[23] 高俊, 虞满华, 苏国红. 新质生产力赋能农文旅产业发展[J]. 西昌学院学报(社会科学版), 2024, 36(4): 42-52.
[24] Chen, X., Feng, L., Yao, R., Wu, X., Sun, J. and Gong, W. (2021) Prediction of Maize Yield at the City Level in China Using Multi-Source Data. Remote Sensing, 13, Article 146.
https://doi.org/10.3390/rs13010146
[25] Khanal, S., Klopfenstein, A., KC, K., Ramarao, V., Fulton, J., Douridas, N., et al. (2021) Assessing the Impact of Agricultural Field Traffic on Corn Grain Yield Using Remote Sensing and Machine Learning. Soil and Tillage Research, 208, Article ID: 104880.
https://doi.org/10.1016/j.still.2020.104880
[26] Cheng, M., Penuelas, J., McCabe, M.F., Atzberger, C., Jiao, X., Wu, W., et al. (2022) Combining Multi-Indicators with Machine-Learning Algorithms for Maize Yield Early Prediction at the County-Level in China. Agricultural and Forest Meteorology, 323, Article ID: 109057.
https://doi.org/10.1016/j.agrformet.2022.109057
[27] Dhillon, R., Takoo, G., Sharma, V. and Nagle, M. (2024) Utilizing Machine Learning Framework to Evaluate the Effect of Climate Change on Maize and Soybean Yield. Computers and Electronics in Agriculture, 221, Article ID: 108982.
https://doi.org/10.1016/j.compag.2024.108982
[28] Guo, W., Huang, Y., Huang, Y., Li, Y., Song, X., Shen, J., et al. (2024) Develop Agricultural Planting Structure Prediction Model Based on Machine Learning: The Aging of the Population Has Prompted a Shift in the Planting Structure toward Food Crops. Computers and Electronics in Agriculture, 221, Article ID: 108941.
https://doi.org/10.1016/j.compag.2024.108941
[29] 付渊, 任瑞仙, 王丽琴. 基于农业物联网的梯田农业生产环境构建与应用[J]. 物联网技术, 2024, 14(7): 133-135.
[30] van Klompenburg, T., Kassahun, A. and Catal, C. (2020) Crop Yield Prediction Using Machine Learning: A Systematic Literature Review. Computers and Electronics in Agriculture, 177, Article ID: 105709.
https://doi.org/10.1016/j.compag.2020.105709
[31] Shetty, S.A., Padmashree, T., Sagar, B.M. and Cauvery, N.K. (2021) Performance Analysis on Machine Learning Algorithms with Deep Learning Model for Crop Yield Prediction. In: Jeena Jacob, I., Kolandapalayam Shanmugam, S., Piramuthu, S. and Falkowski-Gilski, P., Eds., Data Intelligence and Cognitive Informatics, Springer, 739-750.
https://doi.org/10.1007/978-981-15-8530-2_58
[32] Sagan, V., Maimaitijiang, M., Bhadra, S., Maimaitiyiming, M., Brown, D.R., Sidike, P., et al. (2021) Field-Scale Crop Yield Prediction Using Multi-Temporal Worldview-3 and Planetscope Satellite Data and Deep Learning. ISPRS Journal of Photogrammetry and Remote Sensing, 174, 265-281.
https://doi.org/10.1016/j.isprsjprs.2021.02.008
[33] Cao, J., Zhang, Z., Tao, F., Zhang, L., Luo, Y., Zhang, J., et al. (2021) Integrating Multi-Source Data for Rice Yield Prediction across China Using Machine Learning and Deep Learning Approaches. Agricultural and Forest Meteorology, 297, Article ID: 108275.
https://doi.org/10.1016/j.agrformet.2020.108275
[34] Li, X., Geng, H., Zhang, L., Peng, S., Xin, Q., Huang, J., et al. (2022) Improving Maize Yield Prediction at the County Level from 2002 to 2015 in China Using a Novel Deep Learning Approach. Computers and Electronics in Agriculture, 202, Article ID: 107356.
https://doi.org/10.1016/j.compag.2022.107356
[35] Ma, Y., Zhang, Z., Kang, Y. and Özdoğan, M. (2021) Corn Yield Prediction and Uncertainty Analysis Based on Remotely Sensed Variables Using a Bayesian Neural Network Approach. Remote Sensing of Environment, 259, Article ID: 112408.
https://doi.org/10.1016/j.rse.2021.112408