1. 引言
乡村经济持续发展依赖农作物生产效益,然而其受气候、耕地、市场等诸多不确定因素制约。制定科学种植策略对乡村发展意义深远[1],故本研究聚焦于此展开深入分析与建模求解。
2. 问题阐述
2.1. 数据资料
提供乡村耕地地块详情(类型、面积)及农作物种植信息(类别、适配耕地),还有2023年农作物种植、产量、成本、价格等数据,构成研究基础数据体系。
2.2. 核心问题
3. 问题剖析
3.1. 问题二的分析
过往经验表明,气候与市场因素致使农作物预期销售、产量、成本、价格变动不定。建模时需精准量化这些不确定性,综合权衡各方因素,从而规划出能实现效益最大化的种植方案,为乡村种植提供可行指导。
3.2. 问题三的分析
Figure 1. Total analysis of the problem
图1. 问题的总分析
在问题二框架的基础上,引入相关系数刻画作物关系。对于可替代作物,依据相关性调整种植面积;对于互补作物,优化组合提升综合收益。借助模拟数据对比分析,完善种植策略模型。
本文的总体分析流程图见图1。
4. 模型假设
为了构建合理化的数学模型,本文给出如下假设:
1) 假设2023年各个农作物的产量即为该种作物的预期销售量;
2) 假设地块的种植面积最小为0.1亩的倍数;
3) 假设农作物在当季销售,不考虑农作物库存积压;
4) 假设不存在突发天气灾害、害虫灾害等突发因素。
5. 符号释义
下面是模型中遇到的数学符号,具体解释见下表:
符号 |
说明 |
i |
农作物的类别;i = 1, 2, …, 41 |
j |
土地的编号;j = 1, …, 54 |
t |
季度;t = 1, 2 |
k |
年份;k = 2024, …, 2030 |
Xi,j |
第i种农作物在第j块地的种植面积 |
Ni |
第i种农作物的亩产量 |
S |
2023年农作物的销量 |
Pi |
第i种农作物的销售单价 |
Mi |
第i种农作物的单位种植成本 |
6. 数据的解读
考虑到数据较为分散,为了更好地理解和分析数据,在思考和解决问题前,进行数据的整理和分析。根据提供的地块和农作物以及2023年种植情况的相关数据,本文主要借助Python等工具,对数据合并整理以及可视化处理,从而掌握数据的大致情况,以便对问题的解决。
6.1. 三大农作物品类的品种丰富度
Figure 2. Variety richness of the three major crop categories
图2. 三大农作物品类的品种丰富度
农作物品类的丰富度可以反映当地人对于农作物的需求,有助于挖掘当地的市场潜力,有助于制定适合当地的种植策略,三大农作物品类的品种丰富度如图2所示。
由图2可知,蔬菜类占品种数量的51.2%,品种丰富,意味着当地上有各种各样的蔬菜类。相比之下,食用菌所含种类最少,占比仅9.8%,意味着当地对食用菌的种植较少。因而蔬菜覆盖的范围最广。优化种植策略,可以从各作物所含种类入手,进行田间管理。
6.2. 乡村现有耕地的类型和比重
耕地类型和面积的统计有助于掌握当地的地形,从而大致了解当地农作物的种植,该乡村的现有耕地的类型和比重如图3所示。
由图3可知,梯田所占面积最大,占比51%,由此可推出当地主要是种植水稻和蔬菜等农作物。智慧大棚所占面积最小,占比仅0.2%。通过此图,我们可以针对各地块占地面积,充分利用资源,规划作物耕种区域。
Figure 3. Types and proportion of existing cultivated land in the village
图3. 乡村现有耕地的类型和比重
7. 模型建立与求解
7.1. 问题二的模型建立与求解
7.1.1. 数据预处理
量化处理
下面对模型中遇到的各种耕地类型进行了量化处理,具体量化处理见表1。
Table 1. Quantization processing
表1. 量化处理
量化前 |
量化后 |
平旱地(A1, …, A6) |
1, 2, 3, 4, 5, 6 |
梯田(B1, …, B14) |
7, 8, 9, …, 20 |
山坡地(C1, …, C6) |
21, 22, 23, 24, 25, 26 |
水浇地(D1, …, D8) |
27, 28, 29, 30, 31, 32, 33, 34 |
普通大棚(E1, …, E16) |
35, 36, 37, …, 50 |
续表
智慧大棚(F1, …, F14) |
51, 52, 53, 54 |
粮食(黄豆、∙∙∙∙∙∙、水稻) |
1, 2, 3, …, 16 |
蔬菜(豇豆、∙∙∙∙∙∙、红萝卜) |
17, 18, 19, …, 37 |
食用菌(榆黄菇、∙∙∙∙∙∙、羊肚菌) |
38, 39, 40, 41 |
7.1.2. 优化设计
鲁棒性优化是一种用于遇到解决存在未知性和不确定问题的优化方法,本质是在变量不确定时或外部环境的变化时,求解最优值问题,主要考虑在最坏情况下较好的解且该解在最优化问题能具有较好的性能。优点包括:不需要准确的概率计算;对于最坏情况下的保守解决等。
问题二中增加了农作物生长的不确定性和风险性,针对这种不确定性问题,本文借助鲁棒优化方法来解决。
由于多个变量会随着时间变化,具有不确定性的主要信息包括:
小麦和玉米预期销售量的年增长率介于5%~10%;其他农作物的预期销售量变化±5%;亩产量受气候等因素每年会有±10%;种植成本平均每年增长5%左右;粮食类作物的销售价格基本稳定;蔬菜类作物的销售价格每年增长5%;食用菌的销售价格每年下降1%~5%;羊肚菌的销售价格每年下降5%。
7.1.3. 模型的建立与求解
1) 目标函数的确定
基于问题二的目标函数需考虑变量(预期销售量、销售价格、种植成本)的不确定性来构建利益最大化模型。对目标函数进行改进,引入鲁棒性优化,可得到最坏情况下的年利益最大化的目标函数:
2) 约束条件
为了将这些不确定的变量引入模型,我们首先将其数量化:
小麦和玉米:
其他作物:
亩产量:
粮食类:
蔬菜类:
食用菌:
3) 种植策略模型汇总
基于问题背景的约束,以及销售量、价格、成本的限制下,如下即为基于问题二的模型:
地块农作物要求:
销售量、价格、成本要求:
4) 模型求解
Figure 4. Changes in total crop benefits from 2024 to 2030
图4. 2024~2030年作物总利益变化图
该模型只是表示年收益的最大化,问题二中的销售量、价格、成本随时间而变,不同的年份数据不一样,这里用Python的求解过程中,加入for循环,使得在2024~2030年间这些变量不断更新,来观测各年份的指标数据。这里由于数据表格太大,这里不做展示,结果保存在文件result2中。
为了掌握各年份的农作物收益,这里将result2文件中的数据进行统计,可得到如下所示的未来七年各类农作物的收益情况,整理结果如图4所示。
由图4可知,2024~2030年总利润从大到小依次为蔬菜类、粮食类、食用菌。由此可推断未来农作物的收益主要依赖蔬菜和粮食类作物的种植,同时,可看出2026年总利润最高,这里以2026年为例,展示这两类中重要农作物品种的利润占比。
Figure 5. Profit share chart of food and vegetable crops in 2026
图5. 2026年粮食类和蔬菜类作物利润占比图
图5左是2026年粮食类的主要农作物的利润占比分布,由图5左可知,其中红薯和南瓜占主要部分,可预测2026年收益主要依靠红薯和南瓜。由图5右可知,在蔬菜类中,黄瓜仍是最受欢迎的蔬菜。其他蔬菜的利润较低,因此这些蔬菜的图像阴影重合。
7.2. 问题三的模型
7.2.1. 指标设计
可替代性是指效益相似或者由于市场价格或者需求变动,使得可以被相互替代的。
互补性是指某些作物在生长中可以相互促进生长、相互补充,共同资源共享。
7.2.2. 种植策略模型汇总
1) 模型建立
结合实际,某些农作物之间具有可替代性,且预期销售量与销售价格、销售成本相关,为找到最优的种植策略,这里基于目标函数的改进,得到如下模型:
其中,
和
表示同一块地在同一个季节种植的两种不同的农作物,且耕种面积小于该地块总面积,
表示两种农作物的关联性[2],例如同一类型的农作物黄豆和红豆就不能同时种植,因为他们从土地中吸收的养分基本一样,所以彼此具有竞争性,在模型中我们就需要定义其互斥。
从上述模型中我们可以看出,前面一部分是基础利润,后面的利润情况则是由
决定,如果
为正数,表示两个农作物之间具有互补性,能增加总收益。相反地,若
为负数,表示两个农作物之间具有互斥性,对应的总收益就会降低。我们在模型求解的过程中,会加入该部分约束。
2) 模型求解
为了方便与问题二的结果进行比较分析,这里将问题二与问题三的2024~2030年的利润情况用图6归纳直观展示,如下所示。
Figure 6. Profits of various crops in 2024~2030 based on questions 2 and 3
图6. 基于问题二与问题三的2024~2030年各类农作物的利润情况
由图6可知,利用作物间的可替代性以及引入相关性系数后,2025年以及2028年蔬菜总利润骤增且最大,主要原因之一是蔬菜的品种较多,例如青菜类和豆类有较多的选择。对粮食类产物的影响比较稳定,菌类农作物的利润下降,主要原因可能是菌类的品种少,导致菌类的替代,对其销量影响较大。可以综合考虑将互补性作物耕种在一起,以便提高产率和收益。
8. 模型的分析与检验
灵敏度分析:为了验证模型的泛化能力,基于目标函数进行灵敏度分析,本文借助常见的正则化处理进行检验,正则化是机器学习中减少模型复杂度,防止过拟合的常见做法,这里采取核范数,改进后的模型为:
这里在原模型的基础上进行较小的扰动的目的是验证模型的泛化能力。这里将参数设为
是随机扰动项,引入核范数用于正则化,也使得模型更加鲁棒。
通过我们得到的农作物种植数据可知,有很多位置并未种植农作物,所以矩阵中有很多0的存在,此时核范数能很好地解决这一问题,核范数可以促使矩阵具有更好的稀疏性,即只有少量的元素是非零的,使得我们在处理高维数据和特征选择等问题中有着重要的应用。通过引入核范数可以实现对矩阵的低秩近似,这对于降低数据的维度和存储空间是非常有用的。并且核范数通常是凸函数,因此也可以保证优化问题的凸性,有利于高效地优化出算法并获得全局的最优解。
9. 模型评估
9.1. 模型的优点
1) 本文较为真实地考虑农作物的种植策略,依据成本、销售量、销售价格的同时,包括不同地块对农作物的要求,考虑较为全面。
2) 本文建立较为简单的混合线性模型,模型简单且通俗易懂,符合实际情况。
3) 基于问题二的多个变量的变动性,本文借助鲁棒优化方法解决,在变量不确定性下,找到一个最优解。
9.2. 模型的缺点
该模型农作物种植策略的运行数据结果中显示,很多地块上种植四种甚至以上农作物,与一般的地块种植包含2~3种农作物[3]实践相悖。易引发作物资源竞争,降低模型实际可行性。
9.3. 模型的推广
本文模型可拓展应用于市场销售、成本控制等多领域决策,助力农业产业与市场运营科学规划等方向。
10. 研究结论
本研究构建的混合线性规划模型在农作物种植策略规划方面成效显著。针对未来七年的种植,蔬菜与粮食类作物为利润核心来源,种植时应重点关注黄瓜、红薯、南瓜等优势品种。问题三模型进一步揭示了作物关系对利润的影响,种植实践中应充分利用作物可替代性与互补性,合理布局种植结构,规避资源竞争,实现乡村农作物种植效益持续增长与农业可持续发展。
后续我们还会根据实际的种植数据探索更复杂的农作物关系模型。一方面,运用机器学习手段深入挖掘农作物彼此间隐藏的非线性关系,让模型能够精准捕捉到那些微妙且复杂的关联因素,从而为种植决策提供更具前瞻性的指导;另一方面,构建更为精细的资源竞争模型,细致剖析不同农作物在土壤养分、水分、光照等各类资源争夺上的动态变化,助力实现资源的优化配置。
不仅如此,我们会专门采用独立的测试数据集,严谨评估模型的预测性能,全方位检验模型在面对多样化实际场景时的准确性与可靠性。同时,展开更全面的灵敏度分析,细致探究模型对于输入数据微小变动的敏感程度,确保其稳定性;以及深入的鲁棒性测试,模拟各种极端或异常情况,验证模型的坚韧程度与适应性。
此外,针对核范数的引入,后续也将投入更多精力进行详尽阐释与严格验证。通过严谨的对比实验,清晰呈现使用核范数和不使用核范数的模型在性能表现上的差异,为模型优化与改进提供坚实依据,力求让整个农作物关系模型体系更加完善、实用。
NOTES
*共同第一作者。
#通讯作者。