1. 引言
随着农产品电商的快速发展,番茄等生鲜商品的供应链管理正面临品质控制实时性不足与供需匹配低效的双重挑战。近年来,深度学习技术在图像识别领域取得了显著成果[1],传统检测方法多采用独立模型分别处理病虫害识别与成熟度分级,存在特征复用率低、计算冗余度高的问题,难以满足电商场景下从田间到货架的全程品控需求。尤其在直播电商、社区团购等新兴模式中,植株生长状态的时空动态变化(如区域性病害爆发、果实成熟度异步演进)与电商订单的即时响应要求形成突出矛盾。
现有研究虽在番茄检测领域取得进展,但在实际应用层面仍存在三大瓶颈:(1) 单一任务模型无法同步获取番茄植株成熟度与病虫害情况;(2) 面对复杂农田环境下的遮挡、光照变异导致检测稳定性不足;(3) 检测系统与电商供应链缺乏数据级协同,难以实现“检测–决策–执行”闭环。针对上述问题,本文提出基于改进YOLOv8 [2]的番茄植株病虫害与成熟度检测框架。技术层面引入AKConv模块替代标准卷积层,加入SimAM注意力机制,在保持82.4%基础精度的同时降低16.35%计算开销,有效适配电商企业边缘计算设备的部署需求[3]。同时构建包含6类病害与3级成熟度的专项数据集,解决现有公开数据维度单一导致的模型泛化能力不足问题。
SimAM (Simple Attention Module)是一种基于能量函数理论的无参数注意力机制,该机制通过建模特征图各位置的能量分布,动态分配注意力权重,无需引入可学习参数即可实现全局上下文感知。其在目标检测、图像分类及语义分割任务中展现出显著的性能提升,将AKConv融合到YOLOv8中,可以充分发挥它们各自的优势,提高番茄病虫害与成熟度分类与识别的整体性能。
本文主要从以下几个方面展开研究:(1) 分析YOLOv8和引入AKConv模块替代标准卷积层的YOLOv8两种模型的优缺点,探讨如何将模块进行有效融合。(2) 引入SimAM注意力机制,提高此模型在较复杂的环境下的识别准确率[4]。(3) 在电子商务平台上进行实验证,对此模型进行评估。
本研究致力于突破电子商务场景中番茄品质识别的技术瓶颈,本研究将AKConv模块引入YOLOv8模型中,通过通道重参数化技术实现模型结构优化,并集成注意力机制优化多尺度特征提取过程。实验表明,该融合模型在保持轻量化特性的同时,成功将多任务检测精度提升至82.4%以上,为电商供应链构建了“质量检测–价值评估–决策支持”三位一体的智能识别体系,有效支撑农产品智能分拣、质量溯源、动态定价等核心业务场景的技术升级[5]。
2. YOLOv8模型与AKConv模块简介
YOLOv8作为当前目标检测领域的先进模型,其高效性源于优化的CSPDarknet骨干网络与多尺度特征融合设计。然而,传统固定形状的卷积核(如3 × 3)在面对不规则目标(如遮挡物体、形变结构)时,特征提取能力受限。AKConv (Adaptive Kernel Convolution)通过动态调整卷积核参数,赋予模型自适应空间感知能力,从而弥补YOLOv8在复杂场景下的不足。
YOLOv8作为YOLO (You Only Look Once)目标检测算法家族的重要演进版本,由Ultralytics团队于2022年正式发布。该版本在继承YOLOv5核心优势——包括实时检测能力、架构简洁性及计算高效性——的基础上,通过多层次技术创新实现了性能与工程易用性的双重突破。其核心设计策略延续了YOLO系列特有的多尺度模型架构[6],依据缩放系数(scale factors)提供x (Extreme)、l (Large)、m (Medium)、s (Small)、n (Nano)五档预定义模型,其中x模型以最高参数量实现极致检测精度,而n模型则通过极致的轻量化设计适配边缘计算场景。针对当前小目标检测任务中特征提取效率不足的痛点,本研究选择YOLOv8n轻量级架构作为基线模型,创新性融合自适应核卷积模块(Adaptive Kernel Convolution, AKConv),通过动态调整卷积核参数增强模型对多尺度目标的特征捕捉能力。
AKConv (Adaptive Kernel Convolution,自适应核卷积)是一种创新的动态卷积模块,旨在通过自适应调整卷积核的形状、尺寸和参数,提升卷积神经网络对多尺度目标的特征提取能力[7]。其核心思想是突破传统固定尺寸卷积核的限制,根据输入特征的局部上下文动态生成最优卷积核,从而增强模型在复杂场景(尤其是小目标检测)中的鲁棒性,AKConv的引入使本研究的灵活性增加,通过动态核参数化和多尺度自适应机制,有效解决了传统卷积在复杂目标检测任务中的固有限制。
3. 算法设计
3.1. YOLOv8模型改进
Figure 1. Backbone structural diagram
图1. Backbone结构图
本研究针对番茄病虫害与成熟度同步检测任务,对YOLOv8n网络架构进行了三重关键性改进:(1) Backbone动态特征提取优化:将原始Conv层全域替换为自适应核卷积模块(Adaptive Kernel Convolution, AKConv),通过动态调整卷积核形状与尺寸,增强模型对多尺度目标的适应性。该设计显著提升了小目标(如早期病斑)与颜色渐变特征(如成熟度分级)的捕捉能力。在Backbone末端嵌入SimAM无参注意力机制(Simple Parameter-Free Attention Module) [8],通过空间能量函数实现特征通道的自适应增强,有效聚焦叶片病理性纹理与果实成熟度关键区域,抑制复杂田间背景干扰。(2) Head部分特征融合增强:Head模块中的标准卷积层同步替换为AKConv,利用其动态核特性优化多尺度特征金字塔的融合过程,强化检测头对重叠目标(如密集果实)和形态变异目标(如病害扩散区域)的区分能力。(3) 结构可视化验证:改进后的Backbone层级结构如图1所示,其模块化设计在维持轻量化特性的同时,实现了精度与鲁棒性的协同提升,为农业复杂场景下的实时检测提供了可靠架构基础。
3.2. 损失函数
MPDIoU (Minimum Point Distance Intersection over Union)是一种针对目标检测框回归任务设计的新型损失函数,旨在通过最小化预测框与真实框顶点间的距离,更精准地优化边界框的位置与尺寸[9]。相较于传统的IoU及其变体(如GIoU、DIoU、CIoU),MPDIoU在保证计算高效性的同时,进一步提升了复杂场景下的检测精度[10]。以下是其核心原理与技术细节与设计动机:(1) 传统IoU的局限性:当预测框与真实框无重叠时,IoU = 0时,无法提供有效的梯度方向。GIoU、DIoU等改进方法虽缓解了梯度消失问题,但对边界框顶点的位置敏感度不足,导致对小目标或旋转目标的回归精度受限。(2) MPDIoU的优化方向:直接最小化预测框与真实框四个顶点之间的欧氏距离,强化模型对边界框几何形状的约束。避免引入复杂的惩罚项,降低计算复杂度。
MDPIoU损失定义如下式:
MPDIoU的计算公式:
(1)
其中A和B是两个任意凸形状,(xA1, yA1),(xA2, yA2)表示A的左上角和右下角点坐标,(xB1, yB1),(xB2, yB2)表示B的左上角和右下角点坐标
(2)
(3)
基于MPDIoU的损失函数计算公式:
(4)
4. 实验与分析
4.1. 数据集与实验环境
本研究选用1610张番茄病虫害与番茄成熟度图片,为了提高模型性能,通过旋转、平移等操作使数据集增加到8050张。
在本次研究中,所使用的操作系统为Windows10,GPU选用RTX 4070tisuper,显存为16G,选用PyTorch2.3.1,选用Python 3.10.16,选用Cuda11.8,输入图像尺寸为640 × 640,训练迭代次数为300,Batch Size为48。
4.2. 算法评价指标
在经过目标检测实验后,本文所选用的评价指标为平均精度mAP50和准确率P作为评价标准。
4.3. 消融实验
为了确认各个改进部分对YOLOv8n目标检测器的性能提升效果,进行了一系列的消融研究对比实验。结果如下表1所示,模型1是YOLOv8n的原始模型,模型2是模型1的基础之上添加AKConv,模型3是在模型2的基础上添加MPDIoU损失函数,模型4是在模型3基础之上添加SimAM注意力机制。
Table 1. Results of ablation experiment
表1. 消融实验结果
Model |
AKConv |
MPDIoU |
SimAM |
mAp |
模型1 |
× |
× |
× |
77.8% |
模型2 |
√ |
× |
× |
79.7% |
模型3 |
√ |
√ |
× |
81.1% |
模型4 |
√ |
√ |
√ |
82.4% |
4.4. 实验结果
如图2、图3所示,本研究提出的改进型YOLOv8n算法在番茄成熟度分级与病虫害同步检测任务中展现出显著性能优势。实验结果表明,改进模型在自建番茄多任务检测数据集上的平均精度(mAP)达到82.4%,较原始YOLOv8n基线模型提升4.6个百分点。这一性能突破得益于以下三重协同优化策略:(1) AKConv自适应核卷积:通过动态调整卷积核形状与感受野,增强模型对多尺度目标的特征表征能力。(2) SimAM无参注意力机制:基于能量函数理论实现特征空间的自适应增强,抑制复杂背景干扰。(3) MPDIoU损失函数:通过最小化预测框与真实框顶点距离,优化边界框回归精度。
改进模型实现了精度与鲁棒性的协同提升,为农业复杂场景下的实时精准检测提供了新的技术范式,验证了其工程部署优势。实验效果展示图如图2、图3所示。
Figure 2. Tomato maturity test results
图2. 番茄成熟度实验结果
Figure 3. Tomato pest and disease detection results
图3. 番茄病虫害检测结果
5. 总结与展望
本研究针对电子商务背景下农产品品质智能化检测的需求,以番茄病虫害与成熟度同步检测为切入点,提出了一种基于改进YOLOv8n的多任务轻量化检测模型。通过融合AKConv自适应核卷积、SimAM无参注意力机制与MPDIoU损失函数,实现了对复杂农业场景下小目标(病虫害斑点)与渐变特征(成熟度颜色)的高效精准识别,为电商平台农产品质量分级、供应链自动化分拣及消费者溯源提供了可靠技术支持。以下为核心研究成果总结:(1) 模型架构创新:AKConv动态特征提取、SimAM注意力增强、MPDIoU损失函数优化;(2) 实验性能突破:在番茄多任务数据集上,改进模型的平均精度达到82.4%,较原始YOLOv8n提升4.6个百分点;(3) 电商场景适配性:质量分级自动化、供应链追溯强化。
尽管本研究取得了阶段性成果,但在实际电商规模化应用中仍需进一步优化,未来研究方向可从以下维度展开:(1) 轻量化深度适配:探索AKConv核尺寸动态剪枝策略,针对不同检测任务(病虫害/成熟度)自适应压缩计算量,目标在参数量不变条件下提升推理速度。(2) 多任务扩展:引入实例分割头,实现病害区域的像素级定位(如炭疽病斑面积估算),为电商保险理赔提供量化依据。集成时间序列分析模块,基于连续检测结果预测成熟度变化趋势,优化电商仓储库存周转策略。(3) 数据与算法协同:跨域数据增强,利用生成对抗网络(GAN)合成极端光照、遮挡场景下的训练数据(如雨季叶片反光、果实堆叠),提升模型对电商物流复杂环境的鲁棒性。构建学习框架,联合多个农产品基地数据训练全局模型,解决单一产区数据偏差问题,同时保障数据隐私合规。自适应损失函数,设计动态权重,根据任务重要性自动调节损失权重,缓解多任务优化冲突。探索多模态融合损失,结合可见光与近红外光谱特征,增强模型对隐性病害(如早期灰霉病)的识别能力。(4) 电商系统集成:云端–边缘协同架构,在云端部署高精度模型(YOLOv8x + AKConv)进行定期数据复盘与模型微调,边缘端运行轻量版模型实现实时检测,形成“检测–反馈–迭代”闭环。开发低代码检测插件,支持主流电商ERP系统一键接入,降低中小商户技术门槛。绿色电商赋能:通过精准检测减少农药滥用果实的流通,结合碳积分机制激励农户绿色种植,助力电商平台ESG (环境、社会、治理)目标达成。构建“检测–分级–定价”智能决策系统,动态优化农产品定价策略(如轻微病害果实定向供应加工厂),减少资源浪费。(5) 标准化与合规性:行业标准制定,联合农业部门与电商平台,建立农产品规范模型精度阈值、硬件适配性等指标。推动检测结果与现有农产品编码标准互通,实现供应链全环节数据无缝对接。(6) 合规性保障:开发模型可解释性工具,向监管机构与消费者透明化检测逻辑,避免“算法黑箱”争议,确保检测结果的法律效力与责任追溯机制。
本研究通过AKConv、SimAM与MPDIoU的协同创新,构建了适配电商需求的番茄多任务检测模型,为农产品智能化质检提供了新范式。未来,随着算法优化、数据融合与系统集成的持续深入,该技术有望进一步拓展至果蔬全品类检测,推动电商供应链向高效化、透明化、绿色化方向演进,最终实现消费者、农户与平台的多方价值共赢。