1. 引言
植物叶子病虫害对农作物的危害是比较大的,其中番茄也是一种重要的经济作物,因此准确地检测和识别出不同番茄叶子病虫害对于病虫害防治也是至关重要的。传统的番茄种植,是人为发现作物出现病虫害后,通过经验识别具体病虫害再进行农药的喷洒来对病害加以控制。但是这种人工识别方法存在着许多问题,主要依赖于种植户的经验和观察,存在主观性、精度低、效率慢等问题,因此利用现有技术设计一种新的快速、准确的识别模型是很有必要的。
随着人工智能和深度学习的发展,卷积神经网络(Convolutional Neural Network, CNN) [1] 由于其较高的识别精度和泛化能力,成为图像识别领域中最成功的技术之一,研究人员关于植物叶片识别做了很多的研究。Sladojevic等 [2] 通过深度卷积网络技术提出了叶片病害的识别模型,该模型能有效识别13种植物病害,并能区分植物叶片及其周围环境。Liu等 [3] 设计了基于AlexNet的植物病害检测模型,用于苹果叶片的识别。Yao等 [4] 提出了一种基于VGG16的改进模型来识别苹果叶部病害,其中使用全局平均极化层代替全连接层以减少参数,并加入批量归一化层以提高收敛速度。Zeng等 [5] 提出了一种群体多尺度注意力网络(GMA-Net)用于橡胶树叶部病害图像识别,开发用于多尺度特征提取的组多尺度空洞卷积(GMDC)模块和用于多尺度注意力特征融合的跨尺度注意力特征融合(CAFF)模块。虽然这些模型提高了植物叶片病害识别的准确性,但其模型的网络结构复杂,包括多层(conv和FC),同时训练这些层需要大量的时间资源和参数。
为了解决上述问题,本文针对番茄叶片病害的分类问题,基于空洞卷积神经网络设计了一个准确、可靠的番茄叶片病害分类模型。该模型主要利用空洞卷积技术来训练网络模型,并利用批量归一化技术来加速模型收敛,采用随机失活技术避免过拟合问题;同时再利用批量归一化技术和随机失活技术减少了模型的训练次数,提高了植物叶片病害的分类效率;最后经过实验对比与其他网络模型的分类效果,表明该模型在解决番茄病害分类上,无论是参数量还是分类精度都达到了最好的效果。
2. 卷积神经网络模型
随着深度学习的发展,如今的CNN [6] [7] 能够应用于图像识别、自然语言处理等多个领域,已经发展成了一种最实用的工具。CNN由一个或多个卷积层和顶端的全连通层组成,同时也包括关联权重和池化层。卷积层是神经网络中的核心,可以多层次地对数据特征进行提取,得到更多图像的抽象特征 [8] 。CNN中每层卷积层由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积层一般存在多个卷积核同时进行卷积,不同卷积核生成的不同图像可以理解为是该输入图像的不同通道,正因为卷积核的参数共享特点,大大减少网络参数量,减少过拟合现象。
池化是卷积神经网络中另一个重要的概念,经过池化操作,特征图的大小和其中有用的特征信息被有效地压缩和筛选,卷积神经网络的性能得以提高。池化层一般在卷积层和ReLU函数之后,它能够在高度和宽度进一步减小上一层矩阵的大小,也就是降低特征的维度。池化处理是对不同位置的特征进行结合,通常分为最大值池化和平均值池化,池化处理后的图像不管是旋转还是平移,都不影响对其的识别。全连接层一般用来做分类任务,用来综合前面对图像提取到的特征,便于后续的分类。激活函数就是对线性组合的结果施加一个非线性变换,这种方法可以在处理数据或训练模型过程引入非线性特征,以便于更好地获取数据中的复杂成分。
空洞卷积神经网络(Dilated Convolutional Neural Network, DCNN)是一种卷积神经网络结构,它通过在卷积核内部引入空洞(Dilation)来扩大感受野,从而改善了神经网络提取图片特征的效果。DCNN则可以在不增加参数量的情况下,通过在卷积过程中增加空洞参数,使每个卷积核可以访问更远的像素点,进而扩大了感受野,提高了网络的特征提取能力,有利于对模型的学习训练。
随机失活(Dropout)方法由Hinton教授团队提出,它的含义是在训练神经网络时,将某一层神经单元按失活率随机丢弃部分数据。在进行训练的过程中,Dropout方法能够对网络结构起到简化作用,可以防止神经元之间的过度依赖,并且可以让网络学习到更多的特征,防止发生过拟合现象。批量归一化(BN) [9] 是深度学习里对数据进行处理的一项技术,对数据进一步标准化,使得数据的分布更加均匀,使得网络的训练效果更佳。当网络模型训练时,由于输入数据分布的不稳定和不同层之间的参数差异,会使得训练变得更加复杂和不稳定,同时也会导致梯度消失和梯度爆炸的问题。批量归一化通过对每个小批次数据进行归一化,使得数据分布在同一范围内,缓解了层与层之间分布差异造成的不稳定性,从而提升了网络的收敛速度和泛化能力。

Figure 1. Convolution kernel of extended convolution
图1. 扩展卷积的卷积核
番茄病害种类繁多,不同病害之间存在一定的相似性,在早期发病时病斑微小,难以提取病斑的细节纹理信息。同时病斑的叶片颜色与健康叶片非常接近,很难区分病斑的边缘、轮廓等特征。如图1所示,扩展卷积通过引入卷积核之间的扩展可以扩展感受野,从而提高提取特征的学习能力。与一般卷积相比,扩展型卷积在不增加参数和减小图像尺寸的情况下扩大了感受野。基于这一优势,可尝试在模型中引入扩展卷积来提高特征提取的能力。
本文的输入图像数据为32像素高和宽,是三通道的图像,基于此提出了一个空洞卷积网络模型 (Dilated Convolutional Network, DCNet)来分类植物图片中的番茄叶片,主要包含一个卷积块、两个池化层、三个随机失活层、一个扩展卷积块、一个全连接层和一个Softmax分类器,DCNet模型如图2所示。首先在卷积块中,使用两个相同的3 × 3卷积和32个过滤器来提取叶子的特征;然后,使用2 × 2池化层减小图像大小;其次,应用随机失活来减少卷积块产生的冗余特征。接下来再设计了一个由两个相同的3 × 3扩展卷积组成的扩展卷积块进一步提取特征,与一般卷积相比,其在没有额外参数的情况下提高了学习能力;同时利用第二个2 × 2池化层来进一步减小图像大小;和第一次随机失活类似,第二次的随机失活也用于减少卷积块生成的冗余特征。最后,利用全连接层和Softmax分类器对提取的特征进行组合,对图像进行分类。
3. 实验分析
本文模型训练使用的PlantVillage数据集 [10] 由康奈尔大学的计算机科学家和植物病理学家共同创建,其图像质量和数量都非常高,主要用于植物病害检测和诊断,包括靶点病、斑点病、花叶病毒病、红蜘蛛卷叶病等不同类型的病害。DCNet模型训练过程所用到的优化器为随机梯度下降(SGD),初始的学习率设置为0.01,动量系数设为0.9,通过衰减因子不断地调整学习率大小来使模型逐渐变优。利用DCNet模型对数据集中的图片进行识别分析,通过图3和图4可以看出本模型能准确识别出晚疫病毒病、黄化曲叶病毒病等不同番茄叶片病虫害,对不同番茄叶片病虫害的识别准确率较高,应用性较强。

Figure 3. Classification of late blight
图3. 晚疫病分类结果图

Figure 4. Yellow leaf curl virus disease classification results
图4. 黄化曲叶病毒病分类结果图
图5表明了本文设计的DCNet模型在训练精度、测试精度方面的趋势结果,从整体趋势来看,本文设计的DCNet模型随着轮次的增加曲线逐渐上升并趋于稳定,进一步显示了该模型的精确率较高,具有一定应用价值。

Figure 5. Accuracy of training and testing
图5. 训练和测试的准确率
其次,为了验证DCNet模型的优劣性,将其与VGG16、VGG19、ResNet18、GoogLeNet、AlexNet等CNN模型进行了对比测试,主要对比其识别叶片的测试精度和参数量。表1为模型的测试精确度对比,测量结果表明模型DCNet在PlantVillage的子集番茄叶片的测试中测量精度达到最高,证明了该模型精确率更高,应用性更强。表2为模型的参数量对比,通过参数量可以看出与其他网络模型相比,本文所用到的DCNet模型的参数计算量相对较少,在训练时间方面上更具优势,时间效率高。

Table 1. Test accuracy comparison of models
表1. 模型的测试精确度对比

Table 2. Comparison of parameters of the model
表2. 模型的参数量对比
4. 总结
本文设计了一个空洞卷积神经网络模型来分类植物图片中的番茄叶片病害,该模型主要利用空洞卷积技术来训练网络模型,并利用批量归一化技术来加速模型收敛,采用随机失活技术避免过拟合问题;同时在利用批量归一化技术和随机失活技术减少了模型的训练次数,提高了植物叶片病害的分类效率。DCNet模型通过与VGG16、VGG19、ResNet18、GoogLeNet、AlexNet等CNN模型之间的实验对比,可以看出DCNet模型不管是在图像测试精度上还是在模型参数量方面,都具备一定的优势,表明该DCNet模型的实用性和准确性高。在当今深度学习快速发展的时代,卷积神经网络还是有很大的发展空间,未来可以探索其在其他应用领域的发展。
基金项目
广州软件学院校级项目(ky202103, ky202207, ky202108, ky202201)。