1. 引言
电池极片毛刺是指电池极片表面突出的细小金属或其他杂质,可能会导致电池在工作过程中出现短路、漏电等安全问题,甚至影响电池的性能和寿命[1]。在极片表面存在毛刺会导致不均匀的电流分布,降低了电池的传输效率,进而缩短了电池的寿命[2]。通过检测和处理毛刺,可以提高电池的性能并延长其使用寿命。在生产线上对电池进行毛刺检测,可以及早发现问题并及时进行修正,避免将有缺陷的电池装配到最终产品中,从而节省成本和时间。
目前对极片缺陷检测的研究,包括传统图像处理算法和人工智能算法。传统的毛刺分类检测方法主要包括极片毛刺检测普遍采用目视显微镜[3],存在景深不够、倍率不足,实际测量数据误差较大。当前极片缺陷检测研究有进展,传统目视显微镜检测有局限,不过学者们积极利用先进算法改进。像王[4]等用图像处理与卷积神经网络法经标定轮廓区域延展图像输入模型确定缺陷类型;Mao [5]等以深度学习手段,通过预处理图像增强缺陷特征来构建分类算法;Xu [6]等基于多特征融合和PSO-SVM实现检测与识别;黄[7]等融合特征并借助支持向量机完成缺陷分类。
本文以电池极片毛刺为研究对象,采集缺陷图像并制作数据集,对ResNet18模型进行网络改进,并与其他传统神经网络模型VGG16 [8]、AlexNet [9]、MobileNet_V3_small [10]、ResNet等进行对比分析,验证本文模型对毛刺识别的性能提升。通过对网络改进,实现快速准确地识别不同毛刺类别,为改进工业缺陷检测提供解决方案,提升电池制造安全保证。
2. 数据采集与预处理
Figure 1. Sample images of data for various categories
图1. 各类别数据样图
本文通过工业相机采集全部极片毛刺图像,采集并裁剪后图像的原始分辨率为224 × 224。收集数据集依据电池极片边缘特征精准划分为五类,如图1所示。“Normal”类电池极片边缘极为平滑,无明显毛刺,边缘整齐,无凸起凹陷,彰显卓越加工品质。“Short”类的电池极片边缘偶现短小不连续毛刺,且其垂直延伸未超灰色隔膜界限,属轻微瑕疵且毛刺未超过涂层边缘7 μm。“Long”类的极片边缘毛刺显著伸长,越过隔膜边界7 μm,常因加工流程不稳定,如刀具磨损、切削力不均所致。“Powder”类极片边缘毛刺复杂,伴有大量颗粒或粉末残留,杂质源于加工碎屑、润滑剂残留等,有损外观且威胁电池性能。“Other”类涵盖机器挤压所致特殊情况,尤其隔膜断裂意外。
Table 1. Dataset distribution
表1. 数据集分布
Class |
Normal |
Short |
Long |
Powder |
Other |
Training |
987 |
1185 |
1883 |
415 |
432 |
Validation |
247 |
297 |
471 |
104 |
109 |
Total |
1234 |
1482 |
2354 |
519 |
541 |
训练网络模型时需要足够的数据集样本进行训练,避免网络出现过拟合问题[11]。为了增强数据样本以减少过拟合,提高模型的泛化能力,标准化张量,随机水平翻转图像数据增强等方式,这些转换有助于模型学习对图像中的水平方向不敏感的特征[12],然而这个图像预处理方式并不能改变图像本质,无法获得更加丰富的缺陷特征。
本文将筛选出的5130张图像按照其特征进行人工标注,另外在这些源图像中挑选出部分图像作为图像生成使用的训练集,再利用图像生成1000张图像,最终重新打乱每一个类别的源图像与生成图像按照8:2比例划分为训练集与验证集如表1所示。
3. 模型构建
3.1. 选择主干网络
在针对极片毛刺的分类检测任务中,我们旨在构建一个模型,该模型不仅需维持高精确率与召回率以确保检测准确性,同时需进行轻量化设计,以减少计算资源消耗,加快检测速度,从而充分满足工业生产线上的实时检测需求。传统的深度神经网络存在梯度消失的问题,结合了残差网络的优势,改善梯度消失的问题,并构建更深层的网络结构、提取更复杂和抽象的特征[13]。针对上述问题,何凯明[14]等提出ResNet,核心结构是残差模块(Residual block),能将信息从浅层传递到深层,使网络在增加层数的同时保证性能。本文选择ResNet18作为主干网络,其主要特点包括:引入了残差块,通过跳跃连接来解决深度神经网络训练时的梯度消失问题,帮助网络更容易优化和训练更深的网络,采用基本的卷积、批量归一化、池化等结构。同时,在不同层数的网络中增加了残差块来提高网络性能,在网络的最后采用全局平均池化层来减少模型参数数量和计算量,以及防止过拟合,最后部分是一个全连接层,用于将提取的特征映射到输出类别的分数。
本文结合ResNet网络的优势,在主干网络上做了一些改进具体内容如下:用轻量积代替标准卷积减少模型的参数量与计算量,在残差块中使用融合改进的MSE注意力机制对特征的不同位置提供不同的注意,并进行全局建模,改进后Ours-ResNet18型框架如图2所示,其中Layer1-Layer4分别包括2个残差模块,每一个残差块中都将采用GSConv卷积和MSE注意力机制技术,改进的残差模块结构如图2(a),另外,Layer2-Layer4的第一个残差模块需要将输出和输入的数据维度转换成相同的,采用shortcut方式传递,结构如图2(b)。
Figure 2. The structure diagram of the improved Ours-ResNet18 network
图2. 改进Ours-ResNet18网络结构图
3.2. 改进MSE注意力机制
为了动态地学习输入特征图的通道之间的关系,从而使模型在学习特征表示时能够更加关注重要的特征,本文在网络的残差块中引入SE注意力机制[15]:其基本思想是通过两个步骤来提取通道间的关系:压缩和激励。然而在压缩阶段,将特征图的空间维度压缩到1x1意味着所有空间位置的信息都被整合成了一个单一的值,这会导致空间信息的显著损失。因此在特征图压缩后特征图激励之前引入多头注意力机制:设计了注意力特征编码器对经过特征提取网络的特征图进行运算处理,每个通道的全局特征可以通过多个注意力头来独立处理,捕捉特征图的交互信息[16],提取目标完整信息进而把控图像全局的关键信息,获得更为精细的特征信息并提升网络性能。改进后的MSE注意力机制(Multi-SE-Attention)结构如下图3所示:
Figure 3. Result diagram of the improved MSE attention mechanism
图3. 改进MSE注意力机制结果图
其主要工作原理步骤如下
(1) Squeeze将特征图X跨空间维度
的特映射进行聚合,生成一个通道描述符,将全局空间信息运用全局平局池化的方法压缩到通道描述符中,如式所示。
(1)
式中:
表示输入特征图的通道描述符,
分别代表各通道和空间维度的索引。
(2) 多头注意力机制是一种源于自然语言处理领域的技术,其核心思想是在处理序列数据时,通过计算并分配输入序列中每个位置的注意力权重,使得模型能够更好地捕获关键信息,这种机制在图像处理领域同样适用[17]。
首先将来自特征提取网络的特征图输入到注意力特征编码器,将特征图随机映射为
和
和
三个参数矩阵,之后根据预设的注意力头个数,对Q,K,V进行拆解变换,得到
和
力计算处理,其中自注意力模型为:
(2)
我们在每个注意力头中对,和的不同部分分别进行自注意力计算处理,其中注意力头可表示为:
(3)
将每个注意力头得到的输出矩阵拼接起来,经过全连接层提取特征关联信息,再经过Reshape操作将特征图还原为原来的维度,输出特征图,继续传递到网络的深层次结构中。特征图经过多头注意力机制处理后,捕获到了图像全局的关联性特征,抑制了无关噪声,增强了的特征提取能力和网络表征能力。
(3) Excitation将步骤(2)得到的通过一个全连接层,将得到结果输入到ReLU激活函数中,再通过一个全连接层,最后通过Sigmoid激活函数,如式(4)、(5)所示。
(4)
(5)
式中:
代表ReLU激活函数,
代表Sigmoid激活函数、为全连接层,
的维度为
,
的维度为
。
(4) Reweight操作将每个通道的权重和特征图按照通道相乘得到加权后的
,最终得到按通道加权的输出
,如式(6)、(7)所示:
(6)
(7)
式中:
表示对输入特征图
中的每个通道进行逐元素乘法。
3.3. 轻量化设计
由于在主干网络中融合注意力机制网络的参数量及计算量大大增加,与实际的工业场景模型轻量化的要求不相符,因此需要对网络在保证准确率的情况下对其进行轻量化设计。
传统的深度可分离卷积DSC由DW (Depthwise)卷积和PW (Pointwise)卷积组成,旨在减小计算复杂度和模型参数量,从而提高计算效率和模型性能[18]。从参数计算量的角度分析:标准卷积的参数计算量为
,而深度可分离卷积的计算量为
,其中
为特征图尺寸,
为卷积核尺寸,输入通道数记为M,输出通道数记为N,由式(8)计算可得,深度可分离卷积的计算量与传统卷积计算量的比值为
。
(8)
但DSC有个很明显的缺点:在计算过程中,输入图像的通道信息被隔离,导致DSC的特征提取和融合能力比SC (Standard Convolution)低得多。为进一步加以改进,并让DSC的输出结果尽可能接近SC,Li [19]等人设计了一种将SC、GSConv和shuffle混合使用的GSConv卷积。GSConv模块的结构图如图4所示:
Figure 4. GSConv convolutional structure
图4. GSConv卷积结构
它结合密集计算的准确性和深度计算的轻量化,在确保精度的基础上,不仅解决了传统的深度可分离卷积带来的问题,能减少参数量,还能提高检测速度。DSC、SC、GSConv的时间复杂度如公式(9)~(11)所示,其中,W为输出特征图的宽度;H为输出特征图的高度;
为卷积核的大小;
为每个卷积核的通道数,也是输入特征图的通道数,
为输出特征图的通道数。
(9)
(10)
(11)
4. 实验结果与分析
4.1. 实验平台
使用Linux操作系统,AMD Ryzen Threadripper 3960X 24-Core Processor处理器,24GB显存,NVIDIA GeForce RTX 3090的GPU。开发平台为VScode,使用Cuda 12.0搭建环境,Python 3.10.12编程语言,PyTorch.2.0.1深度学习框架。模型训练200个epoch,设置batchsize为64,通过Pytorch深度学习框架进行模型搭建,算法使用CUDA库进行加速运算。
4.2. 模型评价指标
使用准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1-score作为评价标准,具体定义如式(12)至(15):
(12)
(13)
(14)
(15)
TP表示模型将正类正确分类为正类的样本数量,FP表示将负类错误分类为正类的样本数量,TN表示将负类正确分类为负类的样本数量,FN表示将正类错误分类为负类的样本数量。通常准确率、精确率、召回率和F1-score的值越大,表示模型的分类性能越好。
4.3. 结果与分析
4.3.1. 不同分类模型对比
实验将所提模型Ours-ResNet18与AlexNet、VGG16、MobileNet_V3_small、ShuffleNet_V2_x1_0、ResNet18和ResNet34进行对比,评估所提模型在极片毛刺缺陷数据集上的分类性能和效果,各模型在验证集上的召回率和精确率曲线如表2所示。
Table 2. Comparison of classic classification models
表2. 经典分类模型对比
Model |
Accuracy/% |
Precision/% |
Recall/% |
F1-score/% |
Params/MB |
Cpu/ms |
AlexNet |
88.10 |
88.20 |
88.21 |
88.21 |
217.53 |
32.81 |
VGG16 |
87.99 |
89.82 |
88.38 |
89.09 |
512.24 |
74.26 |
Swin_v2_t |
81.47 |
88.92 |
81.53 |
85.07 |
72.26 |
71.52 |
MobileNet_V3_small |
87.30 |
92.86 |
87.28 |
89.99 |
5.81 |
12.64 |
ShuffleNet_V2_x1_0 |
85.18 |
93.33 |
84.80 |
88.86 |
4.80 |
11.30 |
ResNet18 |
88.07 |
93.73 |
88.15 |
90.86 |
42.64 |
19.57 |
ResNet34 |
88.84 |
94.66 |
88.76 |
91.62 |
81.20 |
27.80 |
Ours-ResNet18 |
96.47 |
96.96 |
96.60 |
96.78 |
28.72 |
15.26 |
由上表2可以看出,对比的AlexNet、VGG16、MobileNet_V3_small、ShuffleNet_V2_x1_0、ResNet18和ResNet34网络模型的F1-score都达到85%以上,其中主干网络ResNet18的F1-score达到90.86%,为对比网络的最高值,所提模型Ours-ResNet18的F1-score达到96.78%,相比改进前F1-score提高5.92%,同时在准确率、精确率和召回率上比改进前分别提升了8.4%、3.23%和8.45%,且都高于其他对比模型;在单张平均检测速度方面,相比改进前大约提高22%,虽然略慢于ShuffleNet_V2_x1_0和MobileNet_V3_small,但F1-score较两个模型分别提高了6.79%和7.92%,企业在毛刺分类检测过程中,单张节拍小于30ms,本文方法检测精度与速度满足实际生产要求。综合评价,所提Ours-ResNet18网络在此次分类任务上减小了模型大小,还兼顾了检测精度和检测速度,综合性能更优。
4.3.2. 模型验证
为进一步验证模型的分类效果,用混淆矩阵查看测试集上各类别分类结果,并得到本文方法与原模型ResNet18在每类缺陷上的识别精确率和召回率评价指标,两个模型的混淆矩阵如图5,实验结果如表3所示。
从表3分析可知在模型改进后,所有类别的精确度(Precision)、召回率(Recall)和F1分数均有显著提升。这表明改进后的模型在识别不同类别的物体时,具有更高的准确度和可靠性。总体而言,改进后的Ours-ResNet18模型在识别不同类别的物体时,性能得到了显著提升。
Figure 5. Comparison of confusion matrices
图5. 混淆矩阵对比
Table 3. Comparison of various indicators before and after model improvement.
表3. 模型改进前后各指标对比
Class |
改进前ResNet18 |
改进后Ours-ResNet18 |
Precision/% |
Recall/% |
F1-score/% |
Precision/% |
Recall/% |
F1-score/% |
Long |
91.62 |
97.45 |
94.44 |
97.68 |
98.51 |
98.10 |
Normal |
92.75 |
98.38 |
95.48 |
96.44 |
98.79 |
97.60 |
Other |
95.95 |
65.14 |
77.60 |
95.33 |
93.58 |
94.44 |
Powder |
94.74 |
86.54 |
90.45 |
97.09 |
96.15 |
96.62 |
Short |
93.58 |
93.27 |
93.42 |
98.28 |
95.96 |
97.10 |
Mean value |
93.73 |
88.15 |
90.86 |
96.96 |
96.60 |
96.78 |
4.3.3. 消融实验
本文结合了多种技术的模型,进行了不同改进模块和不同多头个数的消融实验,如下表4所示:其中结合MSE与GSConv技术Ours-ResNet18-8 (多头个数为8)表现最佳,F1-score达到了最高的96.78%。值得注意的是,随着多头数量的增加(从4到16),准确率并未持续上升,这表明并不是多头数越多模型表现就越优秀。在CPU推理时间上,改进后的Ours-ResNet18模型相比较于没有使用GSConv技术的MSE模型有显著改善,单张cpu检测时间达到了15.26ms。
Table 4. Comparison of different improvement modules.
表4. 不同改进模块对比
Model |
Accuracy/% |
Precision/% |
Recall/% |
F1-score/% |
Params/MB |
Cpu/ms |
SE |
92.08 |
95.06 |
92.20 |
93.61 |
42.98 |
17.07 |
MSE |
93.95 |
95.59 |
93.22 |
94.39 |
43.03 |
19.20 |
GSConv |
92.40 |
95.29 |
92.45 |
93.85 |
26.71 |
14.73 |
SE-GSConv |
91.52 |
95.17 |
91.86 |
93.49 |
27.05 |
14.01 |
Ours-ResNet18-4 |
96.18 |
96.48 |
95.85 |
96.16 |
27.09 |
13.99 |
Ours-ResNet18-8 |
96.47 |
96.96 |
96.60 |
96.78 |
27.55 |
15.26 |
Ours-ResNet18-16 |
96.25 |
96.93 |
96.48 |
96.70 |
28.72 |
16.31 |
综上所述:结合了MSE与GSConv技术的模型Ours-ResNet18在准确率、精确率、召回率、F1分数以及CPU推理时间上均表现出色,同时保持了较低的参数数量。这表明深度可分离卷积技术是一种有效的模型优化手段,可以在不显著增加模型复杂度的前提下,显著提升模型的性能。
5. 小结
本文旨在解决电池极片毛刺分类难以及检测效率低的问题,通过一系列研究得出以下主要结论:首先,利用工业相机采集电池极片毛刺缺陷图像,并借助图像生成技术构建了更为复杂多样的数据集,为后续精准识别奠定了良好的数据基础。其次,以残差网络作为主干网络,提出基于融合改进MSE注意力机制的识别模型Ours-ResNet18,该机制有效提高了每个毛刺类别的召回率和精确率,同时结合GSConv卷积实现了模型轻量化,显著加快了模型推理速度,进而提升了对毛刺缺陷识别的准确率以及检测效率。最后,经实验验证,Ours-ResNet18网络在构建的数据集上,无论是识别准确率还是检测速度,相较于改进前均有明显提升,并且与其他经典网络对比,此模型在识别细微缺陷特征方面更具优势。但是,Ours-ResNet18也存在一定的局限性,比如网络结构还有进一步完善的空间。后续计划采集更多涵盖其他缺陷类别的极片毛刺缺陷数据,同时持续优化模型,致力于提取更具判别力的特征,以实现更加广泛和细致的缺陷识别,不断提升电池极片毛刺检测的效果。