1. 引言
1.1. 研究背景与意义
锂离子电池凭借高能量密度、长循环寿命和低自放电率等优势,在新能源汽车、便携式电子设备和储能系统等领域得到广泛应用。然而,在长期使用过程中,锂离子电池会因锂离子沉积、SEI膜增厚和活性物质损失等造成容量衰减和内阻增加,这不仅降低了电池的使用性能,还可能引发安全隐患。电池管理系统估算电池荷电状态和剩余电量与电池的容量有关,若电池管理系统能掌握电池的老化规律和健康状态,将有助于其做好电池全寿命周期的电池管理。
目前传统的锂离子电池SOH评估模型主要有电化学模型、等效电路模型和相关经验模型三种。这些方法虽然具有明确的物理意义,但依赖于复杂的参数辨识和建模过程,对电池的工作条件和特性了解要求较高,且计算难度大,难以满足实际应用中对实时性和准确性的要求,随着大数据和人工智能技术的快速发展,基于数据驱动的方法逐渐成为SOH估计的热点。该方法直接从电池的历史运行数据中提取特征并建立模型,无需深入了解电池的内部机理,具有适应性强、建模简单等优点。
在基于数据驱动的方法中,循环神经网络(Recurrent Neural Network, RNN) [1]及其变体,如长短期记忆网络(Long Short-Term Memory, LSTM) [2]和门控循环单元(Gated Recurrent Unit, GRU) [3],这两种网络能够高效处理时序数据中的长期依赖关系,在SOH估计中广泛应用。但是,传统的RNN类模型在处理长序列数据时容易出现梯度消失或梯度爆炸的情况,造成长距离依赖信息捕捉能力弱。尽管LSTM和GRU通过引入门控机制来缓解这一问题,但是在应对复杂非线性和长期依赖特性的锂离子电池时,建模能力还有待提高。
Transformer [4]模型因为其独特的自注意力机制(Self-Attention Mechanism),在自然语言处理、计算机视觉等领域获得了巨大成功。自注意力机制可以对序列中的每个位置进行全局建模,捕捉长距离依赖关系,克服了传统RNN类模型的局限性,但是,单一的Transformer模型在处理时序数据时,对局部动态特征的捕捉能力不足,计算复杂程度偏高,在面对一些含有高频噪声的电池数据时,容易受干扰,造成模型性能下降。
因此,本文研究目标是如何将Transformer与GRU的优势结合,取长补短,提高锂离子电池SOH估计的精度和稳定性。另外,通过有效的数据预处理技术可以进一步提高模型性能,例如变分模态分解[5] (Variational Mode Decomposition, VMD)可以对电池数据进行特征分解和降噪处理,粒子群优化[6] (Particle Swarm Optimization, PSO)可以对模型超参数进行优化。
1.2. 研究现状与挑战
最近几年,大批的研究人员对锂离子电池SOH估计做了广泛研究,提出了一系列基于数据驱动的方法。沈晨普等人[7]通过筛选出充电温度最大时间、放电温度最大值等8个特征,构建LSTM网络预测模型,实现SOH预测,但是分析的数据集中于“温度时序”相关指标,未考虑到电池内阻、循环寿命等其他核心指标,可能导致模型对电池老化机理的覆盖不够全面;朱成杰等人[8]利用北方苍鹰算法优化GRU网络,构建SOH预测模型,以电池充放电电压、温度等数据作为输入,实现SOH估计,但对于复杂的模型电池数据,模型的适应性需要进一步提升。这些传统循环神经网络模型在处理短期时序特征方面都有一定优势,但是都基于递归的方式,很难高效捕捉到电池退化过程中的全局依赖关系,造成SOH估计精度不高。
一些学者尝试将Transformer应用在SOH估计的研究中,例如,舒星等人[9]提出一种融合卷积神经网络和Transformer的锂离子电池SOH估计方法,在处理复杂退化模式和碎片化数据时表现突出。然而,其模型层级特征难以直接对应电池的物理退化机制;黄煜峰等人将卡尔曼滤波引入,优化Transformer网络,实现提取电池健康状态变化特征,同时Transformer网络可以更好地捕捉电池健康状态的非线性变化,然而Transformer的注意力权重和卡尔曼滤波的状态转移矩阵无法明确解释SEI膜增厚或活性物质脱落等微观现象。总体而言,Transformer模型在处理长序列依赖方面具有显著优势,但其对局部动态特征的捕捉能力和对噪声的鲁棒性仍需进一步优化。
此外,在数据预处理和模型优化方面,也有一些研究成果。VMD是一种有效的信号分解方法,它可以将复杂信号分解成多个具有不同中心频率的模态分量,在电池数据处理中得到了应用。于沛等人[10]从电池历史充放电老化数据中提取与电池SOH密切相关的健康因子,通过冗余处理,重构出包含信息充分的融合健康因子,利用VMD将融合健康因子信号分解成若干模态分量后,使用LSTM训练模型,最后实验结果也表明有效提高了SOH估计精度;粒子群优化算法(PSO)是一种智能算法,主要用于模型超参数优化,例如张楚研[11]利用自适应权重粒子群优化算法优越的全局搜索能力,对模型的输入端进行细化,将趋势项的预估误差降到0.01以下。然而,如何将这些预处理和优化技术与Transformer-GRU模型进行有机结合,充分发挥各自的优势,实现SOH估计性能的全面提升,仍有待深入研究。
目前锂离子电池SOH估计主要面临如下挑战:一是如何将Transformer和GRU的优势结合,使其能同时捕捉电池数据的全局依赖和局部动态特征;二是如何提高模型对电池数据中高频噪声和异常值的鲁棒性,增强模型的泛化能力;三是如何提升模型的计算效率,降低计算成本,满足实际应用中的实时性要求;四是如何结合数据预处理和模型优化技术,进一步提升SOH估计的精度和稳定性。针对这些挑战,本文提出一种融合变分模态分解与粒子群优化的Transformer-GRU联合模型,旨在实现高精度的锂离子电池SOH估计。
2. 联合模型设计
2.1. 原始数据清洗与归一化
锂电池数据采用NASA提供的锂电池数据集,该数据集主要包括在不同工况下,多组电池的充放电循环数据,参数包含电池电压、电流、容量、温度等,详细记录了电池从初始状态到老化状态的完整过程。由于实际采集的数据可能存在噪声、测量误差以及异常波动等问题,这些因素会影响模型对电池真实退化趋势的学习,所以要对原始数据进行清洗。利用Z-score法检测数据中的异常值,该方法基于数据的均值和标准差来识别偏离正常范围的数据点。对于给定的数据点
,其Z-score值的计算方式为:
(1)
其中,
为数据的均值,
为标准差。若某个数据点的
大于设定的阈值,则将其判定为异常值,并采用线性插值或基于邻域的统计方法修正,确保数据的可靠性。
在数据清洗的基础上,接下来需要采用最小最大归一化对数据进行归一化处理,将每个特征的数据缩放到
区间,通过这样的操作可以消除不同特征之间量纲和尺度的差异,避免模型训练过程中,一些特征因为数据问题造成模型学习方向偏差。具体计算公式如下:
(2)
其中,
为原始数据,
和
分别为该特征数据的最小值和最大值,
为归一化后的数据,经过归一化处理后,不同特征的数据处于同一尺度,有助于提高模型训练效率和稳定性。
2.2. 变分模态分解(VMD)
锂电池容量序列包含丰富的电池SOH状态信息,但由于受到多种复杂因素干扰,呈现出复杂的非线性和非平稳特征。使用变分模态分解(VMD)方法对其进行多尺度分解,提取容量序列的关键特征。VMD是一种基于变分理论的自适应信号分解方法,它可以将复杂信息分解成多个具有不同中小频率和带宽的本征模态函数(IMF),每个IMF代表了信号在不同时间尺度上的特征分量。
VMD通过构建一个变分模型,将信号分解问题转化为约束优化问题,目标是最小化各模态的带宽之和,并保证各模态的重构误差最小。首先初始化模态数
和惩罚函数
,模态数
决定分解后的子信号数量,这个值需要根据信号复杂度和实际需求来设定;惩罚参数
是用来控制各模态的带宽约束,数值过大会造成分解结果过度平滑,丢失重要细节信息,数值过小会造成模态混叠,影响分解效果。然后利用交替方向乘子法(ADMM)迭代更新各模态
、中心频率
和对偶变量
,逐步逼近最优解,迭代公式如下:
(3)
(4)
(5)
其中,
表示傅里叶变换,
是第
个模态在第
次迭代时的傅里叶变换,
是第
个模态在第
次迭代时的中心频率。迭代过程直至满足收敛条件或达到最大迭代次数,最终得到
个IMF分量。
VMD分解效果依赖模态数
与惩罚参数
,结合锂电池容量序列的非线性衰退特性,通过以下方式确定参数:
模态数
:采用“能量占比–试错法”,在
= 3~6范围内测试,当
= 4时,各模态能量占比均大于5%,且容量序列重构误差(重构值与原始值的MAE)降至0.02 Ah以下,故确定
= 4;
惩罚参数
:
控制模态稀疏性与噪声抑制能力,通过网络搜索(
= 1000~5000)发现,当
= 2000时,模态间混叠程度(交叉相关性 < 0.1)最低,且中心频率分布均匀,最终取值
= 2000;
其他参数:最大迭代次数
,确保分解收敛。
然而分解得到的IMF分量中可能包含噪声以及一些无效的高频分量。采用中心频率法进行分析可以筛选出有效模态。计算各IMF的中心频率熵,中心频率熵反映了信号在频率域的不确定性和复杂性,有效模态是指熵值稳定同时能量占比前80%的模态,保留有效模态,去除噪声和无效高频分量,可以得到主趋势子序列与高频子序列。通过VMD分解和有效模态筛选两种方法,可以将锂电池容量序列中不同特征分量分离出来,为后续模型输入提供更有效的数据,有利于提高SOH估计模型的数据捕捉能力。
2.3. Transformer
Transformer架构选择编码器模块,用于对主趋势子序列进行处理 ,编码器模块的核心是多头自注意力层(Multi-HeadSelf-Attention),通过多个“头”并行计算不同子空间的序列相关性,从而实现从多个角度捕捉序列中的长距离依赖信息。本模型中,设置8个注意力头,每个头分别计算查询矩阵(Query)、键矩阵(Key)和值矩阵(Value)之间的点积相似度,并通过缩放和平滑操作得到注意力权重,再根据注意力权重对Value进行加权求和,得到每个头的输出,最后将8个头的输出拼接在一起,经过线性变换得到多头自注意力层的最终输出,具体计算公式如下:
(6)
(7)
其中,Q、K、V分别为查询矩阵、键矩阵和值矩阵,
为键矩阵的维度,用于缩放点积,防止梯度消失或爆炸,
为头的数量,
为输出的线性变换矩阵。
前馈神经网络(FFN)对自注意力输出进行处理,增强特征的表达能力。FFN由两个线性变换和一个ReLU激活函数构成,对每个位置进行独立变换,能够引入非线性,让模型可以学习到更复杂模式,数学公式如下:
(8)
其中,
为输入,
、
和
是可学习的参数。
引入位置编码解决Transformer无法感知序列位置信息的问题,通过正弦函数和余弦函数的组合为每一个位置生成一个唯一的编码向量,将位置编码向量与输入特征向量相加,从而将时序位置信息输入到模型中,这样模型对不同位置的元素有了区分能力,公式如下:
(9)
(10)
其中,
表示位置,
表示维度索引,
为模型的维度。
2.4. GRU
高频子序列中包含了电池充放电过程中的短期动态变化信息,门控循环单元(GRU)可以有效处理短期依赖关系,它通过引入更新门和重置门,能够自适应地控制历史信息的保留程度,更新门控制历史信息传递到当前时刻,重置门用以控制过去状态的遗忘程度。其计算公式如下:
(11)
(12)
(13)
(14)
其中,
为更新门,
为重置门,
为候选隐藏状态,
为当前时刻的隐藏状态,
、
、
为权重矩阵,
为sifmoid激活函数,*表示元素相乘。
采用双向GRU结构可以增强模型对高频子序列中局部依赖关系的建模能力,双向GRU结构由前向GRU和后向GRU组成,前向GRU从序列头至尾进行计算,后向GRU则相反,然后将两个方向的结果拼接到一起作为最终输出。
2.5. 多模态预测融合
Transformer编码器对主趋势子序列进行建模,输出主趋势预测值,反映了电磁SOH的长期变化趋势;GRU对高频子序列进行处理,输出高频波动预测值,反映了电池充放电过程中的短期动态特征。将两个输出结果加权融合得到最终的SOH估计结果,公式如下:
(15)
其中,
为权重,取值范围为[0, 1],在验证集上确定最优值,获得更加准确的SOH估计结果,多模态预测融合的方式可以综合考虑电池SOH长期趋势和短期波动,大大提高SOH估计的准确性与稳定性。
2.6. 粒子群优化超参数调优
多模态预测融合模型的性能受到多个超参数的影响,如Transformer的层数、注意力头数、GRU的隐藏层维度、学习率等。超参数的数值影响到模型的预测精度和泛化能力,因此采用粒子群优化(PSO)算法对这些超参数进行调优,PSO算法是一种基于群体智能的随机搜索算法,它起源于模拟鸟群觅食的行为,通过粒子之间的信息共享和协作,在超参数空间寻找最优解。
首先,构建一个包含Transformer层数、注意力头数、GRU隐藏层维度、学习率等10维超参数空间,每个粒子在这个超参数空间中代表一组超参数值。在每次迭代中,粒子根据自身的历史最优位置(
)和整个粒子群的全局最优位置(
)来更新自己的速度和位置,更新公式如下:
(16)
(17)
其中,
是粒子
在时间
的速度,
是粒子
在时间
的位置(即超参数值),
是惯性权重,用于平衡全局搜索和局部开发能力,
和
是个体学习因子和群体学习因子,
和
是在
内的随机数,
是粒子
的历史最优解,
是整个粒子群的最优解。
在每次迭代中,使用验证集来评估不同超参数组合的优劣,用均方差(MSE)作为适应度函数,计算模型预测值与真实值之间的误差,MSE数值最小即为最优,训练策略是连续10次验证误差未下降时,停止优化过程,这时的超参数即为最优组合。通过PSO算法优化超参数,可以使Transformer-GRU模型的性能最大化,提高SOH估计的精度和鲁棒性。
3. 实验与结果分析
3.1. 实验设置
为了验证所提出的融合变分模态分解(VMD)与粒子群优化(PSO)的Transformer-GRU联合模型在锂离子电池SOH估计中的性能,采用NASA锂电池数据集进行实验。选择数据集中5号、6号、7号和18号电池的多组充放电循环数据,其涵盖了电池在不同工况下的状态信息。实验中,模型的输入为电池的放电容量数据,通过对放电容量的分析来推断电池的健康状态变化;模型的输出是当前电池的最大可用容量与其初始容量的比值,以此量化电池的健康程度(SOH),便于评估模型的预测准确性。
为了准确评估模型的准确性,选择平均绝对误差(MAE)、决定系数(
)和均方根误差(RMSE)作为评估指标
(18)
(19)
(20)
式中,
样本真实值;
为样本预测值;
为真实值的平均值。
本实验中选择多个具有代表性的模型作为对比,来验证Transformer-GRU联合模型的优越性,多层感知机(MLP) [12]可以处理非线性问题,但无法对时序信息进行有效建模,在锂电池SOH估计存在局限性;循环神经网络(RNN)虽然可以处理时序依赖关系,但是无法处理长序列数据,易出现梯度爆炸情况;长短期记忆网络(LSTM)通过引入门控机制[13],在一定程度上解决了RNN网络的问题,能够更换捕捉长期依赖关系;Transformer-MLP模型[14]结合两个网络的优点,在处理长序列数据有一定优势,但是对局部动态特征处理能力不足;高斯过程-GRU (GP-GRU)模型[15]将高斯过程的不确定性建模与GRU时序处理结合,是SOH估计的一个新思路。通过对比以上这些模型,可以更好地评估Transformer-GRU联合模型的性能。
在模型训练过程中,采用统一的训练配置,使用Adam优化器对模型参数进行更新,学习率设置为0.001,批量大小设置为32,训练轮次设定为50,在训练过程中,通过监控验证集上的损失函数值,采用早停策略,当连续5轮验证集损失函数值没有下降时,停止训练,以防止模型过拟合,提高模型的泛化能力。
3.2. 实验结果
实验结果表明,本文的Transformer-GRU联合模型在锂电池SOH估计中表现出色,与其他模型相比,具有更高的预测精度。数据对比如表1所示。
从表中可以看出,Transformer-GRU联合模型在各项指标上表现最优,MAE低于0.62%,RMSE低于1.19%,R2高达0.871。从指标中可以看出,Transformer的全局捕捉能力可以有效获取到电池退化过程中的长期依赖信息,而GRU可以捕捉高频子序列中的短期动态特征,两者结合让模型捕捉电池数据特征更加准确,从而提高SOH估计精度。
采用粒子群优化算法(PSO)对超参数调优后,超参数搜索空间与最终取值如下表2所示,优化后验证集MSE较随机初始化降低32.7%,PSO种群规模设为30,迭代次数为50,惯性权重线性递减(从0.9降到0.4),认知系数
= 1.5、社会系数
= 2.0,最终在第38代收敛至最优解。
Table 1. Comparison of evaluation metrics across various models
表1. 各模型评价指标对比
模型 |
MAE (%) |
RMSE (%) |
R2 |
MLP |
1.89 |
3.25 |
0.721 |
RNN |
1.56 |
2.87 |
0.785 |
LSTM |
1.23 |
2.31 |
0.823 |
Transformer-MLP |
1.05 |
1.98 |
0.850 |
GP-GRU |
0.87 |
1.65 |
0.862 |
Transformer-GRU (本文) |
0.62 |
1.19 |
0.871 |
Table 2. List of values obtained through the optimization of hyperparameters
表2. 超参数优化取值表
超参数类别 |
超参数名称 |
搜索空间 |
优化后取值 |
Transformer模块 |
编码器层数 |
[1, 3] |
2 |
注意力头数 |
[4, 12] |
8 |
隐藏层维度 |
[128, 512] |
256 |
GRU模块 |
隐藏层维度 |
[64, 256] |
128 |
层数 |
[1, 2] |
2 |
训练参数 |
学习率 |
[10−4, 10−1] |
5 × 10−3 |
批量大小 |
[16, 64] |
32 |
正则化参数 |
L2正则化系数
|
[10−3, 10−1] |
5 × 10−2 |
Figure 1. Comparison diagram of SOH prediction curves
图1. SOH预测曲线对比图
如图1所示为本文模型预测SOH值与真实SOH值的曲线对比图,同时增加了LSTM模型预测SOH的结果曲线,横坐标数值为循环次数,从图中可以看出,在早期衰退阶段(1~100循环)时,SOH从0.1降到0.95,预测MAE为0.32%,因为容量波动小,模型与真实值符合度最高,在中期稳定阶段(101~300循环)时,出现3次轻微容量再生,本文模型捕捉再生现象的延迟小于2个循环,而STM则差距更大。在后期加速衰退阶段(301~500循环)时,SOH降到0.6,衰退速率提升2倍,本文模型MAE为0.75%,仍然低于LSTM的1.23%,因此Transformer有效捕捉了长期衰退趋势,GRU拟合了加速阶段的高频波动。
3.3. 消融实验
为了验证VMD和PSO对Transformer-GRU联合模型性能的影响,针对这些因素,进行消融实验,如表3所示为实验结果对比。
Table 3. Ablation experiment comparison
表3. 消融实验对比
模型 |
MAE (%) |
RMSE (%) |
R2 |
Transformer-GRU |
1.37 |
2.21 |
0.748 |
VMD + Transformer-GRU |
0.89 |
1.52 |
0.835 |
PSO + Transformer-GRU |
1.03 |
1.75 |
0.805 |
VMD + PSO + Transformer-GRU |
0.62 |
1.19 |
0.871 |
从表中可以看出,VMD和PSO在Transformer-GRU联合模型中发挥了重要作用,VMD通过对数据预处理,提升了模型对特征的提取能力;PSO通过对超参数进行优化,增强了模型的性能和泛化能力。两者的结合是实现高精度锂电池SOH估计的关键因素。
4. 结论与展望
本文提出融合变分模态分解(VMD)与粒子群优化(PSO)的Transformer-GRU联合模型,在锂电池SOH估计中取得了显著成果,与其他模型对比性能突出。通过VMD对电池容量序列进行多尺度分解,有效提取了主趋势子序列与高频子序列,降低了噪声和无效信息对模型的干扰,提高了特征提取的准确性和有效性;利用PSO对Transformer-GRU模型的超参数进行优化,增强了模型的泛化能力和稳定性,使模型能够在SOH估计任务中达到更好的性能表现。