1. 引言
随着全球气候变化问题日益严重以及人们对环境保护和可持续发展的关注,电动汽车作为一种清洁的交通方式得到了广泛关注和推广 [1] 。在电动汽车产业的发展过程中充电设施是其中至关重要的一个环节。然而随着充电桩数量的不断增加故障问题也逐渐凸显。故障的及时诊断与预测可以确保充电设施的正常运行,降低维修成本,提高用户体验 [2] 。因此研究充电桩故障诊断技术具有重要意义。近年来,国内外学者已在电动汽车充电桩故障诊断领域开展了一系列研究。早期的研究主要依赖于人工检测和经验判断,这些方法存在效率较低且可能出现误判的问题 [3] [4] 。随着数据分析技术的发展,研究者开始尝试利用时间序列分析、频谱分析等方法进行故障诊断 [5] 。这些方法在一定程度上提高了故障诊断的准确率,但仍然存在局限性,如对异常数据敏感、对信号形态的识别能力有限等。为克服这些局限性,研究者转向机器学习领域,尝试应用支持向量机(SVM)、人工神经网络(ANN)、决策树等技术进行充电桩故障诊断 [6] 。这些方法能够自动学习数据中的模式,具有较强的泛化能力。然而,这些方法也存在不足,如SVM对大规模数据的处理能力有限,ANN容易陷入局部最优解等。随着深度学习技术的兴起,研究者开始关注卷积神经网络(CNN)、长短期记忆神经网络(LSTM)等更高效的算法 [7] [8] 。CNN能够自动学习数据的空间特征,因此在图像和信号处理领域取得了显著的成果。LSTM则通过引入门控机制,克服了传统神经网络在处理长时序数据时的梯度消失和爆炸问题,因此在时间序列分析和自然语言处理等领域取得了突破。基于深度学习技术的充电桩故障诊断研究取得了一定的成果,但仍然存在一些挑战。首先,不同类型的故障可能需要不同的诊断方法。例如,由于充电设备部件损坏或外部环境引起的绝缘故障可能表现为电气信号的短时突变,而由于散热部件损毁或长时间高温工作引发的故障则属于累积性故障。针对这些不同类型的故障,单一的深度学习模型可能难以取得理想的效果。因此研究如何将不同的机器学习技术相互融合以提高故障诊断的准确性和可靠性成为一个研究热点。
2. 充电桩故障原因分析
充电桩作为电动汽车充电的关键设施,其稳定性和可靠性直接影响到电动汽车的使用和推广。为了更好地进行充电桩故障诊断,首先需要了解充电桩可能出现故障的原因。根据充电桩的工作原理和实际运行情况,充电桩故障的原因大致可以分为以下两大类 [9] :
1) 绝缘故障:这类故障通常是由充电设备相应部件损坏或者外部环境引起的。例如,充电桩内部的电子元器件、接线端子、继电器等可能因为生产质量、使用寿命或者外部环境因素(如高温、湿度、腐蚀等)而出现损坏,导致充电桩无法正常工作。这类故障表现为电气信号的短时突变,可以通过支持向量机(SVM)等传统机器学习方法进行诊断预判。
2) 高温故障:这类故障通常是由于充电设备的散热部件损毁或者长时间工作导致温度过高而引发的。例如,充电桩在运行过程中会产生热量,如果散热系统(如风扇、散热片等)出现故障或者长时间高温工作,可能影响充电桩的稳定性和寿命,甚至引发安全隐患。这类故障属于经过一段时间累计影响而产生的故障,可以使用长短期记忆神经网络(LSTM)等深度学习方法进行诊断预判。
3. 基于多模态融合诊断方法
在充电桩故障诊断研究中,结合多种技术和方法的多模态融合策略具有显著的优势。多模态融合方法可以有效地提高故障诊断的准确性和效率,以应对不同类型的故障。本节将介绍基于多模态融合的故障诊断方法在绝缘故障和散热故障诊断中的应用。
3.1. 绝缘故障诊断方法
对于绝缘故障,由于其表现为电气信号的短时突变,传统机器学习方法如支持向量机(SVM)在此类问题的诊断中具有较好的表现。SVM算法可以有效地区分正常和异常电气信号,从而实现故障的预判 [10] [11] 。SVM的基本思想是找到一个最优的超平面来将不同类别的数据点分开,使得不同类别的数据点到超平面的距离最大化。如图1在二分类问题中,SVM的目标是找到一个超平面,使得离该平面最近的数据点到平面的距离最大化,这些离超平面最近的点被称为支持向量。如图1所示,黑色点和白色点表示两个不同的类别,黑色的实线段线即为最优的超平面,支持向量为最靠近超平面的点。
针对绝缘故障模型数据集,增加了外部环境数据及汽车充电设备规格特征数据,得到了最终的数据集。在该数据集中分析了绝缘预警与故障之间的关系,并发现汽车充电设备的规格特征对这种关系有着很强的影响。通过去除记录条数少的品类,得到了更加精确的结果,表明不同品类的汽车充电设备在出现绝缘警告之后一定时间内发生绝缘监测故障的概率不同。具体而言,在绝缘监测警告发生后,某些品牌的汽车充电设备出现绝缘故障的概率高达近50%。因此当某品牌的充电设施出现绝缘告警后,应该及时采取现场人工计量检修措施以避免绝缘故障的发生,从而影响用户的充电体验。数据指标的说明如表1所示:

Table 1. Description of the training data indicators of the insulation fault diagnosis model
表1. 绝缘故障诊断模型训练数据指标说明
在应用模型进行数据集训练时,发现初始数据集存在严重的样本不均衡问题,其中常规样本过多。为了解决这个问题,我们采取了两个步骤来优化数据集。首先,我们剔除了过多的常规样本数据,然后对数据集进行了类别归一化。这些措施使得数据集的样本数量减少到1125条,并且可以更适合用于模型训练。为了更好地利用这个数据集,采取随机打乱的方法来划分数据集为训练集、测试集和验证集,比例分别为8:1:1。在这个过程中,我们特别注意了数据的采集间隔,将其设置为每分钟一次。这些措施可以有效减小样本间的相关性,提高模型的鲁棒性和泛化能力。
在本模型的训练过程中,如图2,我们首先要设定数据域并遍历各项超参数的数据域,以训练集进行训练。在对所有可能的超参数组合进行训练之后,需要通过在验证集中评估每个模型的准确率来选择最佳的超参数组合,以重新初始化模型用于故障预测。通过这个过程,我们可以选择出最优的超参数组合,从而提高模型的准确性和泛化能力。同时,在整个训练过程中,需要注意避免过拟合和欠拟合的问题,以确保模型的性能和可靠性。

Figure 2. Logic flowchart of insulation fault diagnosis model
图2. 绝缘故障诊断模型逻辑流程图
根据先前进行的准确率对比,选择合适的超参数对模型进行初始化。接着,加载在训练过程中保存的模型,在输入数据后,按照SVM的特点和之前得到的数据划分参数,对数据属性进行有放回的划分,得到不同属性组合的子数据集。这些子数据集将被用于生成用于回归分析的SVM模型。
3.2. 高温故障诊断方法
对于高温故障,由于其属于经过一段时间累计影响而产生的故障,深度学习方法如长短期记忆神经网络(LSTM)在处理时序数据方面具有优势。LSTM可以自动提取数据中的时序特征,识别温度过高导致的故障。此外,LSTM可以处理长序列数据,捕捉长期依赖关系,使其在散热故障诊断中具有较高的准确性。
LSTM (Long Short-Term Memory)是一种常用于处理序列数据的循环神经网络(Recurrent Neural Network, RNN)结构,由于其优秀的长时记忆性能,已经被广泛应用于自然语言处理、语音识别、图像处理等领域。LSTM的主要目的是解决传统RNN中的梯度消失或梯度爆炸问题,这两个问题在序列长度较长时,会使得RNN无法有效学习长序列之间的依赖关系。为了解决这个问题,LSTM引入了三个门控(Gate)机制:输入门(Input Gate)、遗忘门(Forget Gate)和输出门(Output Gate)。输入门控制着输入信息的选择,即哪些信息需要被记忆下来。遗忘门控制着记忆的保留和丢弃,即哪些信息需要被保留,哪些信息需要被遗忘。输出门控制着输出的选择,即在当前时刻应该输出哪些信息。这三个门通过神经网络中的权重和偏置进行控制。图3展示了一个标准的LSTM结构图,其中每个矩形代表一个神经网络单元,每个箭头代表一个权重矩阵。
数据包含设备内部温度、充电电压与电流、充电电能四种特征属性的数据。为了将不同数据之间的值域差异化进行缩放,以使得它们处于同一数量级上。首先进行归一化高温故障模型的数据集,通过使用每个特征的最大值和最小值,将数据特征缩放到特定的区间内。
(1)
上式中,x是原始数据,
是归一化后的数据,
是数据中的最小值,
是数据中的最大值。温度属性缩放到(0, 1)以内,其他数据则均被缩放到(0, 10)以内,我们使用12,000条相关数据序列,并将前80%作为训练样本,后20%作为测试样本。
在模型设计阶段如图4,考虑到LSTM具有记忆能力能够有效地处理时间序列数据。因此,我们采用多层LSTM结构来构建模型,以便更好地捕捉数据之间的时间依赖关系。此外,为了避免模型过拟合,加入了Dropout层。Dropout层能够随机地将部分神经元输出设置为0.2,从而减少神经元之间的相互依赖性,避免模型在训练集拟合。最后使用全连接层对LSTM的输出进行整合,得到最终的输出结果。

Figure 4. Logic flowchart of high-temperature fault diagnosis model
图4. 高温故障诊断模型逻辑流程图
4. 试验结果分析
对于绝缘故障,经过整理和处理的数据集被输入到模型中进行训练,得到了一个基于品牌属性和充电设备家族属性的SVM绝缘故障预测模型,该模型可以预测绝缘告警之后发生绝缘故障的概率,最终准确率达到了88.12%。
对于高温故障,生成LSTM的输入数据集需要将时间序列数据转化为可以被神经网络处理的形式,本课题采用滑动窗口的方式对时间序列数据进行分割和组织。将滑动窗口的大小设定为60条时间序列步长设定为1,在训练过程中,采用了Adam优化算法和均方误差(MSE)作为损失函数,以提高模型的训练效果和精度。均方误差公式如下:
(2)
其中,n表示样本数,
表示第i个样本的真实值,
表示第i个样本的预测值。均方误差越小,说明模型预测结果与真实值的差距越小,模型的拟合效果越好。
在模型进行了120轮训练后,使用均方误差(MSE)作为评估指标,得到了大约为0.00045的MSE值。为了预测即将发生的过温故障,模型需要根据最近一批温度和电气数据预测未来一段时间内温度的变化趋势。模型的基本思路是,假设未来短时间内电气数据保持稳定,然后根据60条温度和电气信息序列预测下一个时间点的温度。接着,将预测得到的第61条温度数据和第60条的电气数据组合成新的一组温度和电气数据,基于这组数据再次预测下一个时刻的温度。重复以上过程10次,即可预测出温度的变化趋势。
测试集中高温故障区间的预测效果如图5所示。图中黑色连续线是设备真实的温度曲线,蓝色连续线是预测温度数据的趋势线。通过分析该图,可以发现真实温度和预测温度之间的差异逐渐减小,尤其在高温故障发生时(第30分钟至50分钟之间),预测温度曲线紧随真实温度曲线上升。这表明模型在预测高温故障方面的有效性。
5. 结束语
本文针对汽车充电桩的故障诊断问题提出了一种基于多模态融合的故障诊断方法。首先分析了充电桩故障的主要原因,将其划分为绝缘故障和散热故障两大类。针对这两类故障,我们分别采用支持向量机(SVM)和长短期记忆神经网络(LSTM)进行诊断预判研究结果表明,基于多模态融合的故障诊断方法在汽车充电

Figure 5. Temperature prediction result chart
图5. 温度预测结果图
桩领域具有较高的准确性和效率。这一方法可以有效地应对不同类型的故障,为电动汽车充电设施的安全和稳定运行提供保障。然而,本文的研究还存在一定的局限性,例如在特征工程、模型训练和参数优化等方面仍有改进空间。未来研究可以进一步探讨更加先进的模型融合方法,以提高故障诊断的性能。
参考文献