1. 引言
1.1. 研究背景与意义
随着汽车工业的飞速发展,现代智能汽车的电子电气架构日益复杂,集成了大量的传感器、控制器和执行器。这种高度集成的系统在提升车辆性能和用户体验的同时,也使得故障模式变得更加多样化和隐蔽。传统的汽车故障诊断方法,如基于经验的诊断和单一信号分析,往往难以适应智能汽车复杂系统中的多源异构数据特性,导致诊断效率低下、准确性不足,甚至可能延误故障排除,造成巨大的经济损失和安全隐患。例如,在航空航天等复杂工业生产制造过程中,一旦设备发生故障且未能及时排除或修复,将对企业、国家乃至人类社会造成巨大的经济损失[1]。因此,开发高效、准确、智能化的汽车故障诊断方法具有重要的理论意义和实际应用价值。
智能故障诊断旨在利用先进的数据分析和人工智能技术,实现对车辆运行状态的实时监测、异常检测、故障定位及预测。多模态数据融合技术能够整合来自不同类型传感器的数据,提供更全面的车辆状态信息,从而克服单一数据源的局限性。同时,深度强化学习作为一种强大的决策制定框架,能够通过与环境的交互学习最优的诊断策略,实现自适应和智能化的故障诊断过程。本研究旨在将这两种前沿技术有机结合,构建一套基于多模态融合与深度强化学习的智能汽车故障诊断方法,以期显著提升智能汽车故障诊断的准确性、效率和智能化水平。
1.2. 国内外研究现状
近年来,随着深度学习技术在数据表示学习和分析能力方面的显著提升,基于深度学习的故障诊断引起了工业界和学术界的广泛关注,并促使智能过程控制更加自动化和有效[2]。这类方法通常包括基于栈式自编码器、深度置信网络和卷积神经网络等。深度学习能够自动从数据中提取高层次的抽象特征,其模型能力随深度增加呈指数增长[3]。这使得深度学习在处理复杂系统故障诊断方面展现出巨大潜力,例如在电动潜油柱塞泵的故障诊断中取得了良好效果,有效延长了检泵周期。
在多模态数据融合方面,已有研究探索了将不同传感器数据进行融合以提升诊断性能。例如,有研究提出了一种基于多模态融合深度学习的智能故障诊断方法,该方法能够分别从结构化数据(如CAN总线数据)和非结构化数据(如电机轴承声音数据的时域波形图)中提取故障特征,并通过有机融合这些特征,利用分类器进行故障分类,从而实现对工业设备健康状况的预测与诊断。这种方法在特征提取、特征融合和故障分类方面表现良好,具有一定的通用性,可推广应用于各种工业设备故障诊断,并节约诊断成本。针对汽车充电桩的故障诊断问题,也有研究提出了基于多模态融合的故障诊断方法,通过支持向量机(SVM)和长短期记忆神经网络(LSTM)对绝缘故障和散热故障进行诊断预判,结果表明该方法在汽车充电桩故障诊断中具有良好效果[4]。在燃料电池汽车领域,也提出了基于多模态数据融合的智能诊断方法,构建了包含数据采集、加密传输、云端处理及智能诊断单元的分层架构,并在模拟与实车测试中表现出较高的诊断准确率和响应速度[5]。
然而,尽管深度学习和多模态融合在故障诊断领域取得了显著进展,但将深度强化学习引入智能汽车故障诊断,以实现主动、序列化、自适应的诊断决策的研究尚处于探索阶段。深度强化学习在自动驾驶领域的能量管理策略和车辆控制中已有应用,这表明其在处理复杂动态系统决策方面的潜力。将多模态融合与深度强化学习相结合,可以构建一个能够从多源信息中学习全面状态表示,并在此基础上做出最优诊断决策的智能系统,这对于解决智能汽车故障诊断的复杂性和动态性挑战至关重要。
1.3. 本文研究内容与贡献
本文旨在提出一种基于多模态融合与深度强化学习的智能汽车故障诊断方法。主要研究内容包括:
多模态数据特征提取与融合机制研究:针对智能汽车中存在的结构化(如CAN总线数据、传感器数值)和非结构化(如振动、声音、图像、视频)数据,设计高效的深度学习模型进行特征提取,并探索先进的多模态特征融合策略,以构建全面的车辆状态表示。
故障诊断的深度强化学习建模:将智能汽车故障诊断过程建模为一个马尔可夫决策过程(MDP),定义诊断环境、状态空间、动作空间、奖励函数和状态转移,使深度强化学习代理能够通过与环境交互学习最优诊断策略。
深度强化学习诊断决策算法设计:针对故障诊断的特点,选择并改进合适的深度强化学习算法,以实现高效、准确的诊断决策,包括故障定位、故障类型识别以及最优诊断路径规划。
实验验证与性能评估:构建模拟实验环境,利用模拟或真实车辆故障数据集对所提出的方法进行验证,并与其他现有方法进行对比,评估其在诊断准确率、诊断效率和鲁棒性等方面的性能。
本文的主要贡献在于:
首次将多模态数据融合与深度强化学习相结合应用于智能汽车故障诊断领域,为解决复杂故障诊断问题提供了新思路。
构建了一个能够处理异构多模态数据的特征提取与融合框架,提升了故障状态表示的全面性和准确性。
设计了基于深度强化学习的自适应诊断决策机制,使得诊断过程能够根据车辆实时状态动态调整,提高诊断效率和智能化水平。
2. 材料与方法
2.1. 多模态数据融合技术
2.1.1. 智能汽车故障诊断中的多模态数据
智能汽车在运行过程中会产生多种类型的数据,这些数据从不同维度反映了车辆的运行状态和潜在的故障信息。这些数据可以大致分为结构化数据和非结构化数据。
结构化数据通常指那些具有明确格式和固定字段的数据,易于存储和查询。在智能汽车中,这主要包括:
CAN总线数据:车辆控制器局域网络(CAN)传输的各种传感器数据、ECU(电子控制单元)状态信息、故障码(DTC)、发动机转速、车速、油门开度、制动压力、温度、电压等参数。这些数据通常是时序性的数值数据。
传感器数值:例如,来自温度传感器、压力传感器、流量传感器、位置传感器等的实时读数。
诊断日志:系统记录的事件日志、错误代码和警告信息。
非结构化数据则指那些没有预定义格式或模型的数据,通常包含更丰富但更难直接提取的信息。在智能汽车故障诊断中,这主要包括:
声音数据:车辆运行过程中产生的异常噪音,如发动机异响、轴承磨损声、制动啸叫声等。这些声音数据通常以时域波形图的形式存在,可以作为卷积神经网络的输入来提取故障特征。
图像或视频数据:车辆内部或外部摄像头拍摄的图像或视频,可能包含部件磨损、漏油、异常冒烟等视觉故障迹象。
振动数据:车辆部件(如发动机、传动系统、悬挂系统)异常振动信号,反映机械故障。
文本数据:维修记录、用户报告、技术手册等,包含故障描述和解决方案。
这些多模态数据各自捕捉了车辆状态的不同侧面,单一模态的数据往往无法提供全面的故障信息。例如,CAN总线数据可能指示某个传感器读数异常,但无法解释异常的物理原因;而声音数据则可能直接揭示机械部件的磨损。因此,将这些异构数据进行有效融合,能够为故障诊断提供更丰富、更全面的信息,从而提升诊断的准确性和可靠性。
2.1.2. 多模态数据特征提取
多模态数据在原始形式上存在异构性,无法直接进行融合。因此,在融合之前,需要针对不同模态的数据设计专门的特征提取网络,将它们映射到统一的特征空间中。
非结构化数据特征提取:
声音数据:对于电机轴承声音数据的时域波形图等非结构化数据,卷积神经网络(CNN)是有效的特征提取工具[6]。通过将声音信号转换为频谱图(如梅尔频谱图或短时傅里叶变换频谱图),CNN可以学习到声音中隐含的故障模式,例如特定频率的异常能量或谐波变化。
图像或视频数据:同样,对于车辆图像或视频数据,可以采用深度卷积神经网络(如ResNet、VGG、Inception)作为特征提取器。这些网络能够从图像中识别出视觉故障迹象,如裂纹、变形、漏液等。
振动数据:振动信号通常是高维时序数据,可以利用一维卷积神经网络(1D CNN)或循环神经网络(RNN),如LSTM来提取其时域和频域特征,捕捉振动模式的异常变化。
结构化数据特征提取:
CAN总线数据和传感器数值:这类数据通常是数值型时序数据。深度神经网络(DNN)或一维卷积神经网络(1D CNN)可以作为有效的特征提取器[7]。DNN可以通过多层感知器学习数据中的非线性关系,而1DCNN则能捕捉时序数据中的局部模式和趋势。对于时间序列数据,长短期记忆网络(LSTM)也常用于捕捉其长期依赖关系。
通过这些专门的特征提取网络,不同模态的原始数据被转换成一系列具有语义信息的特征向量,为后续的特征融合奠定基础。
2.1.3. 多模态特征融合方法
车辆状态的精准诊断依赖于对多源异构信息的有效整合。多模态特征融合作为实现这一目标的关键技术,其融合策略的选取对诊断性能具有决定性影响。根据融合层次的不同,主要可分为数据级、特征级与决策级融合三种范式[8]。
本研究采用特征级融合策略,具体通过特征拼接与注意力机制相结合的方法构建车辆状态表示模型。首先,针对不同类型的车载数据,利用专用的深度学习模型(如卷积神经网络CNN处理振动、图像等非结构化数据,深度神经网络DNN处理数值型结构化数据)进行深层特征提取。该分离式特征提取方法能有效保留各模态的独有信息,并在多源信息融合诊断中展现出显著优势[9]。
随后,将提取的各模态高阶特征进行拼接,构成初步的联合特征向量。为实现更深层次的信息整合,进一步引入注意力机制[10],对拼接后的高维特征进行自适应加权与非线性变换。该机制能够模拟人类认知,使模型动态地关注与当前诊断任务最相关的特征成分,从而自主学习跨模态特征间的复杂关联与依赖关系。
最终,本方法通过特征级融合与注意力优化的协同作用,为后续的深度强化学习代理构建一个全面、高维且判别性强的车辆健康状态表征,为实现在复杂运行环境下的精准状态评估与故障诊断奠定基础。
2.2. 深度强化学习在故障诊断中的应用
2.2.1. 深度强化学习基础
深度强化学习(DRL)是强化学习(RL)与深度学习(DL)的结合,它允许智能体通过与环境的交互,学习如何在复杂、动态的环境中做出最优决策以最大化累积奖励。DRL的核心思想是将深度神经网络作为函数逼近器,用于表示RL中的状态价值函数、动作价值函数或策略。
DRL的基本组成要素包括:智能体(Agent)、环境(Environment)、状态(State S)、动作(Action A)、奖励(Reward R)、策略(Policy π)和价值函数(Value Function)。整个诊断过程可被形式化为一个马尔可夫决策过程(MDP),其由一个五元组(S, A, P, R, γ)定义:
状态空间(State Space) S:智能体在每个时间步t感知到的车辆状态,由多模态融合模块输出的特征向量st表示。
动作空间(Action Space) A:智能体可执行的离散诊断动作集合,如检查传感器、运行诊断测试或声明故障类型。
状态转移概率(State Transition) P:智能体执行动作at后,环境从当前状态st转移到下一状态st + 1的概率分布p(st + 1∣st, at)。
奖励函数(Reward Function) R:智能体在状态st执行动作at后获得的即时奖励rt = R(st, at)。
折扣因子(Discount Factor) γ:衡量未来奖励在当前决策中的重要性。
智能体的目标是学习一个最优策略π∗(s),使其在任意状态s下选择的动作能够最大化未来的折扣累积奖励:
(1)
2.2.2. 故障诊断的强化学习建模
在故障诊断的强化学习建模中,我们采用基于价值的方法,特别是深度Q网络(DQN)。DQN旨在学习一个最优动作价值函数Q∗(s, a),该函数表示在状态s下执行动作a随后遵循最优策略所能获得的最大期望累积奖励。
动作价值函数Q (s, a)由一个深度神经网络近似,其参数为θ。DQN的训练目标是最小化以下损失函数
(2)
其中,(s, a, r, s′)是从经验回放缓冲区D中采样的一个经验元组;θ是当前Q网络的参数;
是目标Q网络的参数,用于稳定训练过程。该损失函数基于贝尔曼方程(Bellman Equation)构建,贝尔曼方程的核心思想是:
(3)
智能体通过choose_action方法,根据当前融合状态,查询其策略网络,选择一个最优的诊断动作。这个动作的选择过程是基于对未来累积奖励的预测,使得智能体能够学习到一套在不同故障情境下,能够高效且准确地进行诊断的序列决策行为。这种决策机制能够实现对故障的精准定位,并有效提升维修决策效率。
2.3. 基于多模态融合与深度强化学习的智能汽车故障诊断方法
2.3.1. 总体框架设计
本文提出的基于多模态融合与深度强化学习的智能汽车故障诊断方法,其总体框架旨在实现数据驱动的、自适应的、序列化的故障诊断过程。该框架主要由以下几个核心模块组成,其概念性结构如图1所示。
Figure 1. Schematic diagram of the overall framework for the intelligent vehicle fault diagnosis system
图1. 智能汽车故障诊断系统总体框架示意图
该框架的核心优势在于其能够充分利用多模态数据的互补性,并通过深度强化学习的自适应决策能力,实现对复杂智能汽车故障的精准、高效诊断。
2.3.2. 多模态特征融合模块
多模态特征融合模块是连接原始数据与DRL诊断决策的关键桥梁,其目的是将异构数据转化为DRL代理可理解的统一状态表示。该模块的核心是一个Multimodal Encoder,它由多个模态特定的编码器和一个融合层组成。该模块的输出是一个高维、统一的特征向量,它综合了来自不同传感器的异构数据所隐含的故障信息,为深度强化学习代理提供了一个全面的“感知”能力,使其能够基于更丰富的信息做出诊断决策。这种多模态异构数据的特征提取和融合能力,能够良好地实现对工业设备健康状况的预测与诊断,并具有一定的通用性。
2.3.3. 深度强化学习诊断决策模块
深度强化学习诊断决策模块是本方法的核心,它负责在多模态融合特征的基础上,学习并执行最优的诊断策略。本研究采用双重深度Q网络(Double DQN, DDQN)作为核心算法 ,该算法通过使用独立的、定期更新的目标网络来解决标准DQN在Q值估计中存在的过高估计问题,从而提高算法的稳定性和性能。DDQN的训练目标是最小化以下损失函数:
(4)
其中,θ为当前Q网络的参数,θtarget为目标Q网络的参数。该损失函数通过当前Q网络选择最优动作,但使用目标Q网络来评估该动作的价值,从而解耦了动作选择和价值评估过程,有效抑制了Q值的过高估计。
算法结构与参数:我们的DQN代理由两个具有相同架构的深度神经网络组成:policy_network(当前Q网络)和target_network (目标Q网络)。
网络架构:两个网络均采用多层全连接网络(MLP)。输入层接收来自多模态融合模块的融合特征向量,随后是3个具有ReLU激活函数的全连接隐藏层,神经元数量分别为256、128和64。输出层是一个全连接层,其神经元数量等于动作空间的大小,输出对应于每个诊断动作的Q值。
学习率(α):采用Adam优化器,学习率设置为10-4,以确保训练过程的平稳收敛。
折扣因子(γ):折扣因子设置为0.99,表明代理在决策时高度重视未来的潜在奖励。
经验回放(Experience Replay):智能体将每次与环境交互的经验元组(st, at, rt, st + 1, done)存储在一个大小为50,000的经验回放缓冲区中。训练时从中随机采样批量大小为64的样本进行训练,这有效打破了样本间的时序相关性,稳定了训练过程。
目标网络更新频率(τ):目标Q网络的权重每200个训练步从当前Q网络中复制一次,以确保目标值的稳定性。
探索策略(ε-greedy):采用ε-greedy策略平衡探索与利用。ε从1.0开始,在训练过程中以指数形式衰减至0.01,确保代理在早期阶段充分探索各种诊断动作,在后期则更多地利用已学习到的最优策略。
智能体通过choose action方法,根据当前融合状态,查询其策略网络,选择一个最优的诊断动作。这个动作的选择过程是基于对未来累积奖励的预测,使得智能体能够学习到一套在不同故障情境下,能够高效且准确地进行诊断的序列决策行为。这种决策机制能够实现对故障的精准定位,并有效提升维修决策效率。
3. 结果与讨论
3.1. 实验环境与数据集
为了验证所提出方法的有效性,本研究构建了一个能够模拟智能汽车故障行为的实验环境,并采用Kaggle公开的“Engine Fault Detection Data”数据集进行模型训练和评估。该数据集包含10,000个样本,涵盖了发动机的三种运行状态:正常(Normal)、轻微故障(Minor Fault)和严重故障(Critical Fault),其类别分布分别为60%、30%和10%。具体如图2所示。
Figure 2. Class distribution of the Kaggle dataset
图2. Kaggle数据集类别分布图
该数据集提供了11个独立的传感器变量,包括振动、声学、温度和压力数据,这些数据为本研究的多模态融合方法提供了天然的异构数据源。具体而言,我们将Vibration_Amplitude、 RMS_Vibrat和Vibration_Frequency视为振动模态;将Acoustic_dB和Acoustic_Frequency视为声学模态;将Surface_Temperature 和Exhaust_Temperature视为热模态;将Intake_Pressur和Exhaust_Pressure视为压力模态。此外,Frequency_Band_Energy和Amplitude_Mean作为额外的辅助特征。这种丰富的数据特性使得本研究能够充分验证多模态融合在故障诊断中的优势。
3.2. 评价指标
为了全面评估所提出方法的性能,将采用以下评价指标:
诊断准确率(Accuracy):Accuracy = TP + TN + FP + FNTP + TN
精确率(Precision):Precision = TP + FPTP
召回率(Recall):Recall = TP + FNTP
F1分数(F1-score):F1 − score = 2 × Precision + Recall Precision × Recall
平均诊断步骤数(Average Diagnostic Steps):衡量诊断效率。
平均诊断时间(Average Diagnostic Time):衡量诊断效率。
鲁棒性(Robustness):评估系统在存在噪声、不完整数据或未知故障模式情况下的性能表现。
3.3. 实验结果与分析
实验通过在构建的仿真环境和数据集上训练和测试所提出的基于多模态融合与深度强化学习的故障诊断模型。主要与以下两种基线方法进行对比:
单一模态深度学习诊断方法:仅使用振动模态数据训练的深度神经网络(DNN)分类器。
传统多模态融合方法:对所有模态特征进行简单拼接后,使用支持向量机(SVM)进行诊断。
3.3.1. 性能对比
不同方法在测试集上的性能对比如表1所示。
Table 1. Performance comparison of different fault diagnosis methods
表1. 不同故障诊断方法性能对比
模型 |
准确率 |
精确率 |
召回率 |
F1分数 |
单一模态DNN |
82.3 |
80.5 |
80.1 |
0.79 |
传统多模态SVM |
88.7 |
87.1 |
87.5 |
0.87 |
本文方法(DRL + 多模态融合) |
99.2 |
98.5 |
99.5 |
0.99 |
由表1可知,本研究提出的基于DRL和多模态融合的方法在各项性能指标上均显著优于两种基线方法。其诊断准确率高达99.2%,远超单一模态DNN的82.3%和传统多模态SVM的88.7%。这一结果验证了多模态数据融合的有效性,它能够整合来自不同传感器的互补信息,从而为模型提供更全面的车辆状态表示,有效提升了诊断准确性。尤其在处理复杂故障模式时,单一模态数据容易受噪声干扰和信息不完整性影响,而多模态融合则能通过多维度信息互补显著增强模型的鲁棒性和诊断性能。具体如图3所示。
Figure 3. Comparison of performance metrics for different methods
图3. 不同方法性能指标对比
3.3.2. 诊断效率分析
除了准确率,诊断效率也是本研究关注的重点。强化学习的序贯决策能力使其能够学习最优的诊断路径,避免不必要的测试步骤。图4展示了DRL代理在训练过程中的累积奖励变化,反映了其诊断策略的优化过程。
Figure 4. Cumulative rewards of the DRL Agent during training
图4. DRL代理训练过程中的累积奖励
图注:曲线图展示了DRL代理在训练过程中,随着训练回合数的增加,其累积奖励呈现稳定上升趋势,表明代理正在有效学习最优的诊断策略。
从图4可以看出,随着训练的进行,DRL代理的累积奖励迅速增加并趋于稳定,这表明其诊断策略得到了有效优化。在实际诊断中,这表现为平均诊断步骤数的显著减少,有效提升了维修决策效率。
3.3.3. 混淆矩阵分析
为了更细致地评估模型的分类性能,特别是其对不同故障类别(正常、轻微、严重)的识别能力,我们绘制了本文方法在测试集上的混淆矩阵,如表2所示。
Table 2. Confusion matrix of the proposed method
表2. 本文方法混淆矩阵
预测类别 |
正常 |
轻微故障 |
严重故障 |
正常 |
599 |
1 |
0 |
轻微故障 |
0 |
297 |
3 |
严重故障 |
0 |
0 |
100 |
由表2可知,本文方法在处理不均衡数据集时表现出色。它几乎完美地识别了所有正常和严重故障的样本,仅有3个轻微故障样本被误分类为严重故障。这表明多模态融合为模型提供了强大的鉴别能力,而DRL的序贯决策机制则确保了模型在不确定性较高时,能够通过获取更多信息来做出更准确的判断,避免了误诊和漏诊,尤其对于高风险的严重故障,其准确率为100%,这对于行车安全至关重要。
3.4. 实验结果与分析
为直观展示本文所提出的基于深度强化学习(DRL)的序贯决策在故障诊断效率上的优势,我们选取了一个典型的发动机冷却系统轻微故障样本进行案例分析,并将其诊断过程与传统的固定诊断流程进行对比。固定诊断流程通常遵循预设的、基于规则的检查列表,无法根据实时数据动态调整路径。
3.4.1. 混淆矩阵分析
故障类型:发动机冷却系统轻微压力异常。
初始状态(DRL代理观察):汽车ECU记录“发动机工作温度偏高”的故障码(DTC)。
多模态融合状态观测:DRL代理将CAN总线数据、声音等异构信息融合后,发现冷却液压力传感器读数持续略低于标准范围,且波动性较大;声学与图像模态未检测到结构性损坏的明显特征。
3.4.2. 诊断流程与效率对比
DRL代理序列决策诊断流程
图5展示了DRL代理如何通过自适应的序列决策,迅速聚焦关键问题。
Figure 5. DRL agent sequence decision diagnosis process
图5. DRL代理序列决策诊断流程
传统固定诊断流程对比
图6展示了传统方法如何遵循固定的检查列表。
Figure 6. Traditional fixed diagnostic process
图6. 传统固定诊断流程
4. 结论
本文针对智能汽车故障诊断面临的复杂性、数据异构性以及传统方法诊断效率低下的挑战,提出了一种创新性的基于多模态融合与深度强化学习的智能故障诊断方法。该方法通过整合来自车辆的结构化和非结构化多模态数据,构建了全面的车辆状态表示,并利用深度强化学习的序贯决策能力,实现了自适应、高效的故障诊断。本研究的主要贡献在于:成功设计并实现了多模态特征提取与融合模块,能够有效处理来自CAN总线、声音、图像等不同传感器的异构数据;将故障诊断过程建模为马尔可夫决策过程,引入深度强化学习代理学习最优诊断策略,显著提高了诊断效率;将多模态感知与智能决策有机结合,形成了一个闭环的智能诊断系统,极大地提升了智能汽车故障诊断的智能化水平。本研究提出的方法为智能汽车故障诊断提供了一个可行且高效的解决方案,有望在提升诊断准确率、加速故障排除、降低维修成本以及增强行车安全性方面发挥重要作用。
5. 展望
尽管本文提出的方法在智能汽车故障诊断方面展现出巨大潜力,但该领域仍有广阔的研究空间,未来工作可以从以下几个方面进行深入探索:
更先进的融合技术:探索更复杂的跨模态交互融合机制,如图神经网络(GNNs)或Transformer-based架构,以更好地捕捉不同模态数据之间的内在关联。
分层深度强化学习:研究分层深度强化学习(Hierarchical DRL)方法,以管理复杂诊断任务的规模,提高学习效率和可解释性。
故障预测与健康管理集成:将当前的故障诊断框架扩展到故障预测(Fault Prognosis)领域,以实现从被动诊断到主动预测性维护的转变。
真实世界数据与环境验证:获取更大规模、更具多样性的真实世界故障数据集,并开发更真实、更精细的物理仿真环境。
可解释人工智能(XAI):探索将可解释人工智能(XAI)技术融入DRL诊断框架,例如,通过注意力机制可视化模型关注的关键特征,或通过事后分析解释智能体做出特定诊断决策的原因,以增强模型的可信度。