1. 引言
在铁路运输系统中,轨道结构稳定性与安全性是铁路工程研究的核心问题[1]。随着高铁运营时间的延长,无砟轨道混凝土结构的损伤累积效应日益显著,这对检测精度提出了更高要求,尤其对保障高速列车安全运行至关重要。其中,路基不均匀沉降作为典型病害,主要由列车高频冲击荷载和复杂环境因素耦合作用所致[2]。这种沉降会改变轨道几何形态,增加轨道不平顺性,进而影响列车运行平稳性和安全性。若不及时处理,不仅会加速轨道结构劣化,增加维护成本,更可能引发重大安全事故。因此,实现路基沉降的实时监测与精准识别具有重要工程意义[3]。尽管现有检测技术已取得一定进展,但在检测精度、效率和智能化水平方面仍面临挑战。
当前轨道病害检测方法主要分为两类:基于天窗时间的传统巡检方法和非天窗时间的先进检测技术[4]。传统方法如沉降板法、杆式沉降仪法等[5],依赖人工逐点排查,存在效率低、覆盖范围有限等缺陷。相比之下,非天窗检测技术采用光纤光栅传感器、GPS定位等无损检测手段,能实现轨道健康状态的实时监测。但这些技术在环境适应性和检测精度方面仍有提升空间。
与多数无损静态检测技术及部分动态检测技术相比,基于非天窗期间列车动力响应特性所引发的力学参数变化,并结合深度学习技术的轨道结构损伤监测与评估方法,在全局性、实时性和高效性方面展现出显著优势。如陈宪麦等[6]提出了一种利用一维卷积神经网络对无砟轨道中水泥乳化沥青砂浆脱空位置进行识别的方法,通过非线性弹簧模拟CA砂浆脱空病害,并展现了超过95%的准确率。任娟娟等[7]以双块无砟轨道路基沉降为研究对象,提出了一种基于车辆振动信号的路基沉降识别方法,利用SVMs和CNNs等算法建立了车辆轨道–路基垂直耦合特征提取模型,准确识别无砟轨道路基沉降问题。徐文倩等[8]从车辆垂向加速度数据集中提取特征,建立多通道一维卷积神经网络模型识别路基沉降状态,研究表明采用车体、转向架和轮对垂向加速度作为1D-CNN网络的参数化多源输入来识别路基沉降程度是可行的。Xin等[9]提出一种利用车辆系统动态响应结NN-SVM识别砂浆脱空位置和长度的检测新方法。通过将车体动态响应与深度学习技术相结合,不仅能够显著提升轨道结构病害检测的效率,还能有效降低后期养护成本,从而为铁路运营安全提供更为可靠的技术保障。
综上所述,当前无砟轨道病害检测亟需满足高效性、精准性、实时性与智能化的核心要求。为此,本研究基于车辆–轨道耦合动力学理论,构建无砟轨道动力学模型,系统分析轨道不平对车辆动力响应的影响机制。通过特征相关性分析筛选关键参数,并采用CNN-GRU混合神经网络算法实现路基沉降的智能识别,为轨道病害检测提供新方法。研究技术路线如图1所示。
Figure 1. Diagram of the subgrade settlement identification process
图1. 识别路基沉降流程图
2. 建立考虑路基沉降影响下的车辆–轨道–路基耦合模型
高速铁路无砟轨道系统中,车辆–轨道–路基构成强耦合动力学体系。路基作为关键承重结构,其不均匀沉降将显著改变轨道几何形态与动力特性,直接影响列车运行品质与轨道结构耐久性。为准确评估无砟轨道服役性能,本研究基于沉降曲线模拟方法,建立了考虑路基沉降效应的车辆–轨道–路基耦合动力学模型,如图2所示。该模型采用Matlab平台实现,可精确表征沉降对系统动力响应的作用机理,为路基沉降识别提供理论基础。
Figure 2. Diagram of the vehicle-track-subgrade coupling model
图2. 车辆–轨道–路基耦合模型
该仿真模型包含四个关键子模块,分别是车辆动力学模型、轮轨相互作用模型、轨道结构模型以及路基沉降模型。其中,车辆系统被简化为一个10自由度多刚体模型,考虑车体、转向架和轮对的动力学特性;轮轨接触基于Hertz非线性理论建立;轨道结构选用CRTS Ⅱ型双块式无砟轨道,钢轨采用欧拉梁模型,扣件和路基支承简化为弹簧–阻尼系统;路基沉降模型则通过预设沉降曲线实现[10]。车辆、无砟轨道及路基的关键参数详见表1。
Table 1. Basic parameters of vehicle, ballastless track, and subgrade
表1. 车辆、无砟轨道、路基的基本参数
轨道参数 |
取值 |
车辆参数 |
取值 |
钢轨弹性模量 |
2.059 × 1011 Pa |
车体质量 |
33,766 kg |
钢轨截面惯性矩 |
3.217 × 10−5 m4 |
转向架质量 |
2400 kg |
钢轨每延米质量 |
60.64 kg |
轮对质量 |
1850 kg |
扣件间距 |
0.65 m |
轴距 |
2.5 m |
扣件垂向刚度 |
2.5 × 107 N/m |
车辆定距 |
17.5 m |
道床板密度 |
2500 kg/m3 |
车体点头转动惯量 |
1.6545 × 106 kg/m2 |
道床板弹性模量 |
3.6 × 1010 Pa |
转向架点头转动惯量 |
1.314 × 103 kg/m2 |
道床板截面尺寸 |
0.728 m |
一系悬挂刚度 |
2.352 × 106 N/m |
支承层密度 |
2500 kg/m3 |
一系悬挂阻尼 |
2 × 104 N⸱s/m |
支承层弹性模量 |
2.55 × 1010 Pa |
二系悬挂刚度 |
0. 52 × 106 N/m |
支承层截面尺寸 |
0.588 m |
二系悬挂阻尼 |
2.4 × 105 N⸱s/m |
路基支承刚度 |
1.9 × 108 Pa/m |
车轮滚动圆半径 |
0.43 m |
根据现有研究,国内外普遍采用单波余弦曲线来模拟路基不均匀沉降现象,曲线表达式如式(1)所示。式中,Z0为路基沉降量,x为路基位置的坐标,A为路基沉降幅值,l为路基沉降波长。
(1)
本研究仅针对沿线路纵向的路基不均匀沉降现象展开分析,并假设路基在横向方向上的沉降分布为均匀状态。在模型中,钢轨被简化为两端简支的欧拉梁,而扣件和路基则通过离散支承的弹簧–阻尼系统进行模拟。其中,钢轨的振动模态函数用
表示,钢轨的振动特性基于简支梁的振型函数,其具体表达式如式(2)所示。
(2)
使用阶梯函数Hb表示各时刻轨道与路基的接触状态,当轨道垂向位移
大于路基位移
时接触,小于时脱空,接触函数值为0,表达式如(3)所示。
(3)
3. 路基沉降作用下识别样本准备
鉴于车辆–轨道–路基无砟轨道动力学模型所得到的车辆动态响应加速度振动加速度信号难以直观反映不同损伤状态下的振动差异,本研究采用相关性分析方法筛选特征指标中的敏感性参数,以实现无砟轨道在多种工况下的路基沉降识别。通过对不同工况下敏感指标信号图的进一步分析,为后续路基沉降识别提供了可靠的样本数据支持。
3.1. 数据获取
本研究的数据来源于车辆–轨道–路基耦合动力学数值仿真模型。仿真中采用的车型为CH408,车辆运行速度设定为350 km/h,通过设置余弦型路基不均匀沉降,并结合中国轨道不平顺谱作为外部激励。根据沉降幅值(10 mm, 15 mm, 20 mm)和波长(10 m, 20 m, 30 m)的不同组合,共划分出9种沉降工况,具体工况设置如表2所示,共1800个样本,每个样本均包含完整的路基沉降波形。为确保数据的随机性和分布均匀性,对数据集进行了随机打乱和分层处理,训练集和测试集比为7:3。
Table 2. Subgrade settlement condition setting
表2. 路基沉降工况设置
工况 |
沉降波长 |
沉降幅值 |
1 |
10 m |
10 mm |
2 |
10 m |
15 mm |
3 |
10 m |
20 mm |
4 |
20 m |
10 mm |
5 |
20 m |
15 mm |
6 |
20 m |
20 mm |
7 |
30 m |
10 mm |
8 |
30 m |
15 mm |
9 |
30 m |
20 mm |
3.2. 路基沉降相关性分析
在路基沉降过程中,随机不平顺显著影响轨道结构,加剧车辆与轨道的动态作用,对沉降分析至关重要。由于垂向加速度能够直接反映轨道结构的垂向振动响应,对路基沉降引起的垂向变形具有较高的敏感性,因此大多学者将其作为路基沉降识别的传统指标,并广泛应用于沉降程度的评估中[11]-[13]。还有学者使用车体垂向加速度,构架加速度及轮对加速度去识别路基沉降[8]。另一方面,点头角速度能够有效表征车辆与轨道之间的动态耦合效应,尤其在高速运行条件下,其对轨道局部变形如轨道几何形位的微小变化具有较高的敏感性,因而被大多学者作为识别路基不平顺的重要指标[14] [15]。通过相关性分析,进一步探讨了分别对车体垂向加速度、点头角速度、构架加速度、轮对加速度以及路基沉降之间的相互关联性,相关分析结果已在图3中呈现。
Figure 3. Diagram of the subgrade settlement correlation analysis
图3. 路基沉降相关性分析图
其中,S表示路基沉降,V1~V4分别表示车体垂向加速度、点头角速度、构架加速度及轮对加速度。通过相关性分析发现,车体垂向加速度(V1)与路基沉降(S)的相关系数为0.86,显示其对路基沉降的垂向振动响应显著;点头角速度(V2)与路基沉降(S)的相关系数为0.83,表明车辆与轨道的动态耦合对沉降引起的轨道几何形位变化较为敏感。基于此,选择V1和V2作为识别路基沉降的特征指标,能够全面表征沉降对轨道–车辆系统的多维影响,提升识别精度。当列车运行至沉降路段时,轨道结构几何形态发生突变,轮轨垂向激励增强,导致车辆系统垂向及俯仰方向的响应显著增强。其中,车体垂向加速度反映了车辆整体在垂向激励下的振动强度,其幅值对轨道不平顺较为敏感,能够有效表征沉降引起的局部动力突变;而点头角速度则反映了车辆在俯仰方向上的振动模式,当前后轮对跨越沉降区时,车体产生明显的俯仰响应,因此点头角速度也能有效捕捉不均匀沉降的动态反应。不同工况下的车体加速度和点头角速度如图4所示。
(a) 车体垂向加速度 (b) 点头角速度
Figure 4. Diagram of the sensitivity indicator signals under different conditions
图4. 不同工况下敏感指标信号图
4. CNN-GRU网络
4.1. CNN网络
卷积神经网络(CNN)主要由输入层、卷积层、池化层、全连接层及输出层构建而成。每个层的功能更不相同,卷积层通过滤波器对输入数据进行滑动卷积操作,提取局部特征并生成高维特征图;池化层则通过对卷积层的输出进行降采样,同时保留重要的特征;全连接层将池化层的输出展开成一维向量,进行分类或回归任务。CNN模型通过这些网络层获取有效信息,自动生成数据的特征向量,减少了特征提取和数据重构的难度,提升了数据特征的质量。其结构如图5所示。
Figure 5. Diagram of the CNN
图5. CNN结构图
卷积运算的数学表达式如式(4)所示。
(4)
式中:
表示第l层的输出值的第i个特征;
表示第第l层的输出值的第i个卷积核的权重矩阵;
运算符表示卷积运算;
为第
层的输出;
表示偏置项;函数f表示输出的激活函数。
池化层则主要用于数据体空间尺寸的缩减,有效减少了模型参数的数量,进而降低了网络计算的复杂。在池化函数的选择上,本文采用最大池化函数,以保留特征图的关键信息并减少噪声的干扰。其表达式如(5)所示。
(5)
式中:l为特征数据宽度,A为输出的特征矩阵,w为池化核尺寸,p为池化后特征矩阵。
全连接层与输出层共同完成卷积神经网的分类任务。全连接层将卷积层和池化层提取的局部特征进行整合与映射,并将处理后的信息传递至输出层。输出层基于这些信息进行类别判断,生成最终的分类结果。
4.2. GRU
门控循环单元(GRU)不仅继承了循环神经网络(RNN)的记忆特性,还通过引入门控机制有效缓解了RNN中存在的梯度消失问题。GRU的核心结构包括两个关键门控单元:重置门和更新门。重置门用于评估历史信息对当前状态的重要性,而更新门则用于调节历史信息与当前输入在新状态中的权重分配。通过这两个门控单元的协同作用,GRU能够动态选择保留或遗忘过去的信息,从而更好地捕捉时间序列中的长期依赖关系。GRU的网络结构图中如图6所示,表达式为(6)~(9)。
Figure 6. Diagram of the GRU
图6. GRU网络结构图
(6)
(7)
(8)
(9)
式中:xi为输入的数据;rt和zt分别为重置门和更新门;ht为记忆更新后隐藏层输出;wr为重置门权重矩阵;wz为更新门权重矩阵;wh为隐藏层权重矩阵;σ和tanh分别为Sigmoid激活函数和双曲正切余弦函数,他们的表达式为(10)~(11)。
(10)
(11)
4.3. CNN-GRU模型
路基沉降敏感指标数据属于时间序列数据,本文采用一维卷积神经网络(CNN)进行特征提取,为后续门控循环单元(GRU)挖掘数据中的深层信息奠定基础。CNN通过权值共享机制,能够有效捕捉数据中的局部模式和空间依赖性,从而提取路基沉降过程中的波形变化特征。与此同时,GRU作为一种改进的循环神经网络,通过其更新门和重置门的门控机制动态调节信息流动,解决了传统RNN中梯度消失的问题,能够更好地建模路基沉降随时间的动态演变特性。通过将CNN与GRU结合,模型能够同时捕捉路基沉降数据中的空间特征和时间特征,不仅显著提升了模型对复杂非线性关系的拟合能力,还增强了对噪声数据的鲁棒性,从而在路基沉降的早期识别与预测中表现出更高的准确性和可靠性。CNN-GRU的结构图如图7所示。
Figure 7. Diagram of the CNN-GRU
图7. CNN-GRU结构图
5. 数据归一化处理
5.1. 数据归一化处理
为提高算法的计算效率、降低模型训练的复杂度并加速网络收敛,本文对数据特征中的两个车体动力学响应变量进行了归一化处理。由于其量纲和物理意义不同,为提高算法的计算效率、降低模型训练的复杂度并加速网络收敛,需对数据进行归一化处理。本文采用min-max标准化方法,将车体垂向加速度和点头角速度的数值线性映射到[0, 1]区间内,其数学表达式为(12)所示:
(12)
式中:
表示原始数据;
中的最小值
;最大值
;
表示归一后的新数据。
5.2. 网络参数设置
本研究基于TensorFlow 2.0框架下的Keras深度学习库,采用Python语言构建了CNN-GRU混合模型。Keras以其简洁的接口设计和模块化的架构,显著简化了神经网络的构建与实验流程。这种模块化设计不仅有助于用户快速理解并实现复杂的网络结构,还大幅减少了编码中的冗余工作。在模型构建过程中,卷积层使用ReLU激活函数,以增强模型对非线性特征的捕捉能力。输出层则通过softmax激活函数实现9分类任务。此外,GRU层的隐藏单元数设置为100,以有效挖掘输入数据中的时序特征。模型通过训练学习获取最优参数,采用“Nadam”优化器进行优化。初始学习率设定为0.001。为了在训练效率和内存消耗之间取得平衡,批处理大小设置为64。训练周期设定为150轮,采用交叉熵作为损失函数以优化模型性能。通过这些设置,模型能够有效地进行训练和参数优化,从而提高分类任务的准确性和效率。
5.3. 评价指标
为了验证本文CNN-GRU模型的性能更加可靠,使用准确率A,精确率P,召回率R对性能进行评估。准确率A是指正确分类的样本数占总样本数的比例,来衡量模型的整体分类性能。P是预测为正的样本中实际为正的比例,模型预测正类的准确性。召回率R是指实际为正的样本中被模型正确预测为正的比例,用于衡量模型对正类的覆盖能力。
为了验证CNN-GRU模型的可靠性,本研究采用了准确率(Accuracy)、精确率(Precision)和召回率(Recall)三个性能评估指标。准确率A衡量的是模型正确分类样本的比例,精确率P评估的是模型预测正类的准确性,而召回率R则反映了模型识别正类样本的能力。这些指标共同为模型的分类性能提供了全面的评估。他们的表达式如(13)~(15)。
(13)
(14)
(15)
式中:TP表示模型正确识别出的特定类别的样本数,FP代表错误地将其他类别样本识别为某一特定类别的数目。FN模型未能识别出真正属于某一类别的样本数,TN对每个类别来说,是模型正确识别为非该类别的样本总数。
5.4. CNN-GRU识别路基沉降路基不均匀沉降识别
本研究基于CNN-GRU算法对9种不同类别的路基沉降工况数据进行识别。通过对输入样本特征的相关系数热力图分析,筛选出具有显著相关性的特征指标,并对其进行归一化处理。随后,将数据划分为训练集和测试集,输入到CNN-GRU网络中进行路基沉降识别,结果如图8所示。为更清晰地展示模型训练过程中准确率的变化趋势,对曲线进行了平滑处理,以减少训练过程中随机波动带来的视觉干扰,从而更直观地反映模型性能的总体趋势。图中蓝色曲线表示训练集,红色曲线表示测试集。图8(a)为识别准确率曲线,结果表明,CNN-GRU算法对路基沉降的识别效果显著,准确率达到95.56%,精确率95.67%,召回率为95.58%,说明该模型的识别能力强且指标分布较为平且能够较为全面地提取样本中的正常特征和异常特征,从而获得相对准确的异常检测结果。图8(b)为损失函数曲线,损失函数用于衡量模型预测值与真实值之间的差异,其值较低表明模型的预测结果与真实结果高度吻合,性能优异。
(a) 准确率 (b) 损失函数
Figure 8. Diagram of the model accuracy and loss function
图8. 模型准确率和损失函数图
5.5. 鲁棒性分析
为了系统性地评估本文所提出的网络模型的鲁棒性,本研究对所有测试数据施加了不同程度的高斯白噪声干扰。实验结果如图9所示。分析结果表明,在无噪声条件下,模型的分类准确率达到了95.56%,显示出模型在理想环境下的优越性能。随着噪声水平的增加,模型的识别准确率呈现出逐渐下降的趋势,但整体下降幅度相对有限。当信噪降至35 dB时,模型的测试集准确率降至94.45%,相较于无噪声条件下的准确率仅下降了1.11%。表明所提出的网络模型在面对噪声干扰时仍能保持较高的分类准确率,具备较强的抗噪声干扰能力。因此,可以认为该模型在路基沉降监测过程中能够有效应对实际环境中可能出现的噪声情况,展现出良好的鲁棒性。
Figure 9. Diagram of the robustness test
图9. 鲁棒性测试图
6. 结论
(1) 从车辆响应系统方面出发选取敏感指标,通过相关性分析,车体垂向振动加速度,点头角速度与路基沉降变形间的相关性较高,可作为网络模型的输入。
(2) 考虑到路基沉降数据是非线性时序数据,提出了一种CNN-GRU模型去识别路基沉降,CNN能有效提取路基沉降的空间特征,GRU能提取路基沉降时间特征。结合CNN-GRU识别路基沉降,能够对路基沉降进行识别达到95.56%,并在研究实验中得到验证。
(3) 在不同信噪比情况下,模型的识别准确率呈现出逐渐下降的趋势,当信噪降至35 dB时,准确率相比无噪声仅下降了1.11%,表明该模型具备较强的鲁棒性。
项目基金
内蒙古自治区科技计划项目(项目编号:2023KJHZ0034),内蒙古自治区自然科学基金项目(项目编号:2024MS05035)。