1. 引言
随着高速铁路从“大规模建设”向“长期运营”转型,既有的运维体系正面临严峻挑战。作为铁路工程的基础结构层,路基在列车循环荷载与复杂环境因素(如温度变化等)耦合作用下易产生不均匀沉降。无砟轨道因其刚度较高,易与路基发生非协调变形。从而导致轨道结构损伤,缩短其服役寿命[1]。轨道与路基间的非协调变形常发生于轨道结构底层,具有位置隐蔽性强、承受强烈动荷载作用以及层间接触不连续等特点,导致其监测难度较大。此类变形通常早期不易被察觉,往往要在轨道出现明显形变、轨检车检测出平顺性异常,甚至轨道板发生断裂的严重情况下,才能被发现。因此,如何高效精准地识别轨道–路基层间非协调变形,已成为当前亟待解决的问题。
在使用传统方法检测高速铁路非协调变形病害领域,Yang等[2]针对轨道混凝土结构非协调变形,提出了一种基于水平面内钢筋与非协调变形回波方向差异的探地雷达算法,通过构建水平滤波器,实现了对非协调变形的精准识别。Li等[3]设计了一种基于前向射线跟踪与合成孔径聚焦技术的超声成像机制,用于无砟轨道非协调变形识别,其检测性能显著优于传统RMS-SAFT和RR-SAFT方法。Chen等[4]提出了一种基于空气耦合超声与超声导波融合的非接触检测方法,实现了对轨道板下非协调变形的检测和定量分析。然而,传统监测方法易受周边环境因素影响,导致测量精度下降且信息获取受限,难以满足对高速铁路非协调变形的实时监测的技术要求。
近年来,深度学习理论的迅速发展为高速铁路病害的检测与识别开辟了新的途径。Guo等[5]构建了一套基于光纤传感技术的轨道板变形实时监测系统,通过采集振动信号,结合局部均值分解方法进行特征提取,并引入随机森林模型实现智能化识别,实验结果验证了该系统的良好性能。Wang等[6]考虑到卷积神经网络(Convolutional Neural Network, CNN)在特征自适应提取方面的优势,提出一种基于深度卷积神经网络的方法,用于无砟轨道板不同程度裂缝的精确、高效检测。在高速铁路无砟轨道道床检测领域,特别是异物检测方面,Chen等[7]对Mask R-CNN模型中的特征金字塔网络和区域建议网络进行优化改进,提升了对轨道结构及扣件区域的特征提取能力,并在实际检测任务中取得了良好的应用效果。侯博文等[8]提出基于深度残差网络(ResNet)的轨道病害检测方法,实现对钢轨踏面、钢轨扣件和支承块三种轨道结构的损伤分类识别。上述研究表明,多种深度学习模型已被有效应用于轨道板变形及钢轨损伤的识别任务中,并在检测精度和效率方面展现出显著优势。
在高速铁路轨道层间结构非协调变形病害的研究中,深度学习算法已得到广泛应用。任娟娟等[9]研究了板端和板中的不同非协调变形程度的情况,结合时域、频域分析等获得识别样本,基于粒子群优化支持向量机(PSO-SVM)方法成功识别了不同程度非协调变形。张广远等[10]提出了一种无砟轨道非协调变形识别方法,利用冲击弹性波和探地雷达两种方法进行信号提取,经过特征量化和特征融合,结合SVM方法实现检测。Xin等[11]以车辆–轨道耦合动力学模型在不同砂浆层离缝工况下模拟获得的轮对加速度数据作为输入特征,提出一种融合CNN与SVM的混合识别方法,实验结果表明准确率超过90%。李奇等[12]利用有限元方法建立车–轨–桥耦合模型和声辐射模型来构建所需的数据样本,最后通过SVM方法对轨道板非协调变形状态进行识别,达到了较高的识别率。尽管上述研究已成功将深度学习技术应用于无砟轨道层间非协调变形损伤的智能化识别,并取得了良好效果,但现有研究仍主要聚焦于轨道混凝土结构的损伤识别,对于轨道与路基之间非协调变形问题的关注仍存在不足之处。本文与现有基于SVM、RF等传统分类器的识别方法相比,所提出的1D-CNN模型不仅在结构上更契合轨道振动信号的时序特性,同时具备更高的训练效率与工程部署可行性。此外,多数研究依赖有限元仿真获取训练数据,存在建模复杂度高、计算成本大等问题,因此在提升建模效率与工程适用性方面仍存在较大的优化空间。
本文深入探讨了将深度学习与车辆–轨道–路基耦合动力学系统相结合的方法,旨在能够准确识别轨道与路基之间非协调变形,从而保障高速铁路轨道的高平顺性与稳定性。本文对于提升列车运行的舒适性与安全性具有重要意义。同时,本文还致力于提升我国高速铁路养护维修的技术标准,为建设交通强国的国家战略提供了坚实的理论支撑。
2. 研究方法
本文的技术路线如图1所示。首先结合车辆–轨道耦合系统动力学理论,并考虑轨道结构的自重和层间接触特性,建立高速车辆–无砟轨道–路基垂向耦合系统动力学模型,通过数值仿真分析无砟轨道与路基之间不同程度的非协调变形对系统动力特性的影响规律。同时,开展指标敏感性分析,筛选出对非协调变形响应敏感的动力学指标。随后,采用滑动窗口方法对敏感指标进行数据增广处理,并经过一系列预处理流程,合理划分训练集、验证集与测试集的比例,构建适用于一维卷积神经网络(1D-CNN)模型训练的数据集。基于深度学习中的一维卷积神经网络理论,构建初始识别模型。该模型在训练集上进行迭代训练,并通过反向传播算法不断优化网络参数,当模型损失率达到设定最优阈值时,保存最终训练完成的模型。随后利用测试集对模型性能进行评估,并采用混淆矩阵对分类准确率进行可视化展示。为验证模型的鲁棒性与泛化能力,对测试集数据叠加不同强度的高斯白噪声,进一步测试模型在噪声干扰下的识别稳定性。最终,实现基于敏感动力学指标的轨道与路基之间非协调变形的实时检测。
Figure 1. Research technology roadmap
图1. 研究技术路线图
3. 模型构建
3.1. 考虑路基沉降的车辆–轨道–路基耦合动力模型
依据车辆–轨道耦合动力学理论,本文建立了考虑轨道结构自重和层间联结特性的高速车辆–无砟轨道–路基耦合动力学模型,如图2所示。模型包含四个部分,自上而下依次为:车辆子系统、轮轨关系相互作用子系统、轨道子系统和路基界面子系统。其中车辆子系统模型为多刚体系统,由一个车体、两个构架和四个轮对构成,用弹簧–阻尼单元来等效一系、二系悬挂系统的刚度和阻尼,同时考虑车体的浮沉和点头运动,转向架的沉浮和点头运动以及四个轮对的垂向运动,共十个自由度。车辆系统的振动方程参照文献[13]。轮轨相互作用关系使用Hertz非线性接触理论进行模拟。
本文采用国内普遍应用的下凹全波余弦型曲线模拟路基的不均匀沉降。其数学表达式见公式(1)。所构建的动力学模型涵盖了各子系统的耦合振动方程,能够全面反映系统各部分之间的动力相互作用。在求解该大型微分方程组时,采用了一种创新性的高效显式积分方法——翟方法(Zhai Method),显著提升了计算效率与数值稳定性[13]。
(1)
式中,
为线路纵向某位置处路基沉降值,
为沿线路纵向某点坐标,
为余弦型沉降波长,
为余弦型沉降幅值。
Figure 2. Coupled dynamic model of vehicle-track-subgrade considering subgrade settlement
图2. 考虑路基沉降的车–轨–路耦合动力学模型
本研究采用CRH380A高速列车模型进行车辆动力学分析,轨道模型选取单元板式无砟轨道,车辆和轨道系统详细结构参数分别见表1和表2。
Table 1. CRH380A high-speed train model parameters
表1. CRH380A型高速列车车辆参数
参数 |
数值 |
参数 |
数值 |
车体质量/kg |
33,766 |
一系悬挂垂直刚度/N/m |
2.352 × 106 |
转向架质量/kg |
2400 |
二系悬挂垂直阻尼/N*s/m |
2.4 × 105 |
轮对质量/kg |
1850 |
一系悬挂垂直阻尼/N*s/m |
2 × 104 |
车体点头转动惯量/kg*m2 |
1.6545 × 106 |
二系悬挂垂直阻尼/m |
17.5 |
转向架点头转动惯量/kg*m2 |
1.314 × 103 |
固定轴距/m |
2.5 |
二系悬挂垂直刚度/N/m |
0.52 × 106 |
车轮滚动圆半径/m |
0.43 |
Table 2. Parameters of the monolithic slab track model
表2. 单元板式无砟轨道参数
参数 |
数值 |
参数 |
数值 |
钢轨弹性模量/Pa |
2.059 × 1011 |
轨道板弹性模量/Pa |
3.6 × 1010 |
钢轨截面惯性矩/m4 |
3.217 × 10−5 |
轨道板密度/kg/m3 |
2500 |
钢轨质量线密度/kg |
60.64 |
底座板弹性模量/Pa |
3.25 × 1010 |
扣件间距/m |
0.625 |
底座板密度/kg/m3 |
2500 |
扣件弹簧刚度/N/m |
2.5 × 107 |
砂浆层泊松比 |
0.167 |
扣件弹簧阻尼/N·s/m |
3 × 104 |
砂浆层弹性模量/Pa |
3.0 × 108 |
3.2. 敏感指标分析
如图3所示,本文采用CRH380A高速列车模型,模拟其以350 km/h的速度通过沉降区段的情形。选取列车第一轮对运行到沉降区间波谷的时刻,将此时底座板与路基之间的差值作为单元板轨道与路基之间非协调变形的最大距离。该指标可用于衡量无砟轨道与路基之间的非协调变形程度。当CRH380A列车以350 km/h的列车运行速度通过不同路基沉降幅值和波长组合的不均匀沉降区段,选取单元板中作为余弦型沉降的沉降波谷,不附加轨道随机不平顺。通过仿真计算得到单元板轨道与路基之间最大非协调变形的数值,如图4所示。与轨道结构动态响应相关的振动数据可以通过专用轨道检测车辆方便地捕捉和记录,将本研究的识别模型与轨道检测车辆相结合,可以建立车辆振动数据与路基变形缺陷之间的直接关联。这种方法有效地克服了传统轨道检查中因检测隐藏和不连续的非协调变形所面临的困难[14]。因此,本文选择沉降波长为10 m、沉降幅度分别为10 mm、15 mm和20 mm的典型工况进行分析。这些工况分别对应非协调变形程度为2.63 mm、6.68 mm和11.29 mm。如图5所示,以图形方式绘制了这三种不同工况下车体、转向架和轮对振动加速度的实时曲线。通过这种分析,可以确定动态响应对最大非协调变形距离的敏感性,从而获得卷积神经网络所需的训练数据。
Figure 3. Diagram of maximum uncoordinated deformation distance
图3. 最大非协调变形距离示意图
图4表明,在沉降波长较短的情况下,沉降幅值的增加会显著影响列车运行的稳定性与安全性。这是因为无砟轨道混凝土的高刚度性和整体性特征,使其难以随路基变形而协调适应。此外,轨道最大变形距离与路基沉降幅值之间呈正相关关系。在相同沉降幅值下,当沉降波长较短时,轨道与路基之间会出现明显的分离现象;然而,当沉降波长延长至20 m或更长时,轨道的变形模式将逐渐与路基一致,从而有效缓解了非协调变形的问题。
图5表明,当非协调变形的最大距离从2.63 mm增加到11.29 mm时,相较于协调变形工况,车体、转向架和轮对的振动加速度均显著上升。其中,车体垂向振动加速度峰值增加了151%,转向架振动加速度峰值上升了195%,而轮对振动加速度峰值则增加了415%。这些结果表明,轮对振动加速度对非协调变形的敏感程度远高于车体和转向架的振动响应。因此,轮对振动加速度可被视为评估车辆–轨道–路基系统非协调变形的一个关键的敏感参数。
Figure 4. Variation of maximum distance with settlement wave amplitude and wavelength
图4. 非协调变形最大距离随沉降波长和幅值变化规律
(a) 车体振动加速度 (b) 转向架振动加速度
(c) 轮对振动加速度
Figure 5. The sensitivity of body, bogie and wheelset vibration acceleration
图5. 车体、转向架和轮对振动加速度的敏感程度
3.3. 1D-CNN模型
3.3.1. 数据预处理
卷积神经网络模型的训练依赖大规模数据集的驱动,但在实际情况下,获取不同损伤工况的数据的数量通常是有限的。为了满足卷积神经网络对训练样本量的需求,通过在原有的真实的数据集上进行平移、翻转、裁剪等一系列操作来扩充数据集的数量,这一过程通常被称为“数据增广”。本文采取了一种滑动窗口的数据增广方法。具体而言,该方法以轮对加速度时序数据作为输入,即列车通过路基不均匀沉降区域时所采集的动态响应信号为输入。原始时序数据沿时间轴方向以窗口长度2000、滑动步长5进行截取,从而生成多个具有重叠区域的样本数据,有效提升了样本数量与数据利用率,处理过程如图6所示:
Figure 6. Data augmentation for the sliding window method
图6. 滑动窗口方法的数据增广
根据前一章节所述,本文采用具有余弦型不均匀沉降激励的高速车辆–无砟轨道–路基耦合动力系统模型进行仿真,共设置了8种不同幅值和波长组合的沉降工况,并从中提取了3种协调变形工况和5种非协调变形工况下轮对加速度的时序数据,用以反映不同程度的非协调变形现象。首先,从车辆通过沉降区域过程中的动力响应数据中提取轮对加速度时序信号。随后,采用滑动窗口数据增广技术对样本数量进行扩充,最终获得共计3392组数据样本。所有样本经过随机打乱后,按照70%、15%和15%的比例划分为训练集、验证集和测试集,详见表3。
3.3.2. 模型搭建与验证
为克服传统识别方法依赖人工特征提取所存在的局限性,本文提出了一种基于深度学习的识别模型,能够自动提取更深层次的损伤特征信息。本文采用1D-CNN,构建了一个用于轨道与路基之间非协调变形识别的检测系统,从而提升铁路基础设施状态诊断的技术水平。
根据实验需求,本文构建的1D-CNN模型结构如表4所示。该模型的滤波级部分由三个卷积层组成:第一层设置32个卷积核,核尺寸为7;第二层设置64个卷积核,核尺寸为3;第三层设置128个卷积核,核尺寸为3。此外,模型中还包含两个池化层,池化窗口大小均为2,步长也为2。分类部分包括展平层、全局平均池化层、全连接层以及Softmax输出层,用于最终的分类决策。在模型训练过程中,采用Adam优化算法,该算法因其具备自适应学习率、计算高效以及对稀疏数据的良好适应性,已成为当前深度学习训练中的主流选择之一。Adam算法会计算每个参数的梯度,随后依次进行动量更新与修正、梯度平方累积计算与修正,最终完成参数更新。关于学习率这一关键超参数,其取值会影响模型的学习速度。若选择不当,可能导致模型无法收敛甚至发散。在本研究中,初始学习率设定为0.001。同时,在另一模型中所涉及的批量大小(batch size)参数,本文设置为64,以在训练效率与模型性能之间取得较好的平衡。
Table 3. Conditions for uneven subgrade settlement in unit slab ballastless track systems
表3. 单元板式无砟轨道路基不均匀沉降工况
工况 |
沉降波长/m |
沉降幅值/mm |
最大距离/mm |
1 |
10 |
10 |
2.63 |
2 |
10 |
15 |
6.68 |
3 |
10 |
20 |
11.29 |
0 |
15 |
10 |
0 |
4 |
15 |
15 |
0.11 |
5 |
15 |
20 |
0.4 |
0 |
20 |
10 |
0 |
0 |
20 |
15 |
0 |
Table 4. Model parameters of 1D-CNN
表4. 1D-CNN模型参数
|
名称 |
类型 |
激活 |
可学习参数 |
可学习参数总数 |
1 |
Sequence input |
序列输入 |
2000×1 |
- |
0 |
2 |
conv1d_1 |
卷积 |
2000 × 32 |
Weights |
7 × 1 × 32 |
256 |
Bias |
1 × 32 |
3 |
relu_1 |
ReLU |
2000 × 32 |
- |
0 |
4 |
maxpool1d_1 |
一维最大池化 |
1000 × 32 |
- |
0 |
5 |
conv1d_2 |
卷积 |
1000 × 64 |
Weights |
3 × 32 × 64 |
6208 |
Bias |
1 × 64 |
6 |
relu_2 |
ReLU |
1000 × 64 |
- |
0 |
7 |
maxpool1d_2 |
一维最大池化 |
500 × 64 |
- |
0 |
8 |
conv1d_3 |
卷积 |
498 × 128 |
Weights |
3 × 64 × 128 |
24,704 |
Bias |
1 × 128 |
9 |
relu_3 |
ReLU |
498 × 128 |
- |
0 |
10 |
flatten |
扁平化 |
63,744 |
- |
0 |
11 |
Globalavgpool 1d |
一维全局平均池化 |
63,744 |
- |
0 |
12 |
fc |
全连接 |
6 |
Weights |
6 × 63,744 |
382,470 |
Bias |
6 × 1 |
13 |
softmax |
Softmax |
6 |
- |
0 |
14 |
classoutput |
分类输出 |
6 |
- |
0 |
基于上述1D-CNN模型,实验在CPU为Intel(R) Core(TM) i5-8300H CPU @ 2.30GHz 2.30 GHz,GPU为NVIDIA GeForce GTX 1050、内存12 GB的计算平台上开展,操作系统为Windows 11家庭中文版,开发环境采用 MATLAB R2021b。对预处理后的轮对振动加速度数据集进行训练、验证与识别,训练结果如图7和图8所示。
(a) 训练集和验证集准确率曲线 (b) 训练集和验证集损失曲线
Figure 7. Model training accuracy and loss curves
图7. 模型训练的准确率和损失曲线
Figure 8. Multi-label classification accuracy after confusion matrix visualization
图8. 准确率混淆矩阵可视化后的多标签分类准确率
图7和图8展示出了1D-CNN在信号处理领域中优异性能,它能够有效从轮对振动加速度数据中提取与损伤相关的特征信息。训练过程中的训练集与验证集准确率曲线变化趋势如下:随着训练数的增加,准确率迅速上升,并最终趋于稳定,波动范围集中在90%至100%之间。训练损失和验证损失的变化趋势则表现为:随着训练轮次的增加,损失值快速下降并逐渐趋于平稳。其中,训练损失从初始的1.9逐步降低至0.1,验证损失也由6降至0.15。这一显著下降表明模型在学习过程中有效地减少了预测误差。通过混淆矩阵的可视化进一步分析测试结果,显示模型测试准确率达到95.87%,充分验证了模型具有良好收敛性且在损伤识别任务中有着出色的检测能力。
3.3.3. 评估模型鲁棒性
数值仿真所获得的动态响应数据通常具有较高的精度,然而,这类数据往往难以全面反映实际环境等外部因素的影响。此外,现场列车运行中采集的数据通常包含一定程度的噪声。为了进一步验证模型的鲁棒性,并考察轮对振动加速度信号中白噪声对模型识别结果的干扰影响,本文在测试数据中引入了高斯白噪声。只有模型能够完成施加了白噪声的信号分析验证,才具有运用到实际信号识别任务的条件。相关数学表达式如式(2)所示:
(2)
式中:
代表噪声信号在时间
处的取值。
表示均值(期望值)为
,方差为
的高斯分布。
是噪声的标准差,它控制了噪声的幅度。
(a) 5%噪声标准差下的测试集准确度 (b) 8%噪声标准差下的测试集准确度
Figure 9. Test set accuracy with different noise standard deviations
图9. 不同噪声标准差下的测试集准确度
测试集分别赋予5%和8%的噪声标准差后,识别准确率结果如图9所示。模型的识别准确率分别为94.89%和85.66%。实验结果表明,该模型具有较强的鲁棒性。在一定阈值内,随着噪声水平的增加,虽然模型的识别准确度有所下降,但仍保持着较为可观的准确度。
4. 结论
(1) 考虑到轨道在轨道–路基非协调变形作用下的动力响应相较于列车运行数据更难获取,本文通过分析不同程度的轨道–路基非协调变形对车辆各部件动力学响应的变化规律,发现轮对振动加速度对非协调变形更为敏感。因此,将其作为识别轨道–路基非协调变形的一种敏感动力学指标。
(2) 所建立的识别模型有效结合了1D-CNN在自动提取损伤特征信息方面的优势,以及能够反映列车运行品质的车辆–轨道–路基耦合动力学模型。该方法实现了轨道–路基非协调变形与列车运行的直接关联机制,展现出优异的识别性能。
(3) 所构建模型具有良好的鲁棒性与泛化能力。未来可通过与轨检车关联,实现将监测到的车辆振动数据直接对应至轨道–路基非协调变形的具体位置。该方法有望克服传统检测手段在监测难度大、连续性差、损伤隐蔽性强以及定期巡检频率低等方面存在的问题。
基金项目
本文由内蒙古自治区自然科学基金面上项目(2024MS05035)支持。
NOTES
*通讯作者。