1. 引言
我国公路规模发展迅速,根据交通运输部的数据显示,公路总里程超过540万公里,其中高速公路超过18万公里[1],公路网呈现出量大面广的特点。但是,公路建设的速度仍不及汽车保有量的增长速度,部分路段车流量大且易发生交通冲突事件,给交通管理与出行服务带来极大挑战。如何及时、高效的检测和跟踪公路上的车辆目标及其运动轨迹,对于提升交通管理水平具有重要意义。
传统的交通检测方法通常依赖于地感线圈、手工记录和人工观察,这些方法不仅成本高昂且存在数据采集不全面、实时性差等问题。随着深度学习技术的快速发展,机器视觉开始广泛应用于交通检测与分析领域,有研究对原始YOLOv3目标检测算法进行改进,使其兼顾实时性和准确性[2],还有研究使用改进的YOLOv5算法,并结合车辆跟踪模块实现车辆检测与跟踪[3]。为解决轻量化问题,当前的研究已将轻量级网络EfficientNet作为YOLOv3的主干网络,并通过DeepSORT模型构建面向高速公路的车辆视频监控分析系统[4],同时在YOLOv3中引入KCF算法实现基于监控视频的多尺度车辆检测与跟踪[5]。本文提出一种基于机器视觉的车辆检测与跟踪总体框架及实现流程,并通过实例分析本文方法的有效性,为交通主动管控提供技术支撑。
2. 总体框架
基于机器视觉的车辆检测与轨迹跟踪及其相关应用的总体框架如图1所示。
Figure 1. Overall technical framework
图1. 总体技术框架
(1) 车辆检测与跟踪。车辆检测模块采用Transformer和DETR (Detection Transformer)相结合的实时目标检测算法RT-DETR,该算法通过并行处理机制显著提升检测速度,确保在公路动态交通环境中的实时性检测要求;车辆跟踪模块采用BoTSORT目标跟踪算法,在车辆检测的基础上,结合车辆运动和外观信息的综合跟踪策略,引入相机运动补偿,实现复杂多变交通场景中稳定且连续的车辆跟踪。RT-DETR检测模型及BoTSORT跟踪算法流程如图2所示。
(a)
(b)
Figure 2. Vehicle detection model and tracking algorithm process. (a) RT-DETR detection model; (b) BoTSORT tracking algorithm process
图2. 车辆检测模型与跟踪算法流程。(a) RT-DETR检测模型;(b) BoTSORT跟踪算法流程
(2) 车辆轨迹提取。通过关联目标检测与跟踪算法,基于跟踪ID的连续性,将同一车辆在不同帧中的位置信息串联起来,形成完整的车辆行驶轨迹,为后续交通分析提供精准的数据来源。
(3) 多目标车辆跟踪应用。基于提取的车辆轨迹信息,对车辆速度进行精确计算,进而开展相关应用研究,本文主要研究车流量与交通冲突的关系。
3. 实现流程
3.1. 数据准备
收集并准备用于训练和测试的目标检测数据集。数据集中的图像需要标注目标的边界框和类别信息,可使用Python编程语言中的Labelimg库实现,Labelimg标注界面如图3所示。
Figure 3. Labelimg-based labeling interface
图3. Labelimg标注界面
本文收集了10个不同场景的公路视频,总计12小时,将车辆类型分为car、bus、truck三类,完成数据标注图片3503张,超过7000个标签,并将数据集按照7:1:2划分为训练集、验证集、测试集。数据集标注情况如图4所示。
Figure 4. Dataset category and quantity
图4. 数据集类别和数量
3.2. 模型训练
本文模型训练过程中使用的GPU型号为GeForce RTX 2080ti (22 GB),CPU型号为Intel(R) Core(TM) i5-12490F,内存为32 GB,所使用的深度学习框架为PyTorch 1.11.0 + CUDA 11.5;设置优化器为SGD,初始学习率为0.01,循环学习率为0.2,衰减为0.005,Batch_size为32,训练轮次Epoch为200次。当模型趋于收敛状态时则达到最优性能,模型训练过程评价指标曲线变化如图5所示,可以看出当模型训练至125轮时,模型趋于收敛状态。
Figure 5. Changing curve of evaluation indicators during model training process
图5. 模型训练评价指标变化曲线
3.3. 模型评估
使用测试集对训练好的模型进行评估,计算其在目标检测任务上的性能指标,本文采用以下四类评价指标:
(1) 车辆检测平均精度的计算公式如式(1)所示。
(1)
式中:为类别数量,为第i个类别的平均精度。
(2) 为预测框与真实框的交并比IoU阈值为0.5时的平均精度。
(3) 车辆检测准确率的计算公式如(2)所示,表示检测出的正样本数占所有检测出的样本数的比例。
(2)
式中:为样本中原是正例且被正确划分为正例的数量;为样本中原是负例但被错误划分为正例的数量。
(4) 召回率的计算公式如(3)所示,表示检测出的正样本数占所有实际正样本数的比例。
(2)
式中:为样本中原是正例但被错误划分为负例的数量。
通过RT-DETR车辆检测模型训练结束后可得到最优模型,使用测试集对模型训练结果进行评估,评估结果见表1。
Table 1. Model evaluation results
表1. 模型评估结果
Model |
/% |
/% |
/% |
/% |
Car |
Bus |
Truck |
RT-DETR |
96.3% |
97.1% |
96.5% |
96.6% |
89.1% |
94.8% |
由表1可知,RT-DETR检测算法的平均精度达到96.6%,并且针对每类车辆的平均检测精度均达到了90%以上,训练后的模型具有较高的精度,可满足实际工程应用。图6为实际检测结果,实线框为检测到的车辆目标,该算法在视频范围内能够检测到95%以上的车辆,表现出较高的检测精度和鲁棒性。
Figure 6. Actual test results
图6. 实际检测结果
4. 应用分析
本文选取江苏某段公路不同时间段(早高峰、晚高峰和平峰)的视频进行实验,验证所提出的车辆检测方法在复杂交通条件下的有效性和准确性,实验结果分为两部分,一部分是车辆检测和分类的准确性分析,另一部分是车流量与交通冲突分析。
Table 2. Detection accuracy for different categories of vehicles
表2. 针对不同类别车辆的检测准确率
类别 |
准确率(%) |
小汽车(Car) |
95.5% |
巴士(Bus) |
93.0% |
卡车(Truck) |
90.3% |
本研究采用路侧监控视频,其分辨率为1920 × 1080像素,帧率为30 frame/s。表2表明针对各类车辆的检测准确率较高,图7显示了车辆检测与跟踪结果,可以看出监控视频远端的小目标车辆与近端车辆均被有效识别,被赋予的边界框能够紧密贴合车身轮廓;同时,每辆车均被标注了唯一的车辆编号,且编号在不同的视频帧之间保持一致,可用于追踪车辆在连续帧中的位置变化和运动轨迹。
Figure 7. Vehicle tracking results
图7. 车辆跟踪结果
Figure 8. Traffic flow and frequency of traffic conflicts at different periods. (a) Traffic volume; (b) Frequency of traffic conflicts
图8. 不同时段的车流量与交通冲突频数。(a) 车流量;(b) 交通冲突频数
通过本文提出的RT-DETR目标检测与BoTSORT目标跟踪模型,对检测到的车流量和车辆轨迹进行分析,发现车流量与交通冲突频数之间存在正相关性,如图8所示。高峰时段(如早晚通勤时段)相较于非高峰时段,车流量平均增长了237.7%,而交通冲突频数平均增长了107.7%,这是因为车流量剧增导致车辆安全间距缩小,驾驶员的操作自由度受限,容易发生追尾和侧向冲突。
5. 结语
(1) 本文提出了一种基于RT-DETR目标检测和BoT-SORT目标跟踪算法的交通轨迹提取方法,实验结果表明,RT-DETR算法经训练后,平均精度达到96.6%,且能够有效识别并跟踪视频范围内不同远近程度和类别的车辆。
(2) 本研究采用上述方法分析了真实监控视频中的车辆运动轨迹,发现车流高峰时段相较于非高峰时段,交通冲突更加频繁,车流量与交通冲突频数之间具有正相关性。下一步将通过相关性分析,深入研究车流控制对于降低交通冲突风险的定量方法,为车道级交通主动管控提供决策支持。