1. 引言
交通标志识别(Traffic Sign Recognition, TSR) [1]是智能运输系统(Intelligent Transport System, ITS)中的关键环节[2]。随着无人驾驶技术的出现,交通标志识别技术得到了进一步发展,基于计算机视觉的交通标志识别方法逐渐成为主流。徐迪红等提出通过融合几何特征(形状/颜色)、纹理特征与CNN深层语义特征实现多尺度检测的方法[3],梁敏健等采用HOG-Gabor特征融合与Softmax分类器,有效提升了交通标志识别的检测精度[4]。随着Fast R-CNN、YOLO等目标检测算法的成熟,基于深度学习的交通标志识别方法得到广泛应用,傅景超等提出了基于YOLOv3的道路多目标检测方法[5]。随后,YOLOv4、YOLOv5等轻量化目标检测网络不断发展;通过降低模型复杂度,在确保目标精度检测的同时,降低硬件需求,增强了算法的实用性。
YOLOv8在YOLOv5的基础上进行了部分改进和优化,如表1所示。YOLOv8支持检测、分割、分类、姿态估计[6]等任务,使用锚检测头、可重参数化卷积,适用于高精度需求场景,如高级机器人、高分辨率图像分析和多任务视觉系统,适合自动驾驶场景中的交通标志识别需求。YOLOv8在性能上优于YOLOv5,同时保持了较高的推理速度。此外,YOLOv8还采用CIoU (Complete Intersection over Union)作为边界框回归的损失函数,进一步提升了检测精度,计算方法见公式(1)。
(1)
Table 1. Comparison of YOLOv8 and YOLOv5
表1. YOLOv8与YOLOv5对比
模块 |
YOLOv5结构 |
YOLOv8改进 |
改进效果 |
Backbone |
C3模块 |
C2F模块[7] |
减少了计算量 |
Neck |
基础FPN |
FPN + PAN双通路结构[8] |
小目标检测AP提升,多尺度特征融合效率提高 |
Head |
静态锚框 |
动态锚框机制 |
边界框回归误差降低 |
2. 实验设计
2.1. 交通标志数据集说明
使用YOLOv8进行交通标志识别需要大规模的标准交通标志数据集。目前已公开的主要交通标志数据集的基本信息如表2所示。
Table 2. Publicly available traffic sign datasets
表2. 已公开的交通标志数据集
数据集 |
国家 |
用途 |
类别 |
图片数量 |
图片像素 |
GTSD8 |
德国 |
检测 |
3 |
900 |
1360 × 900 |
GTSRB |
德国 |
识别 |
43 |
51,839 |
15 × 15~250 × 250 |
BTSD |
比利时 |
检测 |
13 |
39,114 |
1628 × 1236 |
BTSC |
比利时 |
识别 |
62 |
7095 |
100 × 100~1628 × 1236 |
STSC |
瑞典 |
检测和识别 |
7 |
20,000 |
1280 × 960 |
LTSD |
美国 |
检测和识别 |
49 |
6610 |
640 × 480~1024 × 522 |
TT100K |
中国 |
检测和识别 |
45 |
10,000 |
2048 × 2048 |
本研究使用TT100k_2021数据集[9]进行模型训练。TT100k_2021为真实道路数据集,拥有100多种不同类型的交通标志标签(每个标签下方对应一个唯一的编码),如图1所示。数据集中包括30,000个交通标志样本,涵盖不同的光照、天气和复杂背景。
Figure 1. Traffic signs in the TT100k_2021 dataset
图1. TT100k_2021数据集中的交通标志
为保证模型训练时的数据均衡性和检测结果的有效性,在数据预处理时只保留图片数量大于50的交通标志集合,最终得到45类,合计一万余张图片。
2.2. 训练过程与性能评估
使用TT100k_2021数据集进行300轮次训练,最终结果如图2所示。可以看出,在YOLOv8训练交通标志识别模型的过程中,训练集与验证集的损失函数均呈现快速下降后趋于稳定的趋势,说明模型能有效学习交通标志的特征,且未出现明显过拟合;同时,精确率、召回率、mAP50 (单IoU阈值下平均精度)、mAP50-95 (多IoU阈值下平均精度)等评估指标随训练迭代逐步提升并趋于饱和,反映出模型在交通标志检测任务上具备良好的精度与泛化能力,整体训练效果较为理想。
为验证YOLOv8模型在交通标志检测领域的有效性,全面评估模型在不同IoU阈值下识别不同交通标志场景时的性能,对不同场景分别引入平均精度(mAP)、精度(Precision)、召回率(Recall)等指标。其中mAP通过计算多个IoU (交并比)阈值下的平均精度来衡量模型的整体检测性能,计算方法见公式(2),YOLOv8在TT100K_2021数据集上不同交通标志(标签)数据集上的mAP表现如图3所示。
(2)
Figure 2. 300 epochs training results
图2. 300轮次训练结果
Figure 3. Mean average precision of different traffic signs (labels)
图3. 不同交通标志(标签)平均精度
除平均精度外,精确率和召回率也是衡量模型性能的重要指标。对部分关键交通标志,如限速标志、禁止通行标志等,进行了精确率和召回率的统计(IoU = 0.50),结果如表3所示。
Table 3. Statistical table of precision and recall rate for selected critical traffic signs
表3. 部分关键交通标志精确率和召回率统计表
标签类别(编码) |
精确率(Precision) |
召回率(Recall) |
非机动车行驶(i2) |
97.40% |
80.50% |
非机动车车道(i2r) |
83.33% |
81.30% |
靠右行驶(i5) |
94.60% |
81.30% |
人行横道(ip) |
86.10% |
83.10% |
从表3结果可以看出,模型在不同类别上的精确率和召回率表现较为均衡。模型对高频出现的常规交通标志(如“非机动车行驶”和“靠右行驶”)展现出较强的检测能力,精确率分别达到97.40%和94.60%。对几何特征较为相似的“非机动车车道”和“人行横道”标志,虽然精确率略低(分别为83.33%和86.10%),但召回率仍保持在80%以上,表明模型具有较好的泛化能力。
此外,针对易受遮挡的“非机动车行驶”标志,通过注意力机制引导,识别复杂场景下的模型识别精度、召回率分别可以达到75%、80%以上,表明模型在这些标志的检测上具有较高的可靠性。对于一些更为复杂或容易被遮挡的标志(如禁止非机动车进入),虽然精确率和召回率稍低,但仍然处于合理水平,能够满足实际应用需求。
3. 部分场景分析
3.1. 小目标交通标志牌识别
使用YOLOv8模型,检测尺寸较小的交通标志牌,结果如图4所示。在子图4(a)中,识别到了pne (禁止驶入),置信度为0.8;在子图4(b)中,识别到了pl60 (限速60)、p11 (禁止鸣笛)和pn (禁止车辆临时或长时停放),置信度分别为0.87、0.87和0.9。可见YOLOv8在小目标交通标志牌识别上具备实用性。
(a) (b)
Figure 4. Small target traffic sign recognition results
图4. 小目标交通标志牌识别结果
3.2. 复杂背景中的交通标志牌识别
实际路况中的交通标志牌,往往伴随着广告牌、汽车等复杂背景环境,可能会对交通标志牌识别造成干扰,使模型产生漏检、误检,降低识别性能。使用YOLOv8模型,对复杂背景中的交通标志牌进行识别,结果如图5所示。由图5可见,在复杂环境中,YOLOv8仍然能保持较高的识别精度。
Figure 5. Recognition results of traffic signs in complex backgrounds
图5. 复杂背景中的交通标志牌识别结果
3.3. 亮度分布不均匀背景中的交通标志牌识别
在亮度分布不均匀背景中的交通标志牌识别场景中,YOLOv8模型在大部分标志牌的识别中性能较好,但在pn (禁止车辆临时或长时停放)和p6 (禁止非机动车进入)的识别上表现欠佳,如图6所示。
Figure 6. Recognition results of traffic signs in backgrounds with uneven brightness distribution
图6. 亮度分布不均匀背景中的交通标志牌识别结果
3.4. 其他场景中的交通标志牌识别
此外,还进行了光照条件较差和交通标志牌被遮挡情况下的实验。在光照条件较差的情况下,图像往往因光线不足而质量受损,交通标志牌的细节特征随之变得难以辨认,加大了识别的难度。实验结果表明,YOLOv8算法能够有效应对低照度的挑战,准确识别交通标志牌,证明了YOLOv8算法在低光照环境下的有效性。在交通标志牌易被遮挡的情况下,算法难以获取完整的标志牌信息,识别难度增加。实验表明,在有遮挡的情况下,YOLOv8算法仍然成功检测出w13 (十字交叉)和pl20 (限速20)等标志。
4. 结论
基于YOLOv8在TT100K数据集上进行交通标志识别,在检测精度、实时性、鲁棒性等方面都具有良好的效果;并且对小目标交通标志牌、复杂背景中的交通标志牌、亮度分布不均匀背景中的交通标志牌等特殊场景也能够达到比较满意的识别效果,因此这种方法具有一定的理论意义和应用价值。经过进一步对比分析,相较于YOLOv5模型,YOLOv8在识别精准度、置信度、处理速度,以及复杂环境、低照度和有遮挡的情况下,都具有明显优势。
在前述实验中,pm20 (限重20 t)和p6 (禁止非机动车进入)两类样本mAP较低;两类样本在TT100k_2021数据集中的样本数量分别为98、67,处于较低水平,样本稀缺性可能是导致模型识别效果不佳的核心因素。针对此类问题,应设计数据增强策略,提升模型对小样本类别的泛化能力。在亮度分布不均匀背景中,pn (禁止车辆临时或长时停放)与p6 (禁止非机动车进入)识别表现欠佳(图6)。分析表明,高光区域过度曝光易导致标志关键颜色特征(如红色)饱和度衰减,或因局部过曝遮蔽符号/文字等关键信息。此类问题需要通过设计光照不变特征提取方法予以解决。
除前述场景外,在大雾、暴雨等极端天气情况下,交通标志识别的性能会明显下降。因此,一方面需要增加极端天气情况下的训练数据,提升模型泛化能力;另一方面结合图像增强技术,如去雾算法、图像恢复算法等提升图像质量,最终提高识别性能。进一步地,可在今后工作中利用更多国家、地区的交通标志数据集,采用域自适应(Domain Adaptation)方法[10]等新技术,提升模型跨地域场景下的识别性能。
基金项目
2025年度河北省金融科技应用重点实验室课题(课题编号:2025010)。