基于PVANet卷积神经网络的交通标志识别算法_AI热点日报

基于PVANet卷积神经网络的交通标志识别算法

类型：热点整理2026-07-02

在计算机视觉研究领域，目标检测始终是核心课题之一。近年来，基于卷积神经网络的检测算法在准确率与速度方面取得了显著进展，但一个长期存在的难题仍未解决：当待检测目标在图像中仅占据极小面积时，主流网络的表现往往不尽人意。小目标检测——例如交通标志、行人、远处车辆——在民用、军事及安防等众多场景中至关重要，

在计算机视觉研究领域，目标检测始终是核心课题之一。近年来，基于卷积神经网络的检测算法在准确率与速度方面取得了显著进展，但一个长期存在的难题仍未解决：当待检测目标在图像中仅占据极小面积时，主流网络的表现往往不尽人意。小目标检测——例如交通标志、行人、远处车辆——在民用、军事及安防等众多场景中至关重要，然而现有模型对这些“微小物体”的识别能力依然存在明显短板。

PVANet（性能与精度平衡网络）凭借其高效的训练特性与优良的尺度适应性，在复杂多变的交通场景中展现出独特优势。不过，它在小目标检测方面同样面临瓶颈。针对这一问题，本文对PVANet的浅层特征提取层、深层特征提取层以及多层特征信息融合层（HyperNet）进行了针对性改进，提出了一种更适合小目标检测任务的改进模型。基于TT100K交通标志数据集的大量实验验证表明，改进后的网络在小目标检测能力上实现了显著提升，相应的交通标志检测算法也取得了更高的准确率。

1 相关工作

交通标志检测并非一个新课题。早期方法依赖手工设计的特征提取器，利用标志特有的颜色、形状和图案进行识别。例如，Ritter等人利用RGB颜色组合配合查表法来消除无关颜色，Priese等人则设计了颜色结构代码。这些方法虽然有效，但光照变化对RGB分量的影响很难处理，于是研究者转向了更接近人类感知的HSI颜色空间。Zaklouta等人结合HOG描述符与线性SVM，在实时性和性能之间找到了一个不错的平衡点。

但手工特征提取的天花板很明显：模型效果高度依赖设计者的经验，难以大规模推广。卷积神经网络的引入带来了质的改变——网络可以自主学习图像中的特征信息。Sermanet等人在德国交通标志数据集GTSRB上，用卷积网络实现了98.97%的检测准确率；Aghdam等人则通过设计新的ReLU激活函数和CNN架构，在精度和时间上取得了更好的收益。

2 PVANet网络结构与改进

2.1 PVANet网络简介

PVANet由Intel团队在2016年提出，专为实时物体检测设计。在VOC数据集检测比赛中，它以82.5%的mAP拿下了第二名。其亮点主要体现在三个方面：一是采用C.ReLU激活函数改善参数冗余，提高训练效率；二是借鉴Inception结构的思想，通过不同尺度的卷积核和池化操作并行处理，增强对多尺度目标的适应性；三是将conv3层的1/8、1/16和1/32特征图进行连接，让最终特征图包含更丰富的多尺度信息。

2.2 PVANet网络结构的改进

尽管PVANet在准确率和实时性上表现不错，但小目标检测仍有很大的提升空间。为此，本文从三个环节入手进行改进：浅层特征提取、深层特征提取和HyperNet层。图1直观展示了改进前后的网络结构对比，虚线框部分即为新增或调整的模块。详细的改进后网络参数见表1。

注： conv i—第i级卷积; pool—池化; RPN—region proposal network; FC— fully connected layer

图 1 PVANet网络改进前后结构图

2.2.1 浅层特征提取

原版PVANet的第一层卷积层采用7×7（或更大）的卷积核，配合C.ReLU激活函数来避免参数冗余。但这里有个问题：使用多个3×3卷积核组合代替单个大卷积核，不仅能减少参数量、加快检测速度，还能增强网络的非线性表达能力。同时，C.ReLU虽然能提高参数效率，但输出维度会翻倍，因此通常需要限制输入维度——比如conv1的输出期望维度设为32，那么第一层卷积的输出就必须限定为16。对于较大尺寸的图片来说，这种限制反而削弱了浅层网络的提取能力，导致图像的细粒度特征和小目标信息丢失。

基于以上分析，本文将PVANet第一层卷积中的7×7卷积核拆解为三层3×3卷积。具体来说：第一层用普通的ReLU激活函数，输出维度提高到24；第二层开始使用C.ReLU，输出维度增加到48；第三层再将维度降低到32。这种结构（见图2）的核心目的是增加浅层卷积滤波器对细粒度和小目标特征的提取能力。此外，为了增强改进效果，conv2和conv3模块中每个子模块的第一层卷积输出维度也分别增大到48和72（见表1）。

图 2 浅层特征提取卷积层改进示意图

2.2.2 深层特征提取

PVANet在深层特征提取中通常使用Inception v1模块。该模块将5×5卷积核分解为两个3×3卷积核，减少了参数量，但也伴随着一定的精度损失。为了弥补这一点，本文在保留上述分解的基础上，进一步将3×3卷积核非对称地分解为1×3和3×1两个卷积核（见图3）。这种非对称分解不仅进一步降低了参数量，而且通过增加网络深度，有望进一步提升网络的非线性表达能力。

图 3 非对称1×3和3×1维度卷积核的卷积过程

2.2.3 多层特征信息融合

在原版PVANet中，conv3_4层输出的132×80像素特征图通过3×3池化进行下采样，而conv5_4层输出的33×20特征图通过4×4卷积进行上采样，两者最终在66×40像素大小上合并，作为检测和分类的依据。但问题在于：相比输入图片，这个特征图已经缩小了16倍。假设输入图片中有一个32×32像素的小目标，映射到最终特征图上只剩下2×2个像素点。这种信息压缩方式严重限制了小目标的特征表征能力。

解决方案很直接：减少一次池化和相应的卷积特征提取，让网络直接融合更浅层卷积层输出的特征图，在更大的132×80特征图（缩小8倍）上进行检测和分类。这意味着更多的小目标信息得以保留。

3 实验

3.1 实验条件与方法

实验选用TT100K交通标志数据集作为基准，训练集包含10,380张图片，测试集包含5,229张图片。两个子集覆盖了所有需检测的标志类别，且图像数据互不重叠。

训练求解器使用SGD，Batch Size设为1，初始学习率0.01，每40,000步衰减0.1倍。momentum和weight decay分别设为0.9和0.0002。所有深度学习算法基于Caffe框架实现，实验平台配备Intel i7-5930K CPU和NVIDIA Titan X GPU，操作界面采用Python。

3.2 实验结果与分析

在TT100K测试集上，分别使用原版PVANet和加入各改进模块的模型进行交通标志检测，以准确率、单帧检测时间和PR曲线作为评价指标。实验结果见表2和图4。

图 4 算法改进前后PR曲线对比图

从表2来看，单独采用2.2.1节的浅层改进，mAP相比原版PVANet提升了约4.2%。这说明提高浅层网络的通道数确实能增强对小目标的检测能力。同时，由于将7×7大卷积核拆解为多个3×3小卷积核，计算量并没有明显增加，检测时间基本持平。在此基础上再叠加2.2.2节的深层改进（将5×5卷积替换为1×3和3×1卷积），检测速度进一步加快，同时保持着较高的mAP。最终，采用全部改进方案并减少一次池化后，输出特征图增大了一倍，mAP大幅提升了约9%。虽然检测时间增加了约0.02秒，但仍在0.09秒以内，实时性完全满足交通标志检测的要求。图4的PR曲线也显示，改进后的算法在准确率和召回率上均有明显提升。

图5展示了算法对小目标交通标志的实际检测效果。其中有一个超小且被遮挡的交通标志（图5b标注所示）。原版PVANet（图5a）未能检测到，而改进后的网络（图5b）成功识别。这不仅验证了改进网络对小目标的优秀检测能力，也说明它对遮挡问题具备一定鲁棒性。

图 5 改进前后PA VNet检测效果对比图

图6是上述场景经过卷积计算后得到的中间层特征图。可以看到，浅层特征图更侧重于宏观特征提取，风格与原图相近；而深层特征图则专注于细节像素的计算判断，对交通标志的准确检测更为关键。对比改进前后的效果，改进后算法在正确的交通标志区域呈现出更亮的颜色，代表对目标的敏感性更高。

图 6 改进前后浅层和深层卷积层特征对比图

图7进一步验证了改进算法在更复杂场景下的表现。该场景共有5个交通标志，原版PVANet只检测到3个，而改进后的算法成功检测到了全部5个。图7b和7c分别是改进前后算法检测结果的局部放大图，效果差异一目了然。

图 7 检测效果对比图

综合来看，TT100K数据集中部分交通标志属于小目标物体。实验结果表明，改进算法之所以能取得优秀表现，核心原因在于：浅层神经网络感知野较小，主要负责细节特征提取，增加浅层通道数能让网络提取更多细节信息；而减少一次池化不仅增大了输出特征图，还让HyperNet模块融合的浅层特征图更“浅”，从而保留更多图片的细节特征。虽然检测时间有所增加，但总时长仍控制在0.09秒以内，实时性表现良好。

4 结论

PVANet在高训练效率和多尺度适应性方面表现出色，特别适合复杂多变的交通场景。本文针对其小目标检测能力的不足，从浅层特征提取、深层特征提取和HyperNet多层特征融合三个模块入手进行改进，提出了一种改进的PVANet卷积神经网络模型。基于TT100K数据集的实验验证表明，改进后的网络在交通标志小目标检测的mAP上获得了大幅提升，证明了其对小物体的优秀检测能力；虽然检测时间略有增加，但仍具备良好的实时性。

来源：https://m.elecfans.com/article/1309210.html

神经网络

延伸阅读

补充最近整理过的热点入口。