首页 游戏 软件 资讯 排行榜 专题
首页
AI
奔驰团队如何让自动驾驶汽车识别不确定路况并安全行驶

奔驰团队如何让自动驾驶汽车识别不确定路况并安全行驶

热心网友
48
转载
2026-05-14

在斯图加特的梅赛德斯-奔驰研究中心,科学家们正致力于攻克一项关乎自动驾驶安全的核心挑战:如何赋予人工智能“自知之明”,使其能够主动表达“我不确定”。这项由梅赛德斯-奔驰携手斯图加特大学、纽伦堡-埃尔兰根大学共同推进的前沿研究,为提升自动驾驶系统的谨慎性与可靠性开辟了创新的技术路径。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

让AI探测器看得见

设想一下,在浓雾天气中驾驶,你会本能地降低车速,因为模糊的视线意味着潜在风险。然而,当前绝大多数AI目标检测系统却像一个过度自信的新手,即使在感知条件不佳、图像模糊的情况下,也倾向于输出一个绝对确定的结论。这种“盲目自信”在自动驾驶这类安全至上的领域,可能引发难以预料的严重后果。

问题的根源在于“空间不确定性”信息的缺失。现有的视觉AI能够识别物体并给出一个置信度分数,例如“这是一辆车,我有95%的把握”。但它无法进一步说明:“车就在那个区域,但我对其精确的轮廓边界和具体位置不那么有把握。” 这好比一个人能肯定地说“远处有个人”,却无法清晰描述那人的确切站位和身形姿态。这种关键信息的缺位,使得系统在面对需要精细操控的复杂场景时,决策风险陡增。

一、探测器的“视觉”原理与其固有局限

要理解后续的技术突破,首先需要了解现代AI目标检测系统,尤其是DETR这类先进架构的工作原理。其流程,类似于一位侦探进行现场勘察。

整个过程分为三个关键阶段:首先是“全局特征提取”,编码器像侦探一样扫描整张图像,捕捉全局上下文与关键特征。接着是“目标定向查询”,解码器会派出多组“查询向量”,主动在特征图中搜寻潜在的目标对象。最后是“结果输出”,分类与回归头会给出最终的检测结论:物体类别、边界框坐标以及分类置信度。

然而,传统DETR架构存在一个根本性局限:它只能输出确定性的、单一的结果。当它绘制出一个边界框时,呈现的是唯一且精确的坐标,却没有附带任何关于“这个框的位置可能存在多大误差范围”的量化说明。这种“非黑即白”的输出模式,在面对复杂多变的真实世界时,显得捉襟见肘。

二、现有技术方案的效率瓶颈

为了给AI注入“不确定性感知”能力,研究者们并非从零起步。此前主要存在两条技术路径,但都伴随着高昂的计算代价。

第一条路径是“蒙特卡罗Dropout”。这相当于让同一个侦探,在不同的大脑工作状态下(随机屏蔽部分神经元),对同一现场反复勘察多次,然后汇总分析这些存在细微差异的报告。该方法虽然有效,但重复推理导致计算速度大幅下降,难以满足自动驾驶对实时性的严苛要求。

第二条路径是“深度集成”。这好比直接组建多个独立的侦探团队,让他们分别进行勘察,再综合所有意见。这种方法通常能获得更可靠的不确定性评估,但训练和运行多个完整的模型,对计算资源和内存的消耗极为巨大,成本难以承受。

三、GroupEnsemble:构建高效的“内部专家议会”

面对性能与效率的权衡,奔驰研究团队提出了一个巧妙的构想:何不在一个统一的模型架构内部,培育多个具备独立视角的“专家小组”?

这正是GroupEnsemble方法的核心思想。它基于一项现有技术——Group DETR。在模型训练阶段,Group DETR会初始化多组查询向量,这些小组会自然地学习关注图像的不同区域和特征,形成多样化的“观察模式”与“专业倾向”。

传统上,在推理阶段通常只启用第一个小组,其余小组处于闲置状态。GroupEnsemble的创新之处在于,它同时激活所有这些经过训练的小组,让它们对同一输入图像进行并行且独立的检测,从而在一次前向传播中,一次性生成多份差异化的“检测报告”。

为了确保各小组的独立性,研究者设计了一种注意力掩码机制,相当于在模型的“联合办公区”为每个小组设立了隔离间,防止它们在推理过程中相互“沟通”或达成共识。如此,仅需单次计算,就能获得多样化的输出,从根本上避免了重复计算带来的开销。

四、从多元结果中量化不确定性

获得了多份检测报告后,如何将其转化为可量化的“不确定性”信息?GroupEnsemble通过两步策略实现这一目标。

第一步是聚类匹配。 系统采用聚类算法,将所有指向同一真实物体的检测框归为一组。判断依据是它们之间的空间重叠度以及预测的物体类别是否一致。这就好比将多位侦探关于“同一辆红色轿车”的所有观察记录整理到同一个案件卷宗里。

第二步是信息聚合与不确定性提取。 这是生成不确定性度量的关键。对于“语义不确定性”(即“这是否是目标物体”),系统会统计有多少个小组报告了该物体。如果仅有少数小组支持,而多数小组将其判定为背景,那么该检测结果的置信度就会被相应调低,它很可能是一个误报。

对于“空间不确定性”(即“物体的精确位置与范围”),系统则分析同一卷宗内所有检测框的位置坐标和尺寸差异。差异越大,表明各小组对物体边界的判断分歧越大,空间不确定性就越高。最终,系统会输出一个经过加权平均的边界框,并利用计算出的统计方差来量化这种位置不确定性。

五、实验验证:展现全面领先的性能

研究团队在多个权威标准数据集上验证了该方法的有效性,结果表现卓越。

在Cityscapes(城市街景)数据集上,GroupEnsemble本身的不确定性估计质量已与MC-Dropout方法相当。而当两者结合形成“MC-GroupEnsemble”时,其“概率检测质量”得分达到21.4,是原始确定性基准系统(得分9.4)的两倍以上。更为难得的是,它在提供高质量不确定性估计的同时,平均检测精度(mAP)还从37.8%提升到了39.2%。

效率优势尤为显著。 深度集成方法需要运行5个完整模型,参数量增加107%,推理延迟高达53.4毫秒。而GroupEnsemble仅增加0.7%的参数量,推理延迟为18.4毫秒,比前者快约66%,在精度提升与计算效率之间取得了绝佳平衡。

在模拟雾天环境的Foggy Cityscapes数据集上,MC-GroupEnsemble同样表现出强大的鲁棒性,其不确定性估计质量显著优于其他对比方法。在通用的COCO大规模目标检测数据集上,其性能与深度集成方法持平,但计算成本低得多,证明了该方法具有广泛的适用性。

六、技术设计背后的深度考量

为何这些设计能够行之有效?消融实验给出了清晰的解释。

查询小组的数量并非无限增加就好,但适度增加小组数量确实能提升不确定性估计的质量,因为引入了更多元化的观察视角。得益于Transformer架构天然的并行处理能力,增加小组数量对推理延迟的影响,远小于串行运行多个独立模型。

在如何汇总各小组的“信心”分数上,研究者比较了多种策略。简单的平均池化会使系统整体趋向保守,而直接取最大值又会使其过于自信。最终采用的“加权最大值”策略,通过综合考虑支持某一检测结果的小组数量来动态调整最终置信度,在检测准确性与概率校准度之间找到了最优平衡点。

七、这项研究的核心价值与关注点

GroupEnsemble的核心优势,在于它巧妙地利用了DETR架构内生的并行处理潜力,将不确定性估计的额外成本降至最低。它不再需要以“时间换质量”或“内存换质量”,而是通过一次高效推理,同步获得多样化的检测结果。

此外,该方法展现出优异的“概率校准”特性。这意味着,当系统声称“我有90%的把握”时,其实际准确率也大约在90%左右。这种“言行一致”的可信度,对于构建安全可靠、值得信赖的人工智能系统至关重要。

在灵活性方面,由于Group DETR本质上是一种训练策略,GroupEnsemble可以较为便捷地集成到其他DETR变体模型之上,具备了良好的可扩展性与迁移潜力。

八、从实验室研究驶向实际应用

这项研究的现实意义与应用前景十分明确。对于自动驾驶而言,能够量化感知不确定性,意味着系统可以在雾、雨、雪、逆光等恶劣或边缘场景下,主动采取更保守、安全的策略,例如主动降速、增大跟车距离或及时请求人类驾驶员接管,而非盲目自信地继续行驶。

其低内存占用和高效推理的特性,使其非常适合部署在资源受限的车载嵌入式计算平台上。这不仅是实验室中漂亮的学术指标,更是技术得以工程化落地的重要前提。

当然,其应用领域远不止于自动驾驶。在医疗影像分析、工业视觉质检、安防监控预警等任何对错误容忍度极低的视觉感知任务中,一个能够坦言“我不太确定”的AI系统,都可以作为一道关键的安全冗余,在信心不足时触发人工复核流程,从而避免因错误决策导致的严重后果。

从更广阔的视野看,这项研究为Transformer时代的高效不确定性估计开辟了新的思路。它启示我们,让AI变得更“智能”,有时不仅仅是追求更高的绝对准确率,更是要赋予它“自知之明”的谦逊品质与审慎判断的能力。

Q&A

Q1:GroupEnsemble究竟是什么?

A:它是梅赛德斯-奔驰与顶尖高校联合研发的一种面向AI目标检测的不确定性估计方法。其核心是让检测系统在识别物体时,不仅能输出“是什么”和“在哪里”,还能评估并量化“我对这个位置判断的把握有多大”,从而显著提升系统在安全关键场景下的决策可靠性与透明度。

Q2:GroupEnsemble相比现有方法最大的优点是什么?

A:核心优势是高效性与低开销。它无需像蒙特卡洛Dropout那样多次重复运行模型,也无需像深度集成那样存储和运行多个完整模型。仅通过单次前向传播,就能获得高质量的不确定性估计,在推理速度上比深度集成方法快约66%,额外参数增量微乎其微(仅0.7%),真正实现了高性能与高效率的兼得。

Q3:这项技术何时能用在真正的自动驾驶汽车上?

A:该技术已在学术层面通过了严格的实验验证,充分证明了其可行性与优越性。从实验室原型到集成至量产车载系统,通常还需经历深入的工程化开发、符合车规级的严格测试以及复杂的安全认证流程。考虑到研发主导方是梅赛德斯-奔驰,这项前沿技术有望在未来几年的高级别自动驾驶(L3及以上)研发中得到应用,逐步使车辆在面对复杂和不确定环境时,表现得更加谨慎、可靠与智能。

来源:https://www.techwalker.com/2026/0316/3181274.shtml
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

奔驰团队如何让自动驾驶汽车识别不确定路况并安全行驶
AI
奔驰团队如何让自动驾驶汽车识别不确定路况并安全行驶

在斯图加特的梅赛德斯-奔驰研究中心,科学家们正致力于攻克一项关乎自动驾驶安全的核心挑战:如何赋予人工智能“自知之明”,使其能够主动表达“我不确定”。这项由梅赛德斯-奔驰携手斯图加特大学、纽伦堡-埃尔兰根大学共同推进的前沿研究,为提升自动驾驶系统的谨慎性与可靠性开辟了创新的技术路径。 设想一下,在浓雾

热心网友
05.14
自动驾驶强化学习面临的技术难题与应对策略
业界动态
自动驾驶强化学习面临的技术难题与应对策略

在探讨自动驾驶技术的未来时,强化学习作为其核心驱动力,展现了巨大的潜力。它使机器能够通过与环境交互、不断试错来优化驾驶决策,这一前景令人振奋。然而,从实验室研究走向真实道路部署,强化学习在自动驾驶中的应用仍面临技术、数据、安全与法规等多维度的严峻挑战,这些是产业落地前必须攻克的关键难题。 一、技术挑

热心网友
05.14
自动驾驶卡车大规模落地条件成熟 Aurora CEO深度解析
AI
自动驾驶卡车大规模落地条件成熟 Aurora CEO深度解析

“自动驾驶即将到来”——这句预言已在科技界回响了十余年。从DARPA挑战赛的沙尘试验场,到今天无人驾驶卡车悄然驶上达拉斯至休斯顿的货运干线,技术的商业化进程正悄然加速。作为这一历程的核心参与者,Aurora联合创始人兼首席执行官克里斯·厄姆森亲历了技术从原型走向营收的关键转折。去年四月,该公司正式开

热心网友
05.13
英伟达自动驾驶技术分层推进 开放生态加速L4级落地
AI
英伟达自动驾驶技术分层推进 开放生态加速L4级落地

2026年北京国际汽车展览会期间,搜狐汽车重磅打造的“王牌对话”系列直播,深度访谈了数十位国内外领先车企的核心决策者。从百年豪华品牌到新兴科技巨头,从传统制造工艺到智能驾驶前沿,这场高规格的思想交锋,如同一面多棱镜,全方位折射出中国汽车产业智能化、电动化转型的深层脉动,也为行业下一阶段的战略布局提供

热心网友
05.13
吉利智驾自研之路从Mobileye到亿咖通
业界动态
吉利智驾自研之路从Mobileye到亿咖通

2024年12月21日,亿咖通科技董事长兼CEO沈子瑜在美国纳斯达克敲响了开市钟,他将这一刻称为“整个亿咖通科技团队的荣誉时刻”。 这家曾被寄予厚望的吉利系智能化先锋,在投入巨大资源、经历两次上市申请后,终于成功登陆资本市场。然而,在这个高光时刻,亿咖通在智能驾驶业务上的探索与身影,却显得格外曲折与

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

马中新能源论坛探讨产业合作与人才培养新路径
科技数码
马中新能源论坛探讨产业合作与人才培养新路径

5月12日,马来西亚吉隆坡成功举办了一场具有前瞻性的行业盛会——中国-马来西亚电动汽车、电池技术与新能源人才创新发展论坛。来自两国政府部门、领军企业、顶尖高校及国际组织的代表共聚一堂,深入交流了在未来产业协同、清洁能源技术创新及高端人才培养等核心领域的合作路径与机遇。 马来西亚第一副总理兼乡村及区域

热心网友
05.14
智元APC香港观察:具身智能如何成为先进生产力单元
科技数码
智元APC香港观察:具身智能如何成为先进生产力单元

具身智能要迈过的第一道硬门槛,从来都是量产。 过去几年,全球人形机器人行业反复印证了这一点:舞台演示可以很快,工程验证可以很快,视频传播也可以很快。但当一台机器人要从实验室走向产线,再走向客户现场,问题的复杂度会呈指数级上升。 特斯拉的Optimus就是一个典型的参照系。马斯克多次表达过对Optim

热心网友
05.14
AI回答第一个字就暴露真假?识别AI胡说八道的关键信号
科技数码
AI回答第一个字就暴露真假?识别AI胡说八道的关键信号

向朋友问路时,如果对方清楚路线,通常会立刻回答“直走然后左转”。但如果对方并不确定,往往会先停顿一下,犹豫地说“呃……好像是……往那边?”。这个开口前的短暂迟疑,往往比最终给出的答案更能说明问题——对方是否真的知道答案。 近期,美国天普大学计算机与信息科学系的一项研究,正是捕捉到了AI回答问题时类似

热心网友
05.14
浙江大学万能分割学习器技术原理与应用场景详解
科技数码
浙江大学万能分割学习器技术原理与应用场景详解

这项由浙江大学、华南理工大学、南京大学和北京大学联合开展的前沿研究,于2026年4月正式发布,其论文预印本编号为arXiv:2604 24575。 图像分割技术听起来或许有些专业,但它早已深度融入我们的日常生活。无论是智能手机拍摄的背景虚化人像、AI系统在CT影像中精准勾勒病灶轮廓,还是自动驾驶汽车

热心网友
05.14
比亚迪大汉纯电续航1000公里对标56E车型参数曝光
科技数码
比亚迪大汉纯电续航1000公里对标56E车型参数曝光

“大唐”预售热潮尚未平息,“大汉”已蓄势待发,比亚迪王朝系列正以前所未有的攻势,叩响高端市场的大门。 在北京车展引发轰动的比亚迪大唐,预售订单已迅速突破10万台大关,彰显了市场对比亚迪高端产品的强烈期待。而最新信息显示,汉家族即将迎来一位重磅新成员——“大汉”,这款定位D级旗舰的轿车,目标直指20-

热心网友
05.14