游乐游手机版
首页/业界动态/文章详情

小米自动驾驶OneVL模型开源:统一视觉语言与预测世界模型

时间:2026-05-14 07:22
小米开源自动驾驶模型XiaomiOneVL,首次将视觉语言动作模型与世界模型统一于潜空间推理框架。该模型在多项基准测试中取得最优性能,推理延迟降至传统方法的5 4%,支持车端实时部署。同时提供自然语言决策解释与视觉预测,提升可解释性。这一技术整合为行业探索下一代自动驾驶范式提供了新路。

5月13日,小米在自动驾驶技术领域取得重要突破,正式发布并开源了其创新的多模态大模型——Xiaomi OneVL。此次发布并非简单的版本迭代,而是标志着小米在技术架构上实现了一次关键的“范式融合”,旨在以更统一的框架解决自动驾驶的核心认知难题。

那么,Xiaomi OneVL究竟解决了什么问题?它直面自动驾驶系统开发中的一个核心挑战:如何让AI模型同时具备精准的实时环境理解能力与可靠的未来场景推演能力。传统方案通常采用分立架构:视觉语言动作模型负责即时感知与决策,类似于驾驶员的瞬间反应;而世界模型则专注于模拟物理规律,预测未来数秒内的环境变化,如同经验丰富的司机对路况的前瞻判断。两者功能互补,但在架构与数据流转上往往存在隔阂。

Xiaomi OneVL的创新思路在于,尝试将这两条技术路线融合到一个统一的框架内。其核心技术答案是“潜空间推理”。通过这项前沿技术,模型能够将高维、复杂的动态驾驶场景信息进行高效压缩与表征,在一个统一的潜空间内同步完成环境感知、逻辑推理与轨迹规划。这意味着,信息处理流程得以简化,减少了模块间冗余的数据转换与传递,从而在理论上显著提升了系统整体的决策效率与协同性能。

小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

这一统一框架的实际效能如何?多项权威基准测试数据提供了有力佐证。在覆盖感知、推理与规划的综合性评测中,Xiaomi OneVL展现了卓越的性能。

小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

公开数据显示,该模型在ROADWork、Impromptu、Alpamayo-R1等多个国际主流自动驾驶基准测试中,均取得了当前最优的性能评级。尤其在NA VSIM基准上,其PDM-score达到了88.84的高分。这一成绩颇具里程碑意义——它首次证明了基于潜空间推理的隐式方法,在关键指标上能够超越需要逐步显式推理的思维链方法。可以说,Xiaomi OneVL是目前首个在全部测试集上全面领先于传统自回归CoT方法的隐式推理模型。

对于追求实时性的车载部署而言,推理速度与精度同等重要。技术报告指出,通过采用MLP回归头变体进行优化,模型单次推理延迟可降低至0.24秒,对应高达4.16 Hz的推理频率。这一延迟水平仅为传统VLA自回归推理耗时的5.4%。如此大幅度的延迟优化,为在量产车规级芯片上实现高性能、低延时的实时自动驾驶决策扫清了关键障碍。相关的消融实验也进一步验证,对物理世界动态进行有效的压缩表征,是带来性能显著提升的关键因素。

当然,一个可靠的自动驾驶系统不仅需要强大的性能,其决策过程还必须具备可解释性与可信度。Xiaomi OneVL在此方面提供了双重保障机制:它既能通过自然语言生成清晰的决策依据,例如解释“为何在此刻选择变道或减速”;也能输出直观的未来场景视觉预测,展示模型对“接下来几秒交通环境可能如何演变”的推演结果。这种“语言解释”与“视觉推演”相结合的能力,极大地增强了模型行为的透明度,有助于研发人员深度调试并提升用户对AI驾驶的信任感。

小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

总体而言,Xiaomi OneVL的开源,其价值远不止于发布一个高性能模型。它更重要的意义在于,为行业探索下一代自动驾驶感知决策架构提供了一个重要的技术样本与整合路径。将VLA与世界模型统一于潜空间推理框架之下,这一技术方向能否成为未来主流,仍需经过大规模实际场景的验证与迭代。但毫无疑问,小米的此次开源为全球自动驾驶社区带来了一个极具探讨价值与启发性的新思路。

来源:https://m.mydrivers.com/newsview/1122061.html
上一篇市场监管总局严查算法违规行为维护公平竞争市场秩序 下一篇李连杰回应甲亢病情 面容变化与眼球突出原因
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿