首页 游戏 软件 资讯 排行榜 专题
首页
AI
小米自动驾驶模型Xiaomi OneVL开源,率先统一VLA与多技术路线

小米自动驾驶模型Xiaomi OneVL开源,率先统一VLA与多技术路线

热心网友
43
转载
2026-05-14

自动驾驶技术路线融合迎来重要突破。小米技术团队近日开源了名为Xiaomi OneVL的创新框架,官方定义为“一步式潜空间语言视觉推理框架”。该框架的核心价值在于,首次将VLA(视觉语言动作模型)与世界模型这两大主流技术路径进行了有效统一,为行业提供了全新的解决方案。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这一突破具有里程碑意义。传统自动驾驶模型中,VLA模型主要负责环境感知与即时决策,例如识别道路状况并输出转向、加减速等指令。而世界模型则专注于未来场景的预测,模拟车辆动作可能引发的环境变化。两者长期独立发展,协同困难。Xiaomi OneVL通过创新的“潜空间推理”技术,实现了感知、决策与预测的端到端整合。这意味着系统能够在生成驾驶指令的同时,同步推演该指令将导致的未来数秒内的场景演变,实现了决策与预判的有机统一。

小米开源Xiaomi OneVL自动驾驶模型,业内率先实现VLA、世界模型等多技术路线统一

在性能表现上,Xiaomi OneVL展现了卓越的实力。在涵盖感知、推理与规划的多项权威基准测试中,包括ROADWork、Impromptu和Alpamayo-R1,该框架均达到了当前最优(SOTA)水平。在NA VSIM基准测试中也取得了优异表现。尤为关键的是,其精度超越了依赖显式思维链(CoT)的模型,而在推理速度上则可与高效的“潜空间CoT”方案媲美,真正实现了精度与效率的平衡。

小米开源Xiaomi OneVL自动驾驶模型,业内率先实现VLA、世界模型等多技术路线统一

▲ 在 ROADWork、Impromptu、Alpamayo-R1 三项基准上均达到 SOTA,在 NA VSIM 上取得优越性能

除了强大的性能,该框架在可解释性方面也取得了显著进展。针对自动驾驶模型常被视为“黑箱”的痛点,Xiaomi OneVL提供了双维度的决策解释能力。它既能以自然语言形式阐述决策逻辑(如“因检测到前方行人而减速”),也能生成可视化的未来场景预测图。这种语言与视觉相结合的可解释性输出,极大增强了模型的透明度与调试便利性,有助于建立人机信任。

小米开源Xiaomi OneVL自动驾驶模型,业内率先实现VLA、世界模型等多技术路线统一

▲ 为模型决策提供语言以及视觉的可解释性

目前,该项目的全部代码与模型权重已在GitHub等平台开源。对于自动驾驶算法研究员、工程师及广大开发者而言,这提供了一个极具价值的研究工具与设计新思路。技术路线的有效统一预示着系统复杂度的降低与开发效率的提升。Xiaomi OneVL的成功实践,有望为下一代自动驾驶系统的算法演进开辟新的方向。

来源:https://tech.ifeng.com/c/8t62y2uaS93
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

小米自动驾驶OneVL模型开源:统一视觉语言与预测世界模型
业界动态
小米自动驾驶OneVL模型开源:统一视觉语言与预测世界模型

小米开源自动驾驶模型XiaomiOneVL,首次将视觉语言动作模型与世界模型统一于潜空间推理框架。该模型在多项基准测试中取得最优性能,推理延迟降至传统方法的5 4%,支持车端实时部署。同时提供自然语言决策解释与视觉预测,提升可解释性。这一技术整合为行业探索下一代自动驾驶范式提供了新路。

热心网友
05.14
小米开源自动驾驶模型OneVL:技术架构与开源价值解析
科技数码
小米开源自动驾驶模型OneVL:技术架构与开源价值解析

小米开源了自动驾驶模型XiaomiOneVL,该框架首次将视觉语言模型与世界模型统一,显著提升了推理速度与精度。它在多项基准测试中刷新了性能纪录,并为决策过程提供了语言和视觉双维度的可解释性,既能解释驾驶决策,也能预测未来场景。

热心网友
05.13
小米Life自动折叠晴雨伞米色款上市 适配小米汽车储物格售价149元
业界动态
小米Life自动折叠晴雨伞米色款上市 适配小米汽车储物格售价149元

5月11日,小米生态链品牌Xiaomi Life正式发布了一款新品——自动折叠晴雨伞。这款雨伞提供经典的米色与黑色两种配色,官方售价为149元。其设计的一大亮点在于尺寸经过精准优化,能够完美放入小米汽车全系车型的前排门板储物格,以及小米SU7的后排座椅下方储物空间,为小米车主提供了便捷、贴心的专属收

热心网友
05.12
小米自研AI大模型MiMo登顶全球性能榜首
业界动态
小米自研AI大模型MiMo登顶全球性能榜首

5月12日,小米技术团队公布了一项重要进展:其开源的Hermes Agent智能体框架在OpenRouter全球平台调用量排行榜中位列第一。最新统计显示,该框架的日Token调用量高达2910亿,周调用量更是突破1 75万亿,展现出强劲的增长势头。 这一卓越表现离不开小米自研的MiMo大模型的核心驱

热心网友
05.12
小米澎湃 OS 最新优化更新Xiaomi 17 Pro Max 相册体验已修复
科技数码
小米澎湃 OS 最新优化更新Xiaomi 17 Pro Max 相册体验已修复

小米澎湃OS系统优化进展更新:多项用户体验问题获修复 关注小米系统更新的朋友们可能注意到了,本周小米社区发布了一份关于澎湃 HyperOS 3 的最新优化进展。其中提到,用户反馈的 Xiaomi 17 Pro Max 在特定版本下遇到的原照片下载失败、选择照片闪退等问题,目前已经得到优化。这对于正在

热心网友
05.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

深度学习与生成式AI为人工智能工程师带来新机遇
AI
深度学习与生成式AI为人工智能工程师带来新机遇

短期课程 开发人员的ChatGPT提示工程 你将在本课程中学到什么 想用大型语言模型(LLM)快速构建强大的应用吗?《开发人员的ChatGPT提示工程》这门课,正是为你准备的。通过OpenAI API,你将能解锁那些在过去成本高昂、技术门槛高甚至无法实现的能力,快速将创新想法转化为价值。 这门短期课

热心网友
05.14
AI绘画工具志设:在线生成图片的智能平台
AI
AI绘画工具志设:在线生成图片的智能平台

志设是什么 在创意设计领域,灵感与效率往往难以平衡。是否存在一个工具,既能深度理解您的创意构思,又能迅速将其转化为高品质视觉作品?这正是专业级AI图像生成平台“志设”致力于解决的核心问题。 简而言之,志设是一个融合了前沿人工智能技术的综合性设计解决方案平台。它全面覆盖从平面广告、海报设计到网页UI、

热心网友
05.14
AI口语练习软件TalkMe帮你克服社交恐惧
AI
AI口语练习软件TalkMe帮你克服社交恐惧

对于渴望提升外语口语与听力水平的学习者而言,如何找到一个高效、便捷且能轻松练习的环境,常常是首要难题。今天我们要深入解析的这款产品——TalkMe,正是精准切入这一需求,试图通过前沿的AI技术,提供一种全新的语言练习解决方案。 简而言之,TalkMe是一款专注于跨语言学习的AI应用,其核心功能设计紧

热心网友
05.14
王牌机甲现代战争手游上班挂机下班称霸全攻略
游戏资讯
王牌机甲现代战争手游上班挂机下班称霸全攻略

当冰冷的钢铁巨兽被注入炽热的战斗意志,会碰撞出怎样的战略火花?《王牌机甲》这款游戏,将宏大的科幻叙事深度融入现代战争战术框架,为玩家开启了一段关于征服、策略与深厚羁绊的未来纪元。 在这里,你绝非孤军奋战。每一位通过招募加入的精英机师,都拥有独立的背景故事、专属技能树与独特的成长路线。游戏核心的“羁绊

热心网友
05.14
暗黑大天使技能分支系统解析 从基础技能树到高阶分支指南
游戏资讯
暗黑大天使技能分支系统解析 从基础技能树到高阶分支指南

《暗黑大天使》的技能分支系统提供元素、物理和辅助三大专精方向,玩家需根据角色属性与战斗需求选择分支。技能可投入资源升级并可能触发连锁效果,实战中需结合装备、敌人及团队配合灵活运用。该系统丰富了玩法,但需大量资源与多系统联动,选择需谨慎规划。

热心网友
05.14