首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
小米汽车发布世界模型新框架,多项基准测试实现SOTA性能

小米汽车发布世界模型新框架,多项基准测试实现SOTA性能

热心网友
82
转载
2026-05-26

今日,小米汽车正式推出名为Xiaomi Auto World Model的全新框架,为自动驾驶领域的世界模型技术演进开辟了创新路径。此举标志着行业技术正从初级的“环境感知”阶段,向具备“认知推理与场景演化”能力的高阶形态深度迈进。

小米汽车发布世界模型全新框架,主流基准测试全面SOTA

简而言之,该框架的核心创新在于,它首次实现了三维场景重建与动态视频生成技术的深度融合,构建了一个统一的计算架构。其设计哲学可总结为“以重建锚定几何基础,用生成拓展场景想象”。这一全新范式,突破了业界长期以来将重建与生成视为两条平行技术路线的传统思维。

在实际性能表现上,该框架已在Waymo、nuScenes等国际主流自动驾驶基准测试中,全面取得了SOTA(State-of-the-Art,即当前最优)评级。尤为关键的是,该技术已超越纯理论研究阶段,成功落地于小米汽车的核心业务环节,包括合成数据生产、仿真验证平台以及智能座舱系统,实现了从技术研发到产业应用的全链路贯通。

▲ Xiaomi Auto World Model 核心技术效果演示

要深入理解这一框架的价值,需先厘清当前自动驾驶世界模型的两大主流技术方向:基于重建的方法(WorldRec)与基于生成的方法(WorldGen)。

重建路线的核心优势在于“精准还原”。它通过多视角传感器数据恢复出几何结构精确的三维场景,具有极高的保真度与时空一致性。然而,其局限性在于仅能复现已观测到的内容,缺乏对未知区域或未来可能发生的场景进行预测与“构想”的能力。

生成路线的特长则在于“场景推演”。借助扩散模型等先进算法,它能够直接预测未来帧序列,并生成未曾观测到的视角或全新场景。但其挑战在于缺乏显式的三维结构约束,在长时间序的推演过程中,容易出现画面失真、结构漂移等问题,如同想象缺乏锚点而易偏离现实。

那么,是否存在一种方案,能够融合二者之长,并规避其各自短板?Xiaomi Auto World Model 给出的解决方案正是“深度耦合一体化”。

该框架使重建模块与生成模块在架构层面相互制约、协同演进。重建模块产出精确的三维几何结构,作为整个系统的“空间锚点”,为生成过程提供稳定的物理约束;生成模块则将其预测能力拓展至观测边界之外,弥补了重建技术在想象力层面的不足。二者形成协同增强的闭环,最终在三个关键维度上实现了超越简单叠加的融合效应:

卓越的时序稳定性:重建提供的确定性几何约束,有效抑制了在长序列自回归推演中常见的误差累积与内容漂移现象。

高度的全局一致性:通过4D场景表征作为跨时间帧共享的“场景记忆”,确保了不同时刻、不同视角下的生成内容在全局语义与结构上保持连贯统一。

逼真的场景真实性:生成模块以重建渲染出的图像作为“几何骨架”,使得合成内容既符合真实世界的物理布局,又逼近真实传感器的成像特性,从而显著缩小了“虚拟仿真”与“现实世界”之间的领域差距。

▲ WorldGen 技术在极端驾驶场景下的生成效果

技术的终极价值在于落地应用。目前,Xiaomi Auto World Model 已在小米汽车的三大核心业务场景中实现规模化部署:

高质量合成数据生成:已累计产出超过10万段高保真合成数据,直接用于训练车辆感知模型。这显著提升了自动驾驶系统在面对危险、长尾等罕见场景时的识别鲁棒性与决策安全性。

高精度闭环仿真测试:基于该框架构建的仿真环境,不仅大幅提升了测试效率与规范覆盖度,更能精准复现真实世界中的复杂事故场景,从而实现对特定算法的定向强化与优化验证。

沉浸式辅助驾驶教学:利用世界模型的动态场景生成能力,可创建第一人称视角的交互式教学视频。当用户遭遇复杂路况时,系统能够以生成式视频直观演示安全、规范的操作流程。目前,该功能以“实景模拟场景”模块的形式,已全面集成于小米全系车型的智能辅助驾驶学堂之中。

来源:https://www.163.com/dy/article/KTRQ5AC60511B8LM.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

小米汽车发布世界模型新框架,多项基准测试实现SOTA性能
科技数码
小米汽车发布世界模型新框架,多项基准测试实现SOTA性能

今日,小米汽车正式推出名为Xiaomi Auto World Model的全新框架,为自动驾驶领域的世界模型技术演进开辟了创新路径。此举标志着行业技术正从初级的“环境感知”阶段,向具备“认知推理与场景演化”能力的高阶形态深度迈进。 简而言之,该框架的核心创新在于,它首次实现了三维场景重建与动态视频生

热心网友
05.26
小米汽车世界模型框架实现重建生成一体化 主流基准测试表现全面领先
AI资讯
小米汽车世界模型框架实现重建生成一体化 主流基准测试表现全面领先

小米汽车发布全新世界模型框架,将三维重建与视频生成深度耦合,解决了几何保真与内容多样性的矛盾。该一体化设计使两者协同增益,在Waymo等基准测试中全面领先。它应用于合成数据生成、仿真测试与智能座舱,能高效预测环境演化,提升辅助驾驶系统对极端场景的应对能力。

热心网友
05.26
三星DAM-VLA机器人动态操控技术实现手臂夹爪解耦新突破
业界动态
三星DAM-VLA机器人动态操控技术实现手臂夹爪解耦新突破

一、背景 当前,视觉-语言-动作模型已成为推动机器人智能发展的核心架构。然而,主流方案如OpenVLA、π0、CogACT普遍存在一个设计局限:它们依赖单一动作模型处理所有任务。这种“通用型”设计在面对真实世界的复杂机器人操控时,其内在矛盾日益凸显。 问题的核心在于机器人任务本身的二元特性。机器人动

热心网友
05.22
百度ERNIE‑Image开源8B参数模型,消费级显卡实现顶级文生图效果
AI资讯
百度ERNIE‑Image开源8B参数模型,消费级显卡实现顶级文生图效果

近期,AI文生图领域迎来重要突破:百度文心大模型正式发布并开源了ERNIE‑Image文生图模型。该模型以约80亿参数的轻量级规模,在多项国际权威评测中达到SOTA(当前最优水平),其参数量显著低于行业主流模型。 更值得关注的是,ERNIE‑Image仅需24GB显存的消费级显卡即可流畅运行。这标志

热心网友
05.18
GLM-5.1 获全球开源模型最佳性能 全新基准权威发布
科技数码
GLM-5.1 获全球开源模型最佳性能 全新基准权威发布

5月12日,全球权威AI评测机构Artificial Analysis正式推出了一项创新的基准测试——Coding Agent Index(编程智能体指数)。这项测试的独特之处在于,它不再孤立地评估大模型的“理论”编码能力,而是聚焦于更贴近实际开发的场景:系统性地衡量“Agent harnesses

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

卫星物联网SGP32标准如何重塑全球连接控制权
业界动态
卫星物联网SGP32标准如何重塑全球连接控制权

近期,全球物联网领域接连出现三则重要动态。它们看似独立,实则紧密关联,共同勾勒出下一代物联网发展的核心脉络。 五月初,工信部正式批复国电高科开展为期两年的卫星物联网业务商用试验。这是国内首个卫星物联网商用许可,标志着天启星座将正式为海洋渔业、能源水利、交通运输、物流追踪等广泛场景提供商业化的卫星连接

热心网友
05.26
现货黄金价格突破4710美元 创历史新高 投资机遇分析
web3.0
现货黄金价格突破4710美元 创历史新高 投资机遇分析

现货黄金价格突破每盎司4710美元,创下历史新高。市场分析认为,地缘政治紧张与经济不确定性是主要推动因素。投资者避险需求显著增加,同时市场对美联储降息预期升温也支撑了金价。未来走势需密切关注全球宏观经济数据与主要央行政策动向。

热心网友
05.26
顽石旧梦真实使用感受分享 老铁们快来听听体验
游戏攻略
顽石旧梦真实使用感受分享 老铁们快来听听体验

《原神》新角色“顽石旧梦”实装后,其实战表现引发玩家关注。一位资深玩家通过实测分享了使用体验,具体分析了该角色的技能效果、输出能力及团队适配性,为其他玩家提供了参考依据。

热心网友
05.26
横版PPT转竖版技巧:高效优化手机与竖屏展示效果
AI教程
横版PPT转竖版技巧:高效优化手机与竖屏展示效果

横版PPT转换为竖版可优化手机浏览等场景的展示效果。主要方法包括:直接调整页面设置中的幻灯片方向;使用竖版模板重新编排内容以保持设计美观;或通过打印设置更改页面方向以满足纸质或PDF输出需求。具体方法需根据内容排版复杂度与最终用途选择。

热心网友
05.26
AI赋能高中篮球联赛 DuMate实现赛事全链路覆盖
业界动态
AI赋能高中篮球联赛 DuMate实现赛事全链路覆盖

2025-2026耐克中国高中篮球联赛全国总决赛中,百度AI伙伴DuMate深度融入赛事全流程。赛前提供数据分析和战术建议;赛中通过智能直播系统捕捉精彩瞬间,支持实时剪辑与分享;赛后为球员生成专属纪念海报。该AI方案不仅提升了赛事体验与效率,其技术能力也正拓展至更广泛的智能应用领域。

热心网友
05.26