首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
小米开源VLA大模型:刷新多领域SOTA性能新纪录

小米开源VLA大模型:刷新多领域SOTA性能新纪录

热心网友
82
转载
2026-02-12

2月12日消息,小米正式发布并开源了首款机器人VLA大模型——Xiaomi Robotics 0。

这款模型拥有47亿参数,其核心解决了传统VLA模型推理延迟、真机动作不连贯等行业痛点,兼具视觉语言理解与高性能实时执行能力,可在消费级显卡上实现实时推理,在仿真测试和真机任务中均刷新了多项SOTA成绩。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

Xiaomi Robotics 0采用混合Transformer架构,通过“视觉语言大脑+动作执行小脑”的组合,实现了感知、决策、执行的高效闭环,兼顾通用理解与精细动作控制。

视觉语言大脑:以多模态VLA大模型为底座,能精准理解人类模糊自然指令,同时捕捉高清视觉输入中的空间关系,是模型的“决策核心”;

动作执行小脑:嵌入多层Diffusion Transformer,不直接输出单一动作,而是生成高频、平滑的“动作块”,并通过流匹配技术保障动作精准度,让机器人动作更具物理灵活性。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

为避免模型学动作丢失基础理解能力,小米设计了跨模态预训练+后训练的两阶段训练方法,让模型既懂常识又精通体力活。

跨模态预训练:先通过多模态与动作数据混合训练,引入Action Proposal机制让VLM的特征空间与动作空间对齐;再冻结VLM专注训练DiT,使其从噪声中恢复精准动作序列,保障动作的平滑性;

后训练:这是解锁物理智能的核心,采用异步推理模式从机制上解决真机“动作断层”问题;同时引入Clean Action Prefix保障动作轨迹时间连续性,通过λ-shape Attention Mask让模型聚焦当前视觉反馈、摆脱历史惯性,大幅提升机器人对环境突发变化的响应能力。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

实测该模型在多维度测试中均展现出行业领先水平,实现“仿真通、真机强、多模态能力不丢失”的突破。

仿真测试:在LIBERO、CALVIN、SimplerEnv三大主流仿真测试的所有Benchmark中,对比30种现有模型均取得当前最优结果;

真机任务:在双臂机器人平台部署后,面对积木拆解、叠毛巾等长周期、高难度任务,展现出极高的手眼协调性,能灵活处理刚性积木和柔性织物等不同材质物体;

多模态能力:保留了VLM本身的物体检测、视觉问答、逻辑推理等能力,在具身相关基准测试中表现优异,弥补了传统VLA模型重动作、轻理解的短板。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

小米发布并开源首代机器VLA大模型!刷新多项SOTA

小米已将Xiaomi Robotics 0的技术主页、开源代码、模型权重全量开放,相关资源可在GitHub、Hugging Face等平台获取,为全球具身智能领域的开发者和研究机构免费提供技术支持。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

来源:https://m.mydrivers.com/newsview/1103905.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

2026年客服机器人系统选型指南与主流Agent推荐
业界动态
2026年客服机器人系统选型指南与主流Agent推荐

如今,很多企业都面临一个共同的挑战:既想通过数字化提升客服效率,又担心因此失去服务的“人味儿”。数据显示,智能机器人的使用普及率已高达60%,但其中近一半的对话仍停留在表面,未能真正解决客户问题。加上千篇一律的回复话术,让不少企业的数字化投入仿佛打了水漂。 Gartner的一项调研揭示了一个更有趣的

热心网友
05.18
顺丰投资2亿美元布局机器人分拣技术将如何改变物流行业
AI
顺丰投资2亿美元布局机器人分拣技术将如何改变物流行业

2026年4月27日,具身智能赛道在同一天内迎来了两则重磅消息。星动纪元宣布完成超2亿美元新一轮融资,几乎同时,无界动力也官宣其天使轮累计融资额突破2亿美元。 其中,星动纪元的融资细节尤为引人注目。本轮融资由物流巨头顺丰集团领投,红杉中国、IDG资本等一线财务投资机构,以及科捷智能、东风产投等产业资

热心网友
05.18
追觅在北美发布三大智能清洁新品彰显中国智造实力
业界动态
追觅在北美发布三大智能清洁新品彰显中国智造实力

近日,追觅科技在美国硅谷隆重举办了Dreame NEXT 2026全球新品发布会,面向北美市场重磅推出其最新一代高端智能清洁产品矩阵。从室内清洁到庭院维护,追觅此次集中发布了扫地机器人、洗地机和智能割草机器人三大品类的旗舰新品,技术阵容强大,彰显了其开拓全球市场的决心。 (图源:雷科技) 智能割草机

热心网友
05.18
美团小黄蜂机器人落地重庆机场 外卖10分钟直达登机口
业界动态
美团小黄蜂机器人落地重庆机场 外卖10分钟直达登机口

4月29日,美团旗下“小黄蜂”室内外智能配送机器人正式进驻重庆江北国际机场T3航站楼,这一消息在科技与出行领域引发广泛关注。此次落地标志着该款机器人首次在西南地区大型航空枢纽实现运营,意味着智能配送服务正深度渗透至高流量、高标准的交通枢纽场景。 即日起,旅客在江北机场候机时将体验到全新升级的服务。通

热心网友
05.17
机器人外呼系统每月费用解析与报价指南
业界动态
机器人外呼系统每月费用解析与报价指南

机器人外呼系统一个月的费用究竟是多少?这是许多企业在考虑部署AI智能呼叫时,首要关注的核心问题。毫无疑问,将人工智能技术融入外呼体系,能够实现高效率的客户触达、智能化的呼叫管理,并快速覆盖更广泛的目标人群,其技术优势与商业价值十分显著。然而,面对市场上多样化的报价方案与计费模式,不少决策者难免感到困

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

燕云十六声天工地窟身如飞燕宝箱获取全攻略
游戏资讯
燕云十六声天工地窟身如飞燕宝箱获取全攻略

在《燕云十六声》的天工地窟中,“身如飞燕”宝箱的获取是一场对玩家综合探索能力的深度考验。想要成功开启它,不仅需要耐心与观察力,更需掌握系统性的探索策略。 掌握地窟地形与核心布局 进入天工地窟后,首要任务是进行全方位的地形勘察。建议玩家先熟悉主要通道、分支岔路以及所有可能被忽略的角落,建立完整的地图认

热心网友
05.18
2026年家装设计软件推荐:高人气实用工具精选指南
游戏资讯
2026年家装设计软件推荐:高人气实用工具精选指南

装修这件事,说多了都是泪。找施工队像开盲盒,预算表永远在“动态调整”,设计图看得眼花缭乱……投入大量时间和精力,最后的效果可能还是差强人意。说到底,信息不对称和过程不透明,是大多数装修烦恼的根源。 好在,如今有不少专业的数字化工具,能帮我们把控关键环节。今天就来聊聊五款定位清晰、实用性强的装修类应用

热心网友
05.18
燕云十六声山洞奇遇任务全流程攻略与解法详解
游戏资讯
燕云十六声山洞奇遇任务全流程攻略与解法详解

在《燕云十六声》的宏大江湖中,“不见山洞”无疑是一处引人入胜的秘境。这里不仅栖息着珍奇异兽、埋藏着稀世珍宝,更交织着无数待玩家发掘的隐秘故事与特殊事件。若想彻底揭开此地的所有秘密,掌握以下探索技巧至关重要。 进入不见山洞后,首要任务是保持专注,对环境进行细致勘察。洞内的景象暗藏玄机,绝非一目了然。一

热心网友
05.18
骷髅传奇神盾系统玩法详解与获取攻略
游戏资讯
骷髅传奇神盾系统玩法详解与获取攻略

在《骷髅传奇》中,神盾系统是决定角色战力的核心模块,远非一件普通装备可比。它更像是一位能够深度定制、伴随你征战四方的忠实伙伴。本文将为你全面解析神盾系统的获取、培养与实战运用,助你将其从基础配置打造为真正的战力引擎,在游戏中脱颖而出。 获取你的第一面神盾是旅程的起点。游戏内提供了多样化的获取途径:完

热心网友
05.18
和平精英孙悟空皮肤获取与实战技巧全解析
游戏资讯
和平精英孙悟空皮肤获取与实战技巧全解析

天成孙悟空这款限定皮肤,以其独特的视觉设计在战场上脱颖而出。它将中国古典神话中齐天大圣的经典形象,与游戏内的现代美学风格进行了深度结合。标志性的金色毛发、可化为武器的金箍棒特效,以及服饰上精致的云纹与神话元素,共同塑造了一个极具战场辨识度的英雄形象。这种高辨识度本身,在战术层面就具有独特价值——它能

热心网友
05.18