首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
小米开源VLA大模型:刷新多领域SOTA性能新纪录

小米开源VLA大模型:刷新多领域SOTA性能新纪录

热心网友
33
转载
2026-02-12

2月12日消息,小米正式发布并开源了首款机器人VLA大模型——Xiaomi Robotics 0。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这款模型拥有47亿参数,其核心解决了传统VLA模型推理延迟、真机动作不连贯等行业痛点,兼具视觉语言理解与高性能实时执行能力,可在消费级显卡上实现实时推理,在仿真测试和真机任务中均刷新了多项SOTA成绩。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

Xiaomi Robotics 0采用混合Transformer架构,通过“视觉语言大脑+动作执行小脑”的组合,实现了感知、决策、执行的高效闭环,兼顾通用理解与精细动作控制。

视觉语言大脑:以多模态VLA大模型为底座,能精准理解人类模糊自然指令,同时捕捉高清视觉输入中的空间关系,是模型的“决策核心”;

动作执行小脑:嵌入多层Diffusion Transformer,不直接输出单一动作,而是生成高频、平滑的“动作块”,并通过流匹配技术保障动作精准度,让机器人动作更具物理灵活性。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

为避免模型学动作丢失基础理解能力,小米设计了跨模态预训练+后训练的两阶段训练方法,让模型既懂常识又精通体力活。

跨模态预训练:先通过多模态与动作数据混合训练,引入Action Proposal机制让VLM的特征空间与动作空间对齐;再冻结VLM专注训练DiT,使其从噪声中恢复精准动作序列,保障动作的平滑性;

后训练:这是解锁物理智能的核心,采用异步推理模式从机制上解决真机“动作断层”问题;同时引入Clean Action Prefix保障动作轨迹时间连续性,通过λ-shape Attention Mask让模型聚焦当前视觉反馈、摆脱历史惯性,大幅提升机器人对环境突发变化的响应能力。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

实测该模型在多维度测试中均展现出行业领先水平,实现“仿真通、真机强、多模态能力不丢失”的突破。

仿真测试:在LIBERO、CALVIN、SimplerEnv三大主流仿真测试的所有Benchmark中,对比30种现有模型均取得当前最优结果;

真机任务:在双臂机器人平台部署后,面对积木拆解、叠毛巾等长周期、高难度任务,展现出极高的手眼协调性,能灵活处理刚性积木和柔性织物等不同材质物体;

多模态能力:保留了VLM本身的物体检测、视觉问答、逻辑推理等能力,在具身相关基准测试中表现优异,弥补了传统VLA模型重动作、轻理解的短板。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

小米发布并开源首代机器VLA大模型!刷新多项SOTA

小米已将Xiaomi Robotics 0的技术主页、开源代码、模型权重全量开放,相关资源可在GitHub、Hugging Face等平台获取,为全球具身智能领域的开发者和研究机构免费提供技术支持。

小米发布并开源首代机器VLA大模型!刷新多项SOTA

来源:https://m.mydrivers.com/newsview/1103905.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

美团投资28家独角兽,加速AI应用落地物理世界
科技数码
美团投资28家独角兽,加速AI应用落地物理世界

为新生AI企业提供真实可落地场景,成为大厂AI时代的核心竞争力。文|《中国企业家》记者邓双琳见习编辑|李原编辑|何伊凡图片来源|视觉中国最近,资本市场的注意力几乎都集中在宇树科技上——这家国内头部具

热心网友
03.28
VLA:世界模型的具身智能新范式,技术路径解析
科技数码
VLA:世界模型的具身智能新范式,技术路径解析

面对机器人不够聪明的现实窘况,不少创业公司开始押注世界模型这条技术路线。宇树科技创始人王兴兴在3月中旬的英伟达GTC大会上判断,在通往具身智能ChatGPT时刻的路径中,世界模型几乎“看不到天花板”

热心网友
03.28
宇树科技将于5月在沪开设亚洲首家具身智能体验馆
科技数码
宇树科技将于5月在沪开设亚洲首家具身智能体验馆

机器人要进军实体零售领域了!记者从2026全国精品首发季暨 “首发上海” 系列活动发布仪式上获悉,宇树科技(Unitree)即将在沪开设具身智能体验馆亚洲首店,进一步推动机器人科技走进城市生活场景。

热心网友
03.28
西门子肖松:AI进工厂,成败关键在数据与场景
科技数码
西门子肖松:AI进工厂,成败关键在数据与场景

“作为一项通用技术,电力的出现引发了新一轮工业革命,西门子自始便参与其中。而今,又一项通用技术降临。AI像当年的电力一样具有变革性,甚至力量更为强大。”近日在京举行的西门子RXD大会(Real Me

热心网友
03.28
京东物流异狼升级:单臂变双臂,抓取码垛更高效
科技数码
京东物流异狼升级:单臂变双臂,抓取码垛更高效

IT之家 3 月 28 日消息,3 月 27 日,京东物流在中关村论坛发布“异狼”升级版,从“单臂”到“双臂”,大幅提升仓库内海量包裹的分拣效率。据介绍,“异狼”机械臂是京东物流自主研发,专为包裹抓

热心网友
03.28

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

个人纳税记录查询:电子税务局操作与下载全指南
电脑教程
个人纳税记录查询:电子税务局操作与下载全指南

可通过电子税务局 、随申办App 小程序、个税APP三种方式查询下载个税纳税记录:电子税务局需登录后搜索或按路径进入,下载PDF用身份证后6位解密;随申办依托统一认证,支持直接保存

热心网友
03.28
智现未来联合晶合集荣获SEMICON China良率提升奖
科技数码
智现未来联合晶合集荣获SEMICON China良率提升奖

3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A

热心网友
03.28
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业
科技数码
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业

南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天

热心网友
03.28
神州写真:中国机器人租赁升温,二次开发成关键新赛道
科技数码
神州写真:中国机器人租赁升温,二次开发成关键新赛道

来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年

热心网友
03.28
京东翻新打印机避雷指南:警惕以旧充新三大陷阱
科技数码
京东翻新打印机避雷指南:警惕以旧充新三大陷阱

大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确

热心网友
03.28