小米自研47亿参数具身智能模型MiLM-0,多项基准评测第一

2026年2月12日,小米机器人团队正式将具身智能视觉语言动作模型Xiaomi-Robotics-0对外开源。这一模型参数量高达470亿,采用MoT混合架构,并以多模态视觉语言大模型为底座,融合了多层扩散变换器结构,成功在通用语义理解与精细化动作控制之间实现了高效协同。
在Libero、Calvin和SimplerEnv三大主流评测基准上,Xiaomi-Robotics-0在全部标准测试任务及涵盖30种模型的横向对比中,平均成绩均位列第一。该模型可在消费级显卡上完成实时推理,无需依赖专业计算设备。
训练过程中,模型同步开展跨模态预训练,完整保留了物体检测、视觉问答等基础感知能力。针对传统视觉语言动作模型因推理延迟引发的动作不连贯问题,研发团队引入异步推理机制与λ形注意力掩码技术,显著提升了响应连续性与场景适应性。实际任务验证显示,该模型在积木拆解、毛巾折叠等对精细操作与多感官协同要求较高的复杂场景中,展现出稳定可靠的手眼协调能力。
热门专题
热门推荐
比特币匿名交易指南:原理、方法与关键注意事项 提到比特币,很多人第一反应是“匿名”。但真相是,比特币交易在区块链上公开记录,其本质是“化名”而非完全匿名。这意味着,只要采取恰当的方法,完全可以将交易隐私提升一个层级。本文将系统梳理实现比特币匿名交易的几种实用方法,并为你提供相关可信工具的官方获取途径
PowerLawGLM:法律领域的AI“专家” 在人工智能大模型深刻变革各行各业的今天,法律这一专业壁垒高、知识体系复杂的领域,也迎来了其专属的智能解决方案。由幂律智能与智谱AI联合推出的PowerLawGLM,是一款拥有千亿级参数、专为中文法律场景深度优化的垂直大模型。它本质上是一位经过海量法律文
新SSR比斯塔天赋可叠加“蔷薇花刺”,三层后目标无法复活,有效克制副本复活机制。其技能多为全体伤害,适合PVP竞技场。闪避可减敌怒气,暴击能回复生命,兼具续航与干扰能力。终结技提升闪避,配合额外魂玉实现连招。奥义击倒目标后可回血,增强生存能力。
手游《代号:逍遥游》即将上线,以“选择”为核心玩法。玩家将在宏大仙侠世界中,面对飞升或逆天等不同道路,通过自身决策破解宿命迷局,体验多线命运走向。
在《方舟:生存进化》中,探险者笔记是揭示世界秘密的关键物品。可通过探索地图角落、完成特定任务、与NPC互动、寻找隐藏地点以及参与游戏内特殊事件等多种途径获取。收集过程融合了探索、解谜与社交,集齐笔记不仅能获得经验加成,更能深入理解游戏世界的背景与故事。





