小米具身大模型MiMo-Embodied开源：全面开放技术架构

11月21日消息，小米今天正式发布具身大模型MiMo-Embodied，并宣布全面开源。小米介绍，随着具身智能逐步落地家居场景、自动驾驶技术迈向规模化应用，行业内一个关键问题日益凸显：机器人与车辆如

11月21日，小米正式发布具身大模型MiMo-Embodied，同时宣布将全面开源。

小米指出，随着具身智能逐步渗入家居场景、自动驾驶技术迈向规模化应用，业内正面临一个日渐突出的关键问题：如何让机器人与车辆更好地实现认知与能力互通？室内作业智能与户外驾驶智能能否相互促进？

为此，小米专门打造了具身大模型MiMo-Embodied，这也是业界首个实现自动驾驶与具身智能融通的跨域具身基座模型。它完成了两大领域任务的统一建模，标志着通用具身智能研究正从“垂直领域专用”迈向“跨域能力协同”的关键转折。

小米具身大模型MiMo-Embodied正式发布：全面开源

该模型具备三大核心技术亮点：

1. 跨域能力覆盖：同步支持具身智能三大核心任务（可供性推理、任务规划、空间理解）与自动驾驶三大关键任务（环境感知、状态预测、驾驶规划），实现全场景智能支撑；

2. 双向协同赋能：验证了室内交互能力与道路决策能力之间的知识迁移协同效应，为跨场景智能融合提供了新思路；

3. 全链优化可靠：采用“具身/自驾驶能力学习→CoT推理增强→RL精细强化”的多阶段训练策略，有效提升模型在真实环境中的部署可靠性。

小米具身大模型MiMo-Embodied正式发布：全面开源

在涵盖感知、决策与规划的29项核心基准测试中，MiMo-Embodied树立了开源基座模型的性能新标杆，整体表现优于现有开源、闭源及专用模型：

- 具身智能领域：在17项Benchmarks上取得SOTA成绩，重新定义了任务规划、可供性预测及空间理解的能力边界；

- 自动驾驶领域：在12项Benchmarks上表现卓越，实现了环境感知、状态预测与驾驶规划的全链路性能突破。

- 通用视觉语言领域：在夯实通用感知与理解能力的同时，进一步在多项关键基准上实现显著性能跃升，展现出卓越的泛化性。