12月17日,2025年小米汽车与生态系统伙伴大会正式拉开帷幕,小米“MiMo”大模型负责人罗福莉在会上首度公开亮相。会议期间,小米正式发布了开源的MoE模型Xiaomi MiMo-V2-Flash,引发业界广泛关注。
该模型总参数量达到惊人的3090亿,其中活跃参数为150亿,专为智能体AI场景优化。其核心定位在于追求极致的推理速度。不少体验者反馈,模型在实际运行中表现出极高的响应效率。
据罗福莉介绍,MiMo-V2-Flash在架构设计上聚焦于推理性能优化。它采用了三层MTP推理加速机制,并引入了并行Token验证技术,使得整体推理速度较前代提升了2.0至2.6倍。
在多项代码与智能体能力评测中,MiMo-V2-Flash凭借其庞大的参数规模与高效的激活机制,跻身全球开源模型前列,排名稳居前二。同时,该模型已初步展现出模拟现实世界的能力,能够通过HTML实现操作系统原型构建、太阳系动态模拟以及绘制圣诞树等复杂任务。
谈及未来发展,罗福莉指出,下一代智能体系将不再局限于语言层面的模仿。其本质不应只是一个“语言模拟器”,而应具备真正理解外部世界并与其持续互动的能力,最终成长为能感知、决策与行动的完整智能存在。
