感谢网友“顺势而为”、“zerodert”和“静静的听你说”为我们提供了宝贵的线索!
12月31日消息,小米于2025年12月16日正式揭晓了其开源MoE大模型——Xiaomi MiMo-V2-Flash。其API的免费体验期已延长至15天以上。
据多位用户证实,MiMo研发团队联合小米大模型Core团队今日发布最新公告:原定的公测限免周期已正式延长至2026年1月20日,配套的支付系统也将于公测收官前正式上线。
免费试用期再延20天!
原计划于2025年12月底截止的免费API使用权限,现已顺延至2026年1月20日14:00(北京时间)。在此期间,所有开发者均可零门槛调用MiMo-V2-Flash模型API,畅享其核心文本生成、智能代码理解与编写等关键场景能力。此次延期既是对社区热情支持的回应,也为更广泛地收集真实场景反馈、助力我们在正式商用前完成深度性能调优、交互体验升级及全链路安全验证提供了宝贵窗口。
支付系统即将启用的预告
Xiaomi MiMo API开放平台配套的商业化支付模块将于公测结束前正式部署,并启动约一周的灰度试运行(具体安排以最新后续通知为准)。试运行阶段将开放账户充值功能,为保障服务连续性与调用稳定性,建议用户提前完成账户预充值操作。
附:模型 API 最新定价标准
国内价格:输入 ¥0.7 / 百万 token,输出 ¥2.1 / 百万 token;
海外价格:输入 $0.1 / 百万 token,输出 $0.3 / 百万 token。
更多资费细则、套餐方案及优惠活动,敬请持续关注平台的正式更新及微信社群的实时推送信息。

Xiaomi MiMo-V2-Flash是一款面向智能体(Agent)场景深度优化的开源MoE模型,总参数量达309B,单次推理仅激活15B参数,主打“快、准、省”的特性。
小米最新指出,该模型采用了小米自研的极致推理效率导向型MoE架构,通过创新的混合注意力机制设计结合多级MTP推理加速技术,使其在主流的智能体评测体系中稳居全球开源模型前两名;其编程能力全面超越现有全部开源竞品,表现直追顶级的闭源模型Claude 4.5 Sonnet,而推理成本仅为后者的2.5%,响应速度则提升了一倍有余。

