游乐游手机版
首页/业界动态/文章详情

小米大模型API价格大幅下调 MiMo-V2.5系列最高降价99%

时间:2026-05-27 11:37
大模型API服务市场迎来新一轮价格调整,小米公司正式宣布其自研MiMo-V2 5系列大模型API接口实行永久性降价策略,部分版本最高降幅达到99%。此次价格调整显著降低了开发者集成先进AI能力的成本门槛。 对于广大开发者和企业用户而言,调用大模型能力的综合成本被进一步压缩。更值得关注的是,小米此次计

大模型API服务市场迎来新一轮价格调整,小米公司正式宣布其自研MiMo-V2.5系列大模型API接口实行永久性降价策略,部分版本最高降幅达到99%。此次价格调整显著降低了开发者集成先进AI能力的成本门槛。

对于广大开发者和企业用户而言,调用大模型能力的综合成本被进一步压缩。更值得关注的是,小米此次计价方案全面简化,不再依据上下文窗口长度进行区分,计费规则变得更加透明和易于预估。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

价格体系全面下调,最高降幅达99%

本次降价覆盖了MiMo-V2.5标准版和MiMo-V2.5 Pro专业版两个核心模型。价格调整幅度显著,堪称行业性价格重塑。

在输入成本方面,MiMo-V2.5 Pro版本的缓存命中价格调整为每百万tokens 0.025元,降幅高达99%;标准版MiMo-V2.5输入价格降至每百万tokens 0.02元,降幅为98%。输出成本也同步大幅下调:Pro版降至6元/百万tokens,降幅86%;标准版降至2元/百万tokens,降幅93%。

通过简单对比可知,若开发者原先调用Pro版API服务,现在完成同等规模任务的处理成本可能仅为原先的1%。这种量级的降幅预计将有效激发API调用量的增长,推动更多AI应用落地。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

计费方案同步升级,更透明更灵活

除了直接降价,小米也对配套的Token Plan资源包体系进行了重要升级。新方案的核心优势在于“资源加量而价格不变”——用户获得的实际调用量提升至原先的5至8倍。

同时,平台引入了“Credits”积分计量概念,使得复杂的资源消耗换算过程变得更加清晰直观。这相当于将技术资源消耗透明化,让开发者能够更精准地理解、规划与管理自身的资源使用与成本支出,提升预算决策的科学性。

技术突破驱动成本优化,效率大幅提升

能够实现如此大幅度的服务降价,其根本动力源于持续的技术突破与系统优化。小米将成本下降归因于其推理系统的深度技术迭代。

据悉,技术团队基于SGLang HiCache框架完整支持了滑动窗口注意力机制,此项改进将KV Cache在GPU显存、CPU内存和SSD等多级存储间的数据调度量,降低至优化前的约七分之一。同时,可缓存的token数量提升至原先的近五倍。这两项关键指标优化直接提升了缓存命中率,从而显著提高了整体推理效率。

此外,通过优化专家并行方案与动态输入长度分桶策略,小米进一步提升了计算集群的输入吞吐性能。在确保服务响应质量与稳定性的基础上,单位token的综合服务成本得以持续降低。这正是支撑此次战略性价格调整的底层技术逻辑。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

本次价格调整已于北京时间5月27日零时起在全球同步生效。可以预见,随着小米的深度参与,大模型API市场的竞争格局将更趋激烈。对于整个AI行业而言,由技术演进带来的成本红利正在加速转化为市场动能,最终将惠及广泛的开发者社区与AI应用生态的繁荣发展。

来源:https://m.mydrivers.com/newsview/1125165.html
上一篇黎明行者之血高自由度RPG开局直闯终局玩法解析 下一篇小米汽车出海计划公布 2027年将率先进入发达国家市场
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿