小米Mimo系列API价格大幅下调永久降价最高降幅达99%
AI大模型领域的价格竞争正持续深化,行业成本门槛不断被刷新。5月27日,小米公司旗下MiMo大模型团队发布重要公告:正式对MiMo-V2.5系列API实施永久性价格下调,并全面升级计费体系。此举并非短期营销策略,而是依托核心技术进步,旨在实质性降低开发者的调用成本与应用门槛,推动AI技术更广泛落地。

一、API价格大幅下调,最高降幅达99%
本次调价已于北京时间5月27日0点全球同步生效,覆盖MiMo-V2.5与MiMo-V2.5Pro两大核心模型。小米同时简化了计费逻辑,取消了按上下文长度分级定价的复杂模式,使整体价格体系更透明、更易预估。
具体降价幅度如下:
| 模型版本 | 输入缓存命中单价 | 最高降幅 | 输出单价 | 最高降幅 |
| MiMo-V2.5Pro | 0.025元/百万 tokens | 99% | 6元/百万 tokens | 86% |
| MiMo-V2.5 | 0.02元/百万 tokens | 98% | 2元/百万 tokens | 93% |
二、计费体系升级:用量扩容,价格不变
除直接调低单价外,小米对计费机制进行了系统性优化,核心是“用量倍增、支出不增”,让开发者在同等预算下获得更多调用资源。
- 额度大幅提升:在保持原订阅价格不变的基础上,用户可使用的Token总量提升至原来的5-8倍。固定预算的开发者或企业可因此显著扩大AI应用的调用规模与频次。
- 计费透明化:新体系引入“Credits(积分)”作为统一计量单位,替代以往多维度的复杂计费规则。开发者可更直观地监控Token消耗情况与费用支出,实现更精准的预算管理与成本控制。

三、技术驱动成本优化:三大核心突破
能够实现如此大幅的降价,源于小米在大模型推理基础设施上取得的关键技术进展。这些突破从底层实现了降本增效。
- SWA加速推理技术:基于SGLang HiCache完整集成SWA(滑动窗口注意力)机制,将KV Cache在GPU显存、CPU内存与SSD之间的三级数据迁移量压缩至原方案的1/7。数据传输负载大幅降低,直接提升了推理效率并削减了运算成本。
- 缓存能力显著增强:系统可高效缓存的Token数量提升近5倍。缓存命中率的大幅提高,使得重复或相似请求无需重复进行完整计算,有效摊薄了单次推理的平均资源开销。
- 集群吞吐性能优化:通过融合专家并行(MoE)架构与输入长度动态分桶策略,显著提升了集群的整体输入处理吞吐量。在保障响应质量与系统稳定的前提下,服务器集群处理海量并发请求的效率更高,持续降低了单位Token处理的边际服务成本。
业内分析指出,小米此次调价是对当前大模型商业化竞争态势的主动回应。当API调用成本降至极低水平,MiMo系列模型的性价比优势将加速显现。这将进一步推动AI能力以更低成本、更高效率融入各行各业及广大开发者的产品开发与创新实践中。至此,大模型价格战已进入新阶段,竞争焦点从单纯补贴转向了以技术实力驱动成本优化的深层较量。
相关攻略
AI大模型领域的价格竞争正持续深化,行业成本门槛不断被刷新。5月27日,小米公司旗下MiMo大模型团队发布重要公告:正式对MiMo-V2 5系列API实施永久性价格下调,并全面升级计费体系。此举并非短期营销策略,而是依托核心技术进步,旨在实质性降低开发者的调用成本与应用门槛,推动AI技术更广泛落地。
小米与DeepSeek大幅降低AI模型API价格,最高降幅达99%,但超低价主要适用于高频重复场景。月费不变但额度提升,旨在吸引开发者与高频应用,通过真实调用数据优化模型。降价依赖缓存优化等硬核工程能力,将推动行业洗牌,具备工程实力与生态入口的企业更具优势。
小米澄清测试车型并非传闻中的YU9,并宣布一款全新车型将于2026年上市。近期,YU7系列新增GT与标准版,其中高配版最受用户青睐。2024年前四个月,小米SU7在20万元以上纯电轿车市场销量领先,YU7系列在纯电SUV市场也位居前列,开局稳健。
数码博主爆料某大厂正测试7英寸2K大屏性能机,搭载天玑9系次旗舰平台,电池容量超10000mAh,推测可能来自小米。该机若属实,将在屏幕尺寸与电池上突破当前旗舰机型上限,具体信息仍有待后续披露。
最近,由小米、OPPO、vivo、荣耀等主流国产手机厂商组成的“金标联盟”,正式推出了一项名为“公平运行内存机制”的新规范。这个动作的目标很明确:直指安卓系统长期以来的内存管理乱象,试图让手机在长期使用后,依然能保持流畅,减少发热和卡顿。 图源:公众号 可能不少朋友对这个“金标联盟”还比较陌生。它的
热门专题
热门推荐
NotionAI能直接修改文本语气和风格。选中文字后右键使用“AskAI”功能,输入具体指令即可生成并替换新文本。也可用斜杠命令控制风格参数,指令需具体明确。处理批量邮件时可结合数据库与AI属性,自动填充变量并统一语气。通过隐藏指令块提供上下文,能更精准地控制输出风格。操作前建议备份原文。
如何利用免费AI PPT生成工具,轻松提升办公文档质量与效率 在当今快节奏的职场环境中,制作一份专业、高效且视觉出众的演示文稿,常常是一项极具挑战性的任务。值得庆幸的是,随着人工智能技术的飞速发展与普及,一系列智能办公工具应运而生,正在彻底改变传统文档制作模式。本文将深入探讨,如何借助WPS AI这
高速公路上车流密集、车速快,一旦发生交通事故,后续处置的每一个环节都直接关系到生命安全。近日,在沪渝高速湖北仙桃段,发生了一起令人警醒的追尾事故,而当事司机随后的“危险操作”,更是让赶到现场的交警惊出一身冷汗。 4月6日,在沪渝高速仙桃段,驾驶人代某驾驶一辆白色轿车在快车道行驶。当时前方车流量大,车
OpenSpec是一款规范驱动开发的开源工具,旨在解决AI编程中因需求模糊导致的代码偏差问题。它通过结构化变更文件夹管理提案、任务与规范,确保开发前达成技术共识。其工作流程包括起草提案、审查对齐、实施任务和存档更新,支持从初始化到归档的完整变更周期,提升人机协作的精确性与可控性。
手头有一份长达数万字的访谈录音转写稿,密密麻麻的文字读起来,很难迅速定位关键信息。别担心,借助Kimi就能从中提炼出核心要点。这里整理了五种实用操作路径,可根据需求灵活选用。 首先准备好转写稿,推荐使用TXT、DOCX或PDF格式。接着,根据具体场景选择一种方法即可。 一、角色驱动式指令解析 这种方





