小米大模型API降价99% 紧跟DeepSeek宣布永久免费

首页

AI资讯

热心网友

转载

2026-05-28

图片来源：界面图库

大模型市场的价格战，再次迎来重磅升级。今日，小米技术正式发布公告，宣布对其MiMo-V2.5系列API实施永久性降价，最高降幅达到惊人的99%。此举距离DeepSeek宣布永久降价仅过去不久，标志着围绕API调用成本的“地板价”争夺战已全面进入白热化阶段。

此次调价，小米不仅大幅下调了价格，更对计费规则进行了革新。公司取消了传统定价中依据上下文窗口长度区分的模式，并对Token Plan计费体系进行了优化。这意味着，在同等付费水平下，开发者可使用的Token数量最高可提升至原来的5到8倍，性价比得到跨越式提升。

具体来看降价细节，力度空前。以高性能的MiMo-V2.5-Pro为例，调价后，输入缓存命中的价格仅为0.025元/百万tokens。这一价格极具竞争力：相较于原价中≤256k规格的1.40元，降幅高达98%；若对比原256k-1M长窗口规格的2.80元，降幅更是触及99%。同时，输入未命中缓存和输出的价格也分别实现了57%至86%的显著下调。

标准版MiMo-V2.5的降价力度同样可观。其输入缓存命中价格调整至0.020元/百万tokens，相比原价最高降幅达98%；输入未命中缓存和输出的价格，降幅区间也达到了64%到93%。对于广大中小开发者及初创企业而言，如此低廉的调用成本将极大降低AI应用的开发门槛与试错成本。

值得注意的是，本次调价主要聚焦于MiMo-V2.5核心系列。MiMo-V2.5-TTS系列仍维持限时免费接入政策，而更早发布的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型，其API价格保持不变。同时，旧系列的Token Plan套餐将不再调整并计划下线。这一系列举措意图明确：强力引导开发者生态全面转向更具性价比的V2.5系列。

小米的AI战略布局与人才引擎

MiMo-V2.5系列的快速迭代与市场攻势，离不开其背后的关键掌舵人——罗福莉。这位曾在DeepSeek担任要职的95后AI技术专家，于2025年11月正式加盟小米，出任MiMo大模型业务负责人。她所组建的研发团队平均年龄仅25岁，其中清华、北大毕业生占比超过60%。据市场消息，雷军以千万年薪的诚意，成功将这位年轻的技术领军者招入麾下。

在罗福莉的带领下，小米MiMo大模型实现了快速迭代。今年3月，小米正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型，随后迅速演进至V2.5进阶版本，全面补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。目前，V2.5系列已成为小米大模型产品矩阵中，面向商用普惠市场的主力军。

如今，小米已构建起层次清晰的MiMo大模型产品矩阵：MiMo-V2.5-Pro主打高性能复杂推理，面向企业级智能体开发、深度业务分析等高阶需求；MiMo-V2.5聚焦轻量化通用任务，服务广大中小开发者；MiMo-V2.5-TTS则以免费策略主攻语音合成赛道，旨在抢占音频生态入口。此外，定位旗舰基座的MiMo-V2-Pro和专注全模态融合的MiMo-V2-Omni，共同构成了技术探索的前沿阵地。

就在降价公告发布前夕，小米创始人雷军对外透露，“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数与Agent指数上，已取得全球开源模型并列第一的成绩”。他同时宣布，未来三年小米在AI领域的投入计划将高达600亿元。这向市场释放了明确信号：小米已全力押注AI大模型赛道，志在必得。

降价潮背后的行业深层逻辑

小米并非此轮降价潮的发起者。此前，国内大模型头部厂商DeepSeek已率先开启“永久降价”模式，主要针对其DeepSeek-V4-Pro模型。该模型API在5月31日结束限时优惠后，整体价格将调整为原定价的四分之一。调价后，其输入缓存命中价格同样为0.025元/百万tokens，整体降幅达75%。

DeepSeek-V4于今年4月下旬发布，凭借百万字超长上下文、卓越的Agent能力与推理性能，在国内外开源社区引发广泛关注。其远低于GPT-4o、Claude等国际主流模型的调用成本，通过高性价比策略快速吸引了大量开发者与企业用户，也为小米等厂商的跟进降价提供了现实的市场参照。

事实上，纵观国内大模型市场，一场“K型分化”格局正在形成。一方面，阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格，走“以价换量”的普及路线；另一方面，智谱GLM、腾讯混元等主打企业级深度定制与私有化部署服务的模型，则维持价格稳定甚至略有上浮，坚守“价值溢价”的高端市场。通用模型降价走量，高端模型溢价保值，已成为当前市场的新常态。

这一现象的背后，远非简单的价格竞争所能概括。它标志着整个行业正从初期的营销与规模竞争，转向深层次的技术效率与成本竞争。降价已成为底层算法持续优化、推理技术不断突破、算力成本稳步下行等多重技术红利共同驱动的必然结果。

AI聚合平台AI.cc发布的《2026年AI API基础设施报告》印证了这一趋势。报告显示，过去一年，企业级大模型的Token调用成本同比暴跌67%。同时，开源模型已占据企业Token调用量38%的份额。这些数据清晰地表明：在技术快速普及与商业化落地的关键阶段，性价比已成为决定市场份额与生态繁荣的核心要素。

可以预见，随着技术红利持续释放与规模效应进一步显现，大模型API的调用成本仍有下探空间。这场由头部厂商引领的降价潮，或许只是序幕。对于整个AI生态而言，更低的门槛将催生更广泛的创新与应用，最终推动整个产业迈向普惠与繁荣。

来源:https://36kr.com/p/3827259464585862

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：DuckDuckGo搜索量在谷歌AI功能发布后激增下一篇：企业级AI Agent选型指南 MCP CLI与Skills定位选择及最佳实践

相关攻略

AI资讯

五大旗舰AI模型编程实测 Qwen3.7 Max是否实至名归

实测阿里Qwen3 7Max在编程竞技榜全球第二，超越GPT-5 5等模型。前端网页设计与六宫格2048游戏测试中，其表现优于前代，但不及ClaudeOpus4 7和Gemini3 5Flash。接入Codex后能力提升，但存在工具调用不稳定问题，提示词质量对发挥模型能力至关重要。

热心网友

05.28

AI资讯

DeepSeek服务部分中断半小时现已修复

深度求索服务今日上午出现部分中断，波及网页端和应用程序接口。官方于十点二十一分定位问题，十点五十分修复，持续约半小时。这已是二〇二六年五月第五次服务波动，其中两次达完全中断级别。

热心网友

05.28

AI教程

DeepSeek实用指南：20个普通人轻松上手的AI技巧

春节期间，AI领域的DeepSeek成为各大社交平台和科技媒体的热议焦点。从公司背景、创始团队到其创新的模型架构设计，引发了行业内的广泛讨论。许多专业人士和自媒体都在积极测试它的实际应用能力。那么，对于广大普通用户——无论是职场人士、在校学生，还是需要兼顾家庭的父母——DeepSeek这款AI工具

热心网友

05.28

AI教程

DeepSeek V4 Flash 在 M3 Max 128GB 上能否运行 1M 上下文

Redis创始人Antirez开源了ds4项目，用纯C代码将DeepSeekV4Flash模型在128GBM3MaxMacBook上跑通，支持1M上下文。项目采用不对称2-bit量化压缩大部分参数，关键路径保持全精度，并将KVCache扩展至SSD，利用硬件特性降低内存需求。该定制化方案实现了可接受的性能与质量平衡，适合代理任务等特定场景。

热心网友

05.28

AI资讯

DeepSeek开发自动研究技能实现论文撰写仅需人类思考两小时

DeepSeek研究员陈德里利用智能体协作，在约2小时人类投入下于6天内完成一篇46页论文。论文提出了研究智能体L1-L5自主分级体系，分析了四种主流架构及其适用场景，对比了17个现有系统。研究指出当前前沿已达L4受限自主水平，但迈向完全自主的L5仍需克服持续知识积累、可靠自我评估等核心瓶颈，并明确了。

热心网友

05.28