小米大模型API降价99% 紧跟DeepSeek宣布永久免费

图片来源:界面图库
大模型市场的价格战,再次迎来重磅升级。今日,小米技术正式发布公告,宣布对其MiMo-V2.5系列API实施永久性降价,最高降幅达到惊人的99%。此举距离DeepSeek宣布永久降价仅过去不久,标志着围绕API调用成本的“地板价”争夺战已全面进入白热化阶段。
此次调价,小米不仅大幅下调了价格,更对计费规则进行了革新。公司取消了传统定价中依据上下文窗口长度区分的模式,并对Token Plan计费体系进行了优化。这意味着,在同等付费水平下,开发者可使用的Token数量最高可提升至原来的5到8倍,性价比得到跨越式提升。
具体来看降价细节,力度空前。以高性能的MiMo-V2.5-Pro为例,调价后,输入缓存命中的价格仅为0.025元/百万tokens。这一价格极具竞争力:相较于原价中≤256k规格的1.40元,降幅高达98%;若对比原256k-1M长窗口规格的2.80元,降幅更是触及99%。同时,输入未命中缓存和输出的价格也分别实现了57%至86%的显著下调。

标准版MiMo-V2.5的降价力度同样可观。其输入缓存命中价格调整至0.020元/百万tokens,相比原价最高降幅达98%;输入未命中缓存和输出的价格,降幅区间也达到了64%到93%。对于广大中小开发者及初创企业而言,如此低廉的调用成本将极大降低AI应用的开发门槛与试错成本。
值得注意的是,本次调价主要聚焦于MiMo-V2.5核心系列。MiMo-V2.5-TTS系列仍维持限时免费接入政策,而更早发布的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型,其API价格保持不变。同时,旧系列的Token Plan套餐将不再调整并计划下线。这一系列举措意图明确:强力引导开发者生态全面转向更具性价比的V2.5系列。
小米的AI战略布局与人才引擎
MiMo-V2.5系列的快速迭代与市场攻势,离不开其背后的关键掌舵人——罗福莉。这位曾在DeepSeek担任要职的95后AI技术专家,于2025年11月正式加盟小米,出任MiMo大模型业务负责人。她所组建的研发团队平均年龄仅25岁,其中清华、北大毕业生占比超过60%。据市场消息,雷军以千万年薪的诚意,成功将这位年轻的技术领军者招入麾下。
在罗福莉的带领下,小米MiMo大模型实现了快速迭代。今年3月,小米正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型,随后迅速演进至V2.5进阶版本,全面补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。目前,V2.5系列已成为小米大模型产品矩阵中,面向商用普惠市场的主力军。
如今,小米已构建起层次清晰的MiMo大模型产品矩阵:MiMo-V2.5-Pro主打高性能复杂推理,面向企业级智能体开发、深度业务分析等高阶需求;MiMo-V2.5聚焦轻量化通用任务,服务广大中小开发者;MiMo-V2.5-TTS则以免费策略主攻语音合成赛道,旨在抢占音频生态入口。此外,定位旗舰基座的MiMo-V2-Pro和专注全模态融合的MiMo-V2-Omni,共同构成了技术探索的前沿阵地。
就在降价公告发布前夕,小米创始人雷军对外透露,“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数与Agent指数上,已取得全球开源模型并列第一的成绩”。他同时宣布,未来三年小米在AI领域的投入计划将高达600亿元。这向市场释放了明确信号:小米已全力押注AI大模型赛道,志在必得。
降价潮背后的行业深层逻辑
小米并非此轮降价潮的发起者。此前,国内大模型头部厂商DeepSeek已率先开启“永久降价”模式,主要针对其DeepSeek-V4-Pro模型。该模型API在5月31日结束限时优惠后,整体价格将调整为原定价的四分之一。调价后,其输入缓存命中价格同样为0.025元/百万tokens,整体降幅达75%。
DeepSeek-V4于今年4月下旬发布,凭借百万字超长上下文、卓越的Agent能力与推理性能,在国内外开源社区引发广泛关注。其远低于GPT-4o、Claude等国际主流模型的调用成本,通过高性价比策略快速吸引了大量开发者与企业用户,也为小米等厂商的跟进降价提供了现实的市场参照。
事实上,纵观国内大模型市场,一场“K型分化”格局正在形成。一方面,阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格,走“以价换量”的普及路线;另一方面,智谱GLM、腾讯混元等主打企业级深度定制与私有化部署服务的模型,则维持价格稳定甚至略有上浮,坚守“价值溢价”的高端市场。通用模型降价走量,高端模型溢价保值,已成为当前市场的新常态。
这一现象的背后,远非简单的价格竞争所能概括。它标志着整个行业正从初期的营销与规模竞争,转向深层次的技术效率与成本竞争。降价已成为底层算法持续优化、推理技术不断突破、算力成本稳步下行等多重技术红利共同驱动的必然结果。
AI聚合平台AI.cc发布的《2026年AI API基础设施报告》印证了这一趋势。报告显示,过去一年,企业级大模型的Token调用成本同比暴跌67%。同时,开源模型已占据企业Token调用量38%的份额。这些数据清晰地表明:在技术快速普及与商业化落地的关键阶段,性价比已成为决定市场份额与生态繁荣的核心要素。
可以预见,随着技术红利持续释放与规模效应进一步显现,大模型API的调用成本仍有下探空间。这场由头部厂商引领的降价潮,或许只是序幕。对于整个AI生态而言,更低的门槛将催生更广泛的创新与应用,最终推动整个产业迈向普惠与繁荣。
相关攻略
实测阿里Qwen3 7Max在编程竞技榜全球第二,超越GPT-5 5等模型。前端网页设计与六宫格2048游戏测试中,其表现优于前代,但不及ClaudeOpus4 7和Gemini3 5Flash。接入Codex后能力提升,但存在工具调用不稳定问题,提示词质量对发挥模型能力至关重要。
深度求索服务今日上午出现部分中断,波及网页端和应用程序接口。官方于十点二十一分定位问题,十点五十分修复,持续约半小时。这已是二〇二六年五月第五次服务波动,其中两次达完全中断级别。
春节期间,AI领域的DeepSeek成为各大社交平台和科技媒体的热议焦点。从公司背景、创始团队到其创新的模型架构设计,引发了行业内的广泛讨论。许多专业人士和自媒体都在积极测试它的实际应用能力。 那么,对于广大普通用户——无论是职场人士、在校学生,还是需要兼顾家庭的父母——DeepSeek这款AI工具
Redis创始人Antirez开源了ds4项目,用纯C代码将DeepSeekV4Flash模型在128GBM3MaxMacBook上跑通,支持1M上下文。项目采用不对称2-bit量化压缩大部分参数,关键路径保持全精度,并将KVCache扩展至SSD,利用硬件特性降低内存需求。该定制化方案实现了可接受的性能与质量平衡,适合代理任务等特定场景。
DeepSeek研究员陈德里利用智能体协作,在约2小时人类投入下于6天内完成一篇46页论文。论文提出了研究智能体L1-L5自主分级体系,分析了四种主流架构及其适用场景,对比了17个现有系统。研究指出当前前沿已达L4受限自主水平,但迈向完全自主的L5仍需克服持续知识积累、可靠自我评估等核心瓶颈,并明确了。
热门专题
热门推荐
《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。
2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景
先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非
山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,
近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。





