小米大模型API价格大幅下调 MiMo-V2.5系列最高降价99%
大模型API服务市场迎来新一轮价格调整,小米公司正式宣布其自研MiMo-V2.5系列大模型API接口实行永久性降价策略,部分版本最高降幅达到99%。此次价格调整显著降低了开发者集成先进AI能力的成本门槛。
对于广大开发者和企业用户而言,调用大模型能力的综合成本被进一步压缩。更值得关注的是,小米此次计价方案全面简化,不再依据上下文窗口长度进行区分,计费规则变得更加透明和易于预估。
价格体系全面下调,最高降幅达99%
本次降价覆盖了MiMo-V2.5标准版和MiMo-V2.5 Pro专业版两个核心模型。价格调整幅度显著,堪称行业性价格重塑。
在输入成本方面,MiMo-V2.5 Pro版本的缓存命中价格调整为每百万tokens 0.025元,降幅高达99%;标准版MiMo-V2.5输入价格降至每百万tokens 0.02元,降幅为98%。输出成本也同步大幅下调:Pro版降至6元/百万tokens,降幅86%;标准版降至2元/百万tokens,降幅93%。
通过简单对比可知,若开发者原先调用Pro版API服务,现在完成同等规模任务的处理成本可能仅为原先的1%。这种量级的降幅预计将有效激发API调用量的增长,推动更多AI应用落地。
计费方案同步升级,更透明更灵活
除了直接降价,小米也对配套的Token Plan资源包体系进行了重要升级。新方案的核心优势在于“资源加量而价格不变”——用户获得的实际调用量提升至原先的5至8倍。
同时,平台引入了“Credits”积分计量概念,使得复杂的资源消耗换算过程变得更加清晰直观。这相当于将技术资源消耗透明化,让开发者能够更精准地理解、规划与管理自身的资源使用与成本支出,提升预算决策的科学性。
技术突破驱动成本优化,效率大幅提升
能够实现如此大幅度的服务降价,其根本动力源于持续的技术突破与系统优化。小米将成本下降归因于其推理系统的深度技术迭代。
据悉,技术团队基于SGLang HiCache框架完整支持了滑动窗口注意力机制,此项改进将KV Cache在GPU显存、CPU内存和SSD等多级存储间的数据调度量,降低至优化前的约七分之一。同时,可缓存的token数量提升至原先的近五倍。这两项关键指标优化直接提升了缓存命中率,从而显著提高了整体推理效率。
此外,通过优化专家并行方案与动态输入长度分桶策略,小米进一步提升了计算集群的输入吞吐性能。在确保服务响应质量与稳定性的基础上,单位token的综合服务成本得以持续降低。这正是支撑此次战略性价格调整的底层技术逻辑。
本次价格调整已于北京时间5月27日零时起在全球同步生效。可以预见,随着小米的深度参与,大模型API市场的竞争格局将更趋激烈。对于整个AI行业而言,由技术演进带来的成本红利正在加速转化为市场动能,最终将惠及广泛的开发者社区与AI应用生态的繁荣发展。
相关攻略
大模型API服务市场迎来新一轮价格调整,小米公司正式宣布其自研MiMo-V2 5系列大模型API接口实行永久性降价策略,部分版本最高降幅达到99%。此次价格调整显著降低了开发者集成先进AI能力的成本门槛。 对于广大开发者和企业用户而言,调用大模型能力的综合成本被进一步压缩。更值得关注的是,小米此次计
近日,AI开源领域迎来一项重要进展:根据权威平台OpenRouter发布的最新数据,开源智能体框架Hermes Agent的日均Token调用量已攀升至全球首位。具体统计显示,该框架日均处理Token数量高达2910亿,周调用总量更是突破1 75万亿大关。 这一成就的背后,离不开小米自研大模型MiM
第十三届中国网络视听大会揭晓:湖南广电发布年度关键数据,展现平台增长与AI应用深度 在第十三届中国网络视听大会上,湖南广播电视台(湖南广电)董事长龚政文正式公布了集团及旗下芒果TV在过去一年的核心运营成果。这份成绩单不仅反映了用户规模的强劲增长,更揭示了其在人工智能技术应用层面的实质性突破。 首先,
12月9日消息,近日,搭载京东JoyInside的京东京造AI毛绒玩具首批开售,部分款式火速售罄。作为京东首款自研AI玩具,该系列玩具采用无屏幕的实体交互形态,强调陪伴与启发,定位孩子们“可拥抱的成
9月22日消息,今日,百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL,并全面开源。即日起至10月10日,用户可在百度智能云千帆平台免费体验8B、70B模型。据介绍,Qianfan-V
热门专题
热门推荐
掌握核心技巧可显著提升PPT专业度。使用模板奠定视觉基调,插入相关多媒体元素吸引注意力,运用动画效果引导视线强调重点。合理排版需确保信息密度适中、清晰易读。最后,反复练习演讲以熟练内容、把控节奏,让演示更具魅力。
该公司经营范围显示其专注于高端制造与智能科技。核心业务包括智能出行与高端装备、机器人与智能制造、人工智能与数字技术,并具备技术贸易与全球市场视野。整体构建了以人工智能为核心,涵盖研发、制造、销售及服务的综合性高科技产业生态。
一、如何利用AI写PPT生成器免费提升你的演示效果 在信息爆炸的时代,演示文稿的质量直接决定了沟通的成败。免费的AI写PPT生成器,正成为职场人士、教育工作者提升效率、优化演示效果的智能伙伴。你可能尚未察觉,这类工具已深度融入各行各业的工作流中。 AI写PPT生成器免费的应用领域 那么,这些免费的A
Hyperliquid平台USDC供应量突破65亿美元,反映大量资本正涌入该生态,体现用户对其需求与信任。资金规模与生态活跃度、DeFi应用丰富度及基础设施成熟度紧密相关。供应增长为平台在公链竞争中增添筹码,关键在将资金转化为生态护城河,吸引核心应用形成正向循环。
Kraftful产品介绍:AI驱动的用户反馈分析平台 在当今竞争激烈的产品开发领域,如何从海量的用户反馈中高效提取有价值的洞察,是产品经理和开发团队面临的核心挑战。近期,一款名为Kraftful的智能分析平台备受瞩目,它不仅精准解决了这一痛点,更因其被行业领先的产品分析平台Amplitude收购,而





