首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
小米大模型API价格大幅下调 MiMo-V2.5系列最高降价99%

小米大模型API价格大幅下调 MiMo-V2.5系列最高降价99%

热心网友
61
转载
2026-05-27

大模型API服务市场迎来新一轮价格调整,小米公司正式宣布其自研MiMo-V2.5系列大模型API接口实行永久性降价策略,部分版本最高降幅达到99%。此次价格调整显著降低了开发者集成先进AI能力的成本门槛。

对于广大开发者和企业用户而言,调用大模型能力的综合成本被进一步压缩。更值得关注的是,小米此次计价方案全面简化,不再依据上下文窗口长度进行区分,计费规则变得更加透明和易于预估。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

价格体系全面下调,最高降幅达99%

本次降价覆盖了MiMo-V2.5标准版和MiMo-V2.5 Pro专业版两个核心模型。价格调整幅度显著,堪称行业性价格重塑。

在输入成本方面,MiMo-V2.5 Pro版本的缓存命中价格调整为每百万tokens 0.025元,降幅高达99%;标准版MiMo-V2.5输入价格降至每百万tokens 0.02元,降幅为98%。输出成本也同步大幅下调:Pro版降至6元/百万tokens,降幅86%;标准版降至2元/百万tokens,降幅93%。

通过简单对比可知,若开发者原先调用Pro版API服务,现在完成同等规模任务的处理成本可能仅为原先的1%。这种量级的降幅预计将有效激发API调用量的增长,推动更多AI应用落地。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

计费方案同步升级,更透明更灵活

除了直接降价,小米也对配套的Token Plan资源包体系进行了重要升级。新方案的核心优势在于“资源加量而价格不变”——用户获得的实际调用量提升至原先的5至8倍。

同时,平台引入了“Credits”积分计量概念,使得复杂的资源消耗换算过程变得更加清晰直观。这相当于将技术资源消耗透明化,让开发者能够更精准地理解、规划与管理自身的资源使用与成本支出,提升预算决策的科学性。

技术突破驱动成本优化,效率大幅提升

能够实现如此大幅度的服务降价,其根本动力源于持续的技术突破与系统优化。小米将成本下降归因于其推理系统的深度技术迭代。

据悉,技术团队基于SGLang HiCache框架完整支持了滑动窗口注意力机制,此项改进将KV Cache在GPU显存、CPU内存和SSD等多级存储间的数据调度量,降低至优化前的约七分之一。同时,可缓存的token数量提升至原先的近五倍。这两项关键指标优化直接提升了缓存命中率,从而显著提高了整体推理效率。

此外,通过优化专家并行方案与动态输入长度分桶策略,小米进一步提升了计算集群的输入吞吐性能。在确保服务响应质量与稳定性的基础上,单位token的综合服务成本得以持续降低。这正是支撑此次战略性价格调整的底层技术逻辑。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

本次价格调整已于北京时间5月27日零时起在全球同步生效。可以预见,随着小米的深度参与,大模型API市场的竞争格局将更趋激烈。对于整个AI行业而言,由技术演进带来的成本红利正在加速转化为市场动能,最终将惠及广泛的开发者社区与AI应用生态的繁荣发展。

来源:https://m.mydrivers.com/newsview/1125165.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

小米大模型API价格大幅下调 MiMo-V2.5系列最高降价99%
业界动态
小米大模型API价格大幅下调 MiMo-V2.5系列最高降价99%

大模型API服务市场迎来新一轮价格调整,小米公司正式宣布其自研MiMo-V2 5系列大模型API接口实行永久性降价策略,部分版本最高降幅达到99%。此次价格调整显著降低了开发者集成先进AI能力的成本门槛。 对于广大开发者和企业用户而言,调用大模型能力的综合成本被进一步压缩。更值得关注的是,小米此次计

热心网友
05.27
小米自研大模型MiMo实战表现获国际权威认可
业界动态
小米自研大模型MiMo实战表现获国际权威认可

近日,AI开源领域迎来一项重要进展:根据权威平台OpenRouter发布的最新数据,开源智能体框架Hermes Agent的日均Token调用量已攀升至全球首位。具体统计显示,该框架日均处理Token数量高达2910亿,周调用总量更是突破1 75万亿大关。 这一成就的背后,离不开小米自研大模型MiM

热心网友
05.13
芒果TV会员破 7560 万,自研大模型上岗 30 多档节目,湖南广电AI转型成绩单来了
业界动态
芒果TV会员破 7560 万,自研大模型上岗 30 多档节目,湖南广电AI转型成绩单来了

第十三届中国网络视听大会揭晓:湖南广电发布年度关键数据,展现平台增长与AI应用深度 在第十三届中国网络视听大会上,湖南广播电视台(湖南广电)董事长龚政文正式公布了集团及旗下芒果TV在过去一年的核心运营成果。这份成绩单不仅反映了用户规模的强劲增长,更揭示了其在人工智能技术应用层面的实质性突破。 首先,

热心网友
04.22
京东首发自研AI毛绒玩具上市:情绪感知功能引热捧
业界动态
京东首发自研AI毛绒玩具上市:情绪感知功能引热捧

12月9日消息,近日,搭载京东JoyInside的京东京造AI毛绒玩具首批开售,部分款式火速售罄。作为京东首款自研AI玩具,该系列玩具采用无屏幕的实体交互形态,强调陪伴与启发,定位孩子们“可拥抱的成

热心网友
12.09
百度智能云开源Qianfan-VL大模型系列,搭载全自研AI计算芯片
科技数码
百度智能云开源Qianfan-VL大模型系列,搭载全自研AI计算芯片

9月22日消息,今日,百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL,并全面开源。即日起至10月10日,用户可在百度智能云千帆平台免费体验8B、70B模型。据介绍,Qianfan-V

热心网友
09.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

PPT制作技巧提升指南,打造专业演示魅力
AI教程
PPT制作技巧提升指南,打造专业演示魅力

掌握核心技巧可显著提升PPT专业度。使用模板奠定视觉基调,插入相关多媒体元素吸引注意力,运用动画效果引导视线强调重点。合理排版需确保信息密度适中、清晰易读。最后,反复练习演讲以熟练内容、把控节奏,让演示更具魅力。

热心网友
05.27
广东汇天航空航天科技公司信息查询与工商数据
AI资讯
广东汇天航空航天科技公司信息查询与工商数据

该公司经营范围显示其专注于高端制造与智能科技。核心业务包括智能出行与高端装备、机器人与智能制造、人工智能与数字技术,并具备技术贸易与全球市场视野。整体构建了以人工智能为核心,涵盖研发、制造、销售及服务的综合性高科技产业生态。

热心网友
05.27
免费AI PPT生成器如何高效提升演示文稿质量
AI教程
免费AI PPT生成器如何高效提升演示文稿质量

一、如何利用AI写PPT生成器免费提升你的演示效果 在信息爆炸的时代,演示文稿的质量直接决定了沟通的成败。免费的AI写PPT生成器,正成为职场人士、教育工作者提升效率、优化演示效果的智能伙伴。你可能尚未察觉,这类工具已深度融入各行各业的工作流中。 AI写PPT生成器免费的应用领域 那么,这些免费的A

热心网友
05.27
Hyperliquid链上USDC供应量突破65亿美元 全链网DeFi流动性创新高
web3.0
Hyperliquid链上USDC供应量突破65亿美元 全链网DeFi流动性创新高

Hyperliquid平台USDC供应量突破65亿美元,反映大量资本正涌入该生态,体现用户对其需求与信任。资金规模与生态活跃度、DeFi应用丰富度及基础设施成熟度紧密相关。供应增长为平台在公链竞争中增添筹码,关键在将资金转化为生态护城河,吸引核心应用形成正向循环。

热心网友
05.27
AI分析用户反馈提升产品开发效率的Kraftful工具
AI教程
AI分析用户反馈提升产品开发效率的Kraftful工具

Kraftful产品介绍:AI驱动的用户反馈分析平台 在当今竞争激烈的产品开发领域,如何从海量的用户反馈中高效提取有价值的洞察,是产品经理和开发团队面临的核心挑战。近期,一款名为Kraftful的智能分析平台备受瞩目,它不仅精准解决了这一痛点,更因其被行业领先的产品分析平台Amplitude收购,而

热心网友
05.27