阿里云百炼宣布DeepSeek-V4-Pro模型隐式缓存降价
行业里关于大模型推理成本的话题,总能牵动不少人的神经。这不,最新消息来了。根据全链网的报道,阿里云在其大模型服务平台“百炼”上,对DeepSeek-V4-Pro模型的一项关键计费项做出了调整。
适合国内用的虚拟币交易所
具体来说,从北京时间2026年4月29日深夜23点59分59秒开始,DeepSeek-V4-Pro模型的“隐式缓存”计费单价将正式下调。调整之后的价格,定在了1元每百万Token。这个数字,对于经常处理海量文本请求的开发团队而言,无疑是个值得关注的变化。
当然,要理解这次调价的意义,首先得搞清楚“隐式缓存”到底是怎么一回事。简单打个比方,这就像给大模型配了一个“记忆库”。当用户向模型发起请求时,如果提出的问题或指令与“记忆库”中已有的内容高度相似,系统就会直接调用缓存的结果,而不是让模型从头到尾重新运算一遍。这样一来,不仅响应速度更快,计算资源的消耗也大幅降低。
那么,计费规则是如何对应的呢?规则很清晰:只有在请求成功“命中”缓存时,这部分输入的Token才会按照新的、更优惠的“cached_token”单价来计费。反之,如果请求没有命中缓存,模型依然需要执行完整的推理过程,这部分输入的Token则继续按照标准的“input_token”价格来计算。所以,这次价格调整,精准地聚焦在了“缓存命中”这个环节上,旨在激励和回馈那些能够有效利用缓存机制来优化成本的应用场景。
需要特别注意的是,此次降价动作仅限于“隐式缓存”部分。DeepSeek-V4-Pro模型本身的基础推理价格,也就是标准输入输出(Input/Output)的单价,在此次公告中保持不变。这意味着,阿里云正在通过细分计费项的方式,进行更精细化的成本优化引导,把降价的“好钢”用在了提升重复计算效率的“刀刃”上。
纵观整个市场,大模型服务的竞争早已超越了单纯的性能比拼,进入了成本、效率和易用性综合较量的阶段。此次百炼平台针对特定模型、特定功能进行价格调整,反映出云厂商正在深入业务场景,通过技术手段(如缓存优化)来为用户创造实实在在的成本下降空间。对于依赖DeepSeek-V4-Pro模型、且请求模式中存在较高重复度的企业来说,这无疑是一个降低运营成本、提升投资回报率的积极信号。接下来,如何设计应用架构以最大化缓存命中率,就成了技术团队值得深入研究的课题。

