游乐游手机版
首页/业界动态/文章详情

DeepSeek大模型价格全面下调使用成本降低

时间:2026-05-12 08:29
大模型普惠的边界,正在被重新定义。 4月26日,DeepSeek官方的一则API价格调整公告,在业内投下了一枚“深水冲击波”。其全系模型的输入缓存命中价格,直接降至首发价的十分之一。其中,面向企业级的DeepSeek-V4-Pro模型,更叠加了限时2 5折优惠,使得百万Tokens的输入缓存命中成本

大模型普惠的边界,正在被重新定义。

4月26日,DeepSeek官方的一则API价格调整公告,在业内投下了一枚“深水冲击波”。其全系模型的输入缓存命中价格,直接降至首发价的十分之一。其中,面向企业级的DeepSeek-V4-Pro模型,更叠加了限时2.5折优惠,使得百万Tokens的输入缓存命中成本低至0.025元,创下了全球大模型定价的新低点。

根据官方定价页面,此次降价全面覆盖V4系列模型,核心调整聚焦于输入缓存命中这一高频场景。具体来看,主打高速低成本的DeepSeek-V4-Flash,其输入缓存命中价格从每百万Tokens 0.2元降至0.02元。而定位高性能旗舰的DeepSeek-V4-Pro,优惠力度更为惊人:原价1元/百万Tokens的缓存输入价格降至0.1元,在2026年5月5日前享受限时2.5折后,实际成本仅为0.025元。同时,其缓存未命中的输入价格从12元降至3元,输出价格从24元降至6元。

图片来源:DeepSeek官网

官方同时提及,为简化模型线,DeepSeek-Chat与DeepSeek-Reasoner两个模型名称将在日后弃用。出于兼容性考虑,它们实际上分别对应着DeepSeek-V4-Flash的非思考与思考两种模式。

对比调价前后数据,一个清晰的结论是:对于高频调用、长文本处理等场景,其成本降幅超过了90%。这意味着,RAG知识库、智能客服、文档深度分析等缓存命中率高的应用,将直接迎来商用成本的断崖式下跌。长期以来制约AI规模化落地的成本枷锁,有望被一举打破。

技术升级与生态协同,是降价的底气

DeepSeek此次大幅降价,绝非简单的市场策略,其背后是DeepSeek-V4系列模型的技术飞跃,以及与昇腾生态深度协同带来的底气。

就在降价公告发布前两天,4月24日,DeepSeek-V4预览版正式亮相,并同步开源了Pro与Flash两款模型。两者均支持高达100万token的超长上下文。其自研的稀疏注意力架构,从根本上大幅降低了推理所需的算力消耗。数据显示,Pro版处理单token的算力需求仅为前代V3.2的27%,KV缓存更是降至10%,实现了从模型底层开始的成本优化。

从参数看,DeepSeek-V4-Pro激活参数达490亿,预训练数据33万亿token,定位高性能旗舰;DeepSeek-V4-Flash激活参数130亿,预训练数据32万亿token,主打高速与低成本。

能力的提升更为显著。与前代模型相比,DeepSeek-V4-Pro的智能体(Agent)能力得到了质的增强。在Agentic Coding专项评测中,V4-Pro已达到当前开源模型的最佳水平,并在其他Agent相关评测中同样表现优异。据悉,该模型已成为DeepSeek内部员工使用的Agentic Coding模型。根据评测反馈,其使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6的非思考模式,但与Opus 4.6的思考模式仍存在一定差距。

在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛级代码等硬核能力测评中,V4-Pro则超越了所有已公开评测的开源模型,足以比肩世界顶级闭源模型。

相比之下,DeepSeek-V4-Flash在世界知识储备方面稍弱,但展现了接近的推理能力。得益于更小的模型参数和激活量,V4-Flash能够提供更为快捷、经济的API服务,成为高性价比之选。

此外,DeepSeek-V4还开创了一种新的注意力机制,在token维度进行压缩,并结合其自研的DSA稀疏注意力,实现了全球领先的长上下文处理能力,同时相比传统方法,大幅降低了对计算资源和显存的需求。

国产化信号释放,未来成本有望进一步下探

更值得关注的是,昇腾超节点全系列产品已宣布支持DeepSeek V4系列模型。这无疑释放了明确的国产化信号。

DeepSeek-V4在一份技术报告中透露:“我们在英伟达GPU和华&为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案。与强力的非融合基线相比,该方案在通用推理任务中实现了1.50-1.73倍的加速;在对延迟敏感的场景(例如强化学习rollout和高速Agent服务)中,最高可达1.96倍加速。”

DeepSeek方面强调,随着下半年昇腾超节点全系列产品的批量上市,Pro版的价格有望迎来进一步的大幅下调。这意味着,本次降价可能只是一个开始。

市场视角:打开AI应用规模化的新空间

DeepSeek-V4的发布与降价,迅速引发了市场分析机构的关注。

高盛发布的分析报告指出,DeepSeek V4的核心意义在于,能够以更低的成本支持更复杂的智能体应用落地,从而为AI应用的规模化打开了新的想象空间。对于其纳入昇腾生态,高盛认为这将进一步强化DeepSeek的成本竞争力,为更广泛的应用落地创造条件。报告还特别提到,在全球芯片供应持续紧张的背景下,中国顶尖AI模型向国产算力迁移的趋势,得到了头部玩家的明确背书。

高盛报告还援引市场消息称,腾讯和阿里正在洽谈以超过200亿美元的估值投资DeepSeek。作为参照,智谱和MiniMax的最新估值分别约为530亿美元和310亿美元。这一潜在的交易,折射出科技巨头对稀缺顶层AI能力的激烈争夺。

华泰证券则提供了另一个观察维度。其分析认为,市场容易将V4的突破简单理解为“降本压低算力、存储需求”,但更重要的边际变化在于:长上下文成本急剧下降后,复杂智能体、多文档分析、长周期任务、在线学习等此前受成本制约的高价值场景,其可用性将大幅提升。这很可能驱动推理调用量与存储访问频次的扩张,从而打开新的市场增量。

总而言之,DeepSeek此次行动,不仅是一次价格战,更是一次通过底层技术革新与生态协同,系统性降低AI使用门槛、重塑行业竞争格局的宣言。大模型普惠的时代,正加速到来。

来源:https://36kr.com/p/3784505673112582
上一篇AI技术如何重塑网络电影行业新生态 下一篇AI大模型赋能工业制造 开启工厂智能化新纪元
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
中关村论坛年会AI未来论坛聚焦跃迁投资共生
业界动态 · 2026-06-30

中关村论坛年会AI未来论坛聚焦跃迁投资共生

3月30日,中关村国际创新中心成为人工智能领域瞩目的焦点——2026中关村论坛年会人工智能主题日的重要活动“AI未来论坛:跃迁·投资·共生”在此正式拉开帷幕。本次论坛传递出一个清晰的信号:人工智能正从技术突破迈向产业落地的关键阶段,而资本信心的背后,映射出产业演进的明确风向。海淀区明确表态,将以开放

泰国CP AXTRA与菜鸟合作复制中国闪购模式
业界动态 · 2026-06-30

泰国CP AXTRA与菜鸟合作复制中国闪购模式

3月27日,菜鸟集团与泰国正大集团旗下核心零售企业CP AXTRA正式签署战略合作协议。此次合作的核心目标十分明确:菜鸟将充分发挥自身在数字供应链技术、仓储自动化领域的技术优势,以及多年深耕海外仓的运营经验,全力支持CP AXTRA在泰国及东盟国家打造一套线上线下一体化的即时零售物流网络。 CP A

云英谷科技VTDR6135参评SID中国区显示行业奖
业界动态 · 2026-06-30

云英谷科技VTDR6135参评SID中国区显示行业奖

云英谷科技携国内首颗支持1 5KRealRGB显示的AMOLED驱动芯片VTDR6135参评SID中国区显示行业奖。该芯片已量产并用于高端手机,采用28nm制程,支持240Hz刷新率,集成自研APDBI技术与烧屏补偿机制。在ICDT2026大会C06展位展示。

马斯克警告柏林工厂扩张受外部干预需保自主
业界动态 · 2026-06-30

马斯克警告柏林工厂扩张受外部干预需保自主

3月1日消息,特斯拉CEO埃隆·马斯克向柏林工厂的员工传递了一个信号:如果工厂无法在“不受外界干扰”的环境下自主运转,那么后续的扩建计划可能需要延后。这番话源自一段提前录制的视频,由马斯克在得克萨斯州奥斯汀与格伦海德工厂厂长安德烈·蒂里格共同完成录制,随后在柏林超级工厂内部播放给员工观看。 这段视频

高通钱堃博鳌谈构建用户中心智能生态
业界动态 · 2026-06-30

高通钱堃博鳌谈构建用户中心智能生态

高通钱堃指出,AI正重塑人机交互,2026年称为智能体之年。6G被设计为AI原生系统,2026年为标准化关键年,高通已与近60家伙伴达成共识。高通构建以用户为中心的智能生态系统,通过端-边-云协同架构,结合5G 6G技术,并推出AI加速计划,推动个人、物理、工业AI规模化应用。