首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
DeepSeek大模型价格全面下调使用成本降低

DeepSeek大模型价格全面下调使用成本降低

热心网友
36
转载
2026-05-12

大模型普惠的边界,正在被重新定义。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

4月26日,DeepSeek官方的一则API价格调整公告,在业内投下了一枚“深水冲击波”。其全系模型的输入缓存命中价格,直接降至首发价的十分之一。其中,面向企业级的DeepSeek-V4-Pro模型,更叠加了限时2.5折优惠,使得百万Tokens的输入缓存命中成本低至0.025元,创下了全球大模型定价的新低点。

根据官方定价页面,此次降价全面覆盖V4系列模型,核心调整聚焦于输入缓存命中这一高频场景。具体来看,主打高速低成本的DeepSeek-V4-Flash,其输入缓存命中价格从每百万Tokens 0.2元降至0.02元。而定位高性能旗舰的DeepSeek-V4-Pro,优惠力度更为惊人:原价1元/百万Tokens的缓存输入价格降至0.1元,在2026年5月5日前享受限时2.5折后,实际成本仅为0.025元。同时,其缓存未命中的输入价格从12元降至3元,输出价格从24元降至6元。

图片来源:DeepSeek官网

官方同时提及,为简化模型线,DeepSeek-Chat与DeepSeek-Reasoner两个模型名称将在日后弃用。出于兼容性考虑,它们实际上分别对应着DeepSeek-V4-Flash的非思考与思考两种模式。

对比调价前后数据,一个清晰的结论是:对于高频调用、长文本处理等场景,其成本降幅超过了90%。这意味着,RAG知识库、智能客服、文档深度分析等缓存命中率高的应用,将直接迎来商用成本的断崖式下跌。长期以来制约AI规模化落地的成本枷锁,有望被一举打破。

技术升级与生态协同,是降价的底气

DeepSeek此次大幅降价,绝非简单的市场策略,其背后是DeepSeek-V4系列模型的技术飞跃,以及与昇腾生态深度协同带来的底气。

就在降价公告发布前两天,4月24日,DeepSeek-V4预览版正式亮相,并同步开源了Pro与Flash两款模型。两者均支持高达100万token的超长上下文。其自研的稀疏注意力架构,从根本上大幅降低了推理所需的算力消耗。数据显示,Pro版处理单token的算力需求仅为前代V3.2的27%,KV缓存更是降至10%,实现了从模型底层开始的成本优化。

从参数看,DeepSeek-V4-Pro激活参数达490亿,预训练数据33万亿token,定位高性能旗舰;DeepSeek-V4-Flash激活参数130亿,预训练数据32万亿token,主打高速与低成本。

能力的提升更为显著。与前代模型相比,DeepSeek-V4-Pro的智能体(Agent)能力得到了质的增强。在Agentic Coding专项评测中,V4-Pro已达到当前开源模型的最佳水平,并在其他Agent相关评测中同样表现优异。据悉,该模型已成为DeepSeek内部员工使用的Agentic Coding模型。根据评测反馈,其使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6的非思考模式,但与Opus 4.6的思考模式仍存在一定差距。

在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛级代码等硬核能力测评中,V4-Pro则超越了所有已公开评测的开源模型,足以比肩世界顶级闭源模型。

相比之下,DeepSeek-V4-Flash在世界知识储备方面稍弱,但展现了接近的推理能力。得益于更小的模型参数和激活量,V4-Flash能够提供更为快捷、经济的API服务,成为高性价比之选。

此外,DeepSeek-V4还开创了一种新的注意力机制,在token维度进行压缩,并结合其自研的DSA稀疏注意力,实现了全球领先的长上下文处理能力,同时相比传统方法,大幅降低了对计算资源和显存的需求。

国产化信号释放,未来成本有望进一步下探

更值得关注的是,昇腾超节点全系列产品已宣布支持DeepSeek V4系列模型。这无疑释放了明确的国产化信号。

DeepSeek-V4在一份技术报告中透露:“我们在英伟达GPU和华&为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案。与强力的非融合基线相比,该方案在通用推理任务中实现了1.50-1.73倍的加速;在对延迟敏感的场景(例如强化学习rollout和高速Agent服务)中,最高可达1.96倍加速。”

DeepSeek方面强调,随着下半年昇腾超节点全系列产品的批量上市,Pro版的价格有望迎来进一步的大幅下调。这意味着,本次降价可能只是一个开始。

市场视角:打开AI应用规模化的新空间

DeepSeek-V4的发布与降价,迅速引发了市场分析机构的关注。

高盛发布的分析报告指出,DeepSeek V4的核心意义在于,能够以更低的成本支持更复杂的智能体应用落地,从而为AI应用的规模化打开了新的想象空间。对于其纳入昇腾生态,高盛认为这将进一步强化DeepSeek的成本竞争力,为更广泛的应用落地创造条件。报告还特别提到,在全球芯片供应持续紧张的背景下,中国顶尖AI模型向国产算力迁移的趋势,得到了头部玩家的明确背书。

高盛报告还援引市场消息称,腾讯和阿里正在洽谈以超过200亿美元的估值投资DeepSeek。作为参照,智谱和MiniMax的最新估值分别约为530亿美元和310亿美元。这一潜在的交易,折射出科技巨头对稀缺顶层AI能力的激烈争夺。

华泰证券则提供了另一个观察维度。其分析认为,市场容易将V4的突破简单理解为“降本压低算力、存储需求”,但更重要的边际变化在于:长上下文成本急剧下降后,复杂智能体、多文档分析、长周期任务、在线学习等此前受成本制约的高价值场景,其可用性将大幅提升。这很可能驱动推理调用量与存储访问频次的扩张,从而打开新的市场增量。

总而言之,DeepSeek此次行动,不仅是一次价格战,更是一次通过底层技术革新与生态协同,系统性降低AI使用门槛、重塑行业竞争格局的宣言。大模型普惠的时代,正加速到来。

来源:https://36kr.com/p/3784505673112582
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

DeepSeek识图功能上线 多模态视觉理解开启灰度测试
业界动态
DeepSeek识图功能上线 多模态视觉理解开启灰度测试

就在DeepSeek-V4震撼发布并引发行业广泛关注的短短五天后,官方正式启动了多模态识图功能的灰度测试。这标志着其多模态能力已从概念走向实践,进入了实质性的应用验证阶段。无论是移动端App还是网页版界面,输入栏都悄然新增了一个“识图模式”入口,旁边清晰地标注着“图片理解功能内测中”。这一步,完成了

热心网友
05.12
Mac效率神器DeepSeek与Raycast组合键使用指南
AI
Mac效率神器DeepSeek与Raycast组合键使用指南

想在Mac上实现超越系统原生的智能工作体验吗?让AI的思考能力无缝融入你的每一次搜索、每一次快捷键操作,甚至能“理解”你当前的工作上下文?这听起来充满未来感,但通过将DeepSeek模型与效率神器Raycast深度整合,你完全可以在本地构建一套灵活、强大且注重隐私的自动化解决方案。 一、安装并配置R

热心网友
05.12
DeepSeek V4注意力机制革新实现百万字文本高效压缩
AI
DeepSeek V4注意力机制革新实现百万字文本高效压缩

注意力机制正从追求“算得更快”转向“算得更少”。DeepSeekV4通过有损语义融合技术,将长文本压缩为少量概念块,结合全局略读与细节精读,显著降低了计算与显存开销。同时,通过向量加厚、分组输出投影等补偿机制缓解信息丢失,在效率与工程可行性上展现出优势。

热心网友
05.12
DeepSeek与美团LongCat破万亿参数模型释放了哪些行业信号
业界动态
DeepSeek与美团LongCat破万亿参数模型释放了哪些行业信号

近期DeepSeekV4与美团LongCat-2 0-Preview发布,参数均超万亿并支持长上下文。DeepSeekV4成功迁移至华为昇腾,美团全程基于国产芯片训练。这标志着国内AI企业正从依赖国外生态转向自主构建算力底座,通过底层创新攻克硬件适配、软件生态及集群稳定性等难题,推动国产大模型从“能用”向“好用”演进。

热心网友
05.12
苹果M4芯片运行DeepSeek R1速度实测抢先看
AI
苹果M4芯片运行DeepSeek R1速度实测抢先看

在苹果M4芯片上运行DeepSeek R1模型,Qwen2 5-14B-Instruct-4bit(MLX引擎)性能表现最佳,生成速度达到28 tokens s、首token延迟仅0 4秒、内存占用18 7GB;其他版本性能依次为:Unsloth优化6bit版(27 tokens s)、蒸馏4bit

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

赛车方向盘按键功能详解与高效设置指南
游戏资讯
赛车方向盘按键功能详解与高效设置指南

初次接触赛车模拟器,或是观看职业赛事的方向盘特写镜头,你一定会被那些密集排列的旋钮与按键所吸引。这绝非单纯的视觉装饰,每一个控件都承载着在毫秒间精准调控车辆动态的关键使命。从牵引力控制到刹车平衡,从引擎图谱到实时数据,这些为极速盲操而生的设计,正是区分业余爱好者与专业车手的重要标志。熟练掌握其功能并

热心网友
05.12
OKX欧易新手教程:USDT购买入金下单划转正确顺序详解
web3.0
OKX欧易新手教程:USDT购买入金下单划转正确顺序详解

本文介绍了在OKX欧易平台首次购买USDT的完整流程,重点强调了入金、下单、划转三个关键步骤的正确顺序。内容涵盖了从法币充值到币币交易,再到资产划转至资金账户的详细操作与注意事项,旨在帮助新手用户理清逻辑,避免因操作顺序错误导致交易失败或资金滞留,实现顺畅的首次加密货币购买体验。

热心网友
05.12
Malady退赛1W核心赛S1原因解析 专注备战BLAST Slam S7
游戏资讯
Malady退赛1W核心赛S1原因解析 专注备战BLAST Slam S7

Dota 2 7 41c版本现已更新,对于希望使用五号位英雄上分的玩家而言,当前环境中有几位英雄的表现尤为突出。根据Yandex战队职业选手Malady在最新视频中的深度解析,发条技师、工程师以及树精卫士,均是此版本中极具上分潜力的强势辅助选择。 除了分享强势辅助英雄推荐,Malady也透露了队伍近

热心网友
05.12
电竞世界杯2026年举办地或将改为法国
游戏资讯
电竞世界杯2026年举办地或将改为法国

近日,一则关于2026年电竞世界杯可能更换举办地的消息在电竞社区引发热议。据独联体知名爆料人harumi透露,原定于沙特阿拉伯利雅得举行的本届赛事,存在将主办地转移至法国的可能性。这一潜在变动,无疑为这项全球顶级电竞赛事的最终落地增添了新的看点与悬念。 目前,电竞世界杯赛事组委会尚未对此传闻发布任何

热心网友
05.12
OKX官网网址真伪识别教程 如何安全访问欧易交易所与帮助中心
web3.0
OKX官网网址真伪识别教程 如何安全访问欧易交易所与帮助中心

本文介绍了在访问OKX(欧易)平台时,如何准确识别其官方网站、帮助中心及处理页面跳转问题。重点分析了官方域名的核心特征与常见后缀,并提供了遇到非官方页面时的安全验证步骤与处理建议,旨在帮助用户有效规避风险,确保资产与信息安全。

热心网友
05.12