游乐游手机版
首页/业界动态/文章详情

DeepSeek V4正式版7月中旬发布 峰谷定价API百万上下文双版本

时间:2026-06-30 14:07
DeepSeekV4正式版将于2026年7月中旬上线,同步推出峰谷定价API,高峰时段价格翻倍。V4系列包含V4-Pro与V4-Flash两个版本,均采用MoE架构并支持百万token上下文,引入全新注意力机制,大幅降低推理计算量与显存占用。

DeepSeek团队已正式确认V4版本的上线时间——2026年7月中旬,这款备受业界期待的正式版将如期与用户见面。根据现有信息,此次发布在功能完整度、响应效率和系统稳定性方面均实现了显著提升。

更值得关注的是,与正式版一同推出的全新API计费机制——峰谷定价模式。简单来说,系统会根据调用时段的繁忙程度动态调整价格:上午9点至12点、下午2点至6点的高峰时段,费用翻倍;其余时段则维持预览版的基准费率。这套定价逻辑旨在通过价格杠杆引导算力资源均衡使用,缓解高峰拥堵,从而保障服务的持续稳定运行。

具体价格方面,高峰时段轻量版V4-Flash的输入费用为每百万token两元,缓存命中时可降至0.02元,输出费用为每百万token四元。旗舰版V4-Pro因算力需求更高,输入定价为每百万token六元(缓存命中时为一元),输出为每百万token十二元。对于高频调用用户而言,合理规划调用时段可大幅节省成本,差异十分显著。

算力资源的分配既是技术挑战,也是经济课题。峰谷定价背后的设计思路,实际上也在回应一个更深层的问题:不同类型的模型究竟更适合哪些应用场景?

回顾今年4月24日开放的DeepSeek V4预览版,该版本同时进行了开源。其最突出的亮点是“百万级上下文”——支持最长一百万token的上下文处理能力。在智能体协同、知识理解与复杂推理等关键维度上,预览版的表现已位居国内乃至开源模型的前列。

V4系列按规模分为两个版本,均采用MoE混合专家架构。旗舰型号V4-Pro总参数量达1.6万亿,单次激活参数约490亿,专为高复杂度任务设计;轻量版V4-Flash总参数2840亿,激活参数130亿,在性能与计算成本间取得了更务实的平衡。两个版本均原生支持百万token上下文,并遵循MIT开源协议,允许开发者自由商用及二次开发。

技术层面上,V4系列引入的全新注意力机制值得重点关注。该机制在token维度实现了高效压缩,结合DSA稀疏注意力方案,大幅降低了计算负载和显存占用。实测数据显示,在处理百万token任务时,推理计算量仅为前代V3.2的27%,显存占用更是降至十分之一。这一优化对于长文本处理、智能体应用和代码生成等场景,具有实质性的价值。

最后值得一提的是:随着下半年新一代昇腾950芯片的大规模交付,V4-Pro版本的综合使用成本还将进一步降低。算力成本的变化远未尘埃落定。目前,V4预览版已可通过官方网站、移动应用、API接口及本地化部署等多种方式接入,感兴趣的开发者不妨提前体验。

来源:https://ai.zol.com.cn/1207/12075935.html
上一篇知识管理系统排行榜:5大主流产品深度对比 下一篇AI商业化成本价值悖论 高估值下企业精细化投入管理
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
中关村论坛年会AI未来论坛聚焦跃迁投资共生
业界动态 · 2026-06-30

中关村论坛年会AI未来论坛聚焦跃迁投资共生

3月30日,中关村国际创新中心成为人工智能领域瞩目的焦点——2026中关村论坛年会人工智能主题日的重要活动“AI未来论坛:跃迁·投资·共生”在此正式拉开帷幕。本次论坛传递出一个清晰的信号:人工智能正从技术突破迈向产业落地的关键阶段,而资本信心的背后,映射出产业演进的明确风向。海淀区明确表态,将以开放

泰国CP AXTRA与菜鸟合作复制中国闪购模式
业界动态 · 2026-06-30

泰国CP AXTRA与菜鸟合作复制中国闪购模式

3月27日,菜鸟集团与泰国正大集团旗下核心零售企业CP AXTRA正式签署战略合作协议。此次合作的核心目标十分明确:菜鸟将充分发挥自身在数字供应链技术、仓储自动化领域的技术优势,以及多年深耕海外仓的运营经验,全力支持CP AXTRA在泰国及东盟国家打造一套线上线下一体化的即时零售物流网络。 CP A

云英谷科技VTDR6135参评SID中国区显示行业奖
业界动态 · 2026-06-30

云英谷科技VTDR6135参评SID中国区显示行业奖

云英谷科技携国内首颗支持1 5KRealRGB显示的AMOLED驱动芯片VTDR6135参评SID中国区显示行业奖。该芯片已量产并用于高端手机,采用28nm制程,支持240Hz刷新率,集成自研APDBI技术与烧屏补偿机制。在ICDT2026大会C06展位展示。

马斯克警告柏林工厂扩张受外部干预需保自主
业界动态 · 2026-06-30

马斯克警告柏林工厂扩张受外部干预需保自主

3月1日消息,特斯拉CEO埃隆·马斯克向柏林工厂的员工传递了一个信号:如果工厂无法在“不受外界干扰”的环境下自主运转,那么后续的扩建计划可能需要延后。这番话源自一段提前录制的视频,由马斯克在得克萨斯州奥斯汀与格伦海德工厂厂长安德烈·蒂里格共同完成录制,随后在柏林超级工厂内部播放给员工观看。 这段视频

高通钱堃博鳌谈构建用户中心智能生态
业界动态 · 2026-06-30

高通钱堃博鳌谈构建用户中心智能生态

高通钱堃指出,AI正重塑人机交互,2026年称为智能体之年。6G被设计为AI原生系统,2026年为标准化关键年,高通已与近60家伙伴达成共识。高通构建以用户为中心的智能生态系统,通过端-边-云协同架构,结合5G 6G技术,并推出AI加速计划,推动个人、物理、工业AI规模化应用。