6月29日,DeepSeek向用户发送了一封升级提醒邮件,确认V4正式版计划于7月中旬正式上线。此次更新不仅是功能优化与性能提升,配套的API定价策略也将迎来调整,首次引入峰谷定价机制。简单来说,高峰调用时段价格将直接翻倍。
具体价格有多高?我们来看详细数据:DeepSeek V4 Pro版本,百万Tokens输入(缓存命中)平时费用为0.025元,高峰时段涨至0.05元;缓存未命中输入平时3元,高峰涨至6元;输出方面,平时6元,高峰直接升至12元。高峰时段定义为每天9:00-12:00和14:00-18:00(北京时间)。Flash版本价格相对亲民:缓存命中输入平时0.02元,高峰0.04元;缓存未命中输入平时1元,高峰2元;输出平时2元,高峰4元。

DeepSeek团队明确表示,实际调价前24小时会通过邮件通知用户。若继续使用,即视为同意新计费方式;如不同意,用户可以选择退出并申请退费。

回顾V4预览版,它早在4月24日就已上线,提供Pro和Flash两个版本,标配百万字上下文能力,支持思考模式切换、Json输出、工具调用、对话前缀续写等企业级功能。覆盖开发、办公、法律、金融等复杂场景,表现游刃有余。
预览版与前代模型相比,Agent能力提升显著。据了解,它已经成为DeepSeek内部员工使用的Agentic Coding模型,评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但与Opus 4.6思考模式相比仍有差距。
至于Flash版本,世界知识储备略逊于Pro,但推理能力接近Pro。由于参数与激活量更小,Flash能够提供更快速、更经济的API服务。在Agent测评中,Flash在简单任务上与Pro旗鼓相当,而在高难度任务上则存在差距。
在定价体系上,预览版上线之初,Flash版缓存命中输入每百万Token 0.2元、未命中1元、输出2元;Pro版缓存命中1元、未命中12元、输出24元。当时DeepSeek就提示,受限于高端算力,Pro版服务吞吐能力有限,但随着下半年昇腾超节点全系列产品批量上市,Pro版价格有望大幅下调。
果然,4月26日DeepSeek发布了API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一,Pro版本更叠加限时2.5折优惠。百万Tokens输入缓存命中低至0.025元,创下全球大模型价格新低。根据最新API定价页面,上一轮降价覆盖V4全系列,核心调整集中于输入缓存命中场景。Flash输入缓存命中从0.2元降至0.02元;Pro原价1元的缓存输入降至0.1元,叠加2.5折限时特惠,实际仅0.025元——但请注意,这属于限时调价。
有分析人士认为,此次正式版峰谷定价并非单纯涨价,而是算力资源稀缺背景下的标准化调度工具。OpenRouter聚合平台数据显示,仅DeepSeek V4 Flash单模型周调用量已突破4.66万亿Tokens,连续六周登顶全球单模型调用榜首,但环比下滑6%。企业集中办公时段的算力挤兑、接口超时频发,已成为常态。
DeepSeek此前多次出现线上服务波动,根源在于低价策略吸引了海量流量,算力集群负载长期触及红线。分时涨价本质上是用价格杠杆分流可离线处理、批量运算的非紧急任务,从而保障金融、代码研发、实时智能体等高优先级业务在工作时段的服务稳定性。
正式版到来之前,DeepSeek还为V4系列推出了一个名为DSpark的更新——一种投机解码框架,能将推理速度提升60%-85%。尽管此更新面向预览版,但很可能预示着正式版在工程效率和推理成本上会有更优表现。
近期,关于DeepSeek的融资消息不绝于耳。6月16日,有消息称DeepSeek完成首轮外部融资,募资总额超过500亿元,投后估值突破3380亿元。据投资机构透露,本轮融资中,创始人梁文锋出资约200亿元,为最大单一出资方;腾讯出资约100亿元;宁德时代体系出资约50亿元(含宁德时代及溥泉资本);网易、京东、Monolith砺思资本、IDG资本分别出资约30亿元;正心谷投资、拾象科技分别出资约15亿元。
与此同时,DeepSeek正在大规模招人。招聘信息显示,计划将所有部门的规模扩大至少一倍,覆盖算法、研发、运维、产品、数据工程师以及职能部门等7大类,共开放33个岗位,工作地点包括北京和杭州,所有岗位均接受实习。
长期来看,V4正式版将补齐预览版的商用短板,叠加充足的资本与人才储备,DeepSeek有望进一步缩小与海外头部闭源模型在商业化方面的差距。
