今年大模型领域最不缺少热点新闻,但DeepSeek宣布涨价这件事,确实令人感到意外。
最近,不少开发者收到了DeepSeek的官方邮件通知:下个月(7月),DeepSeek V4正式版本即将上线。然而,真正引起关注的焦点在于,高峰时段的API调用价格将翻倍。具体来看,输入token(缓存命中)、输入token(缓存未命中)、输出token这三个维度,均将执行×2的定价策略。
不过话说回来,DeepSeek“价格屠夫”的行业标签并非浪得虚名——即便高峰时段价格上调,综合计算后用户依然觉得划算。多数开发者的反应与0xSupergemma创始人Jun Song类似:
真·反常:DeepSeek V4正式版高峰时段价格翻倍
DeepSeek模型提价,这确实是破天荒的头一回。
这家公司给市场留下的印象太过鲜明:极致低价。而且是那种足以将竞争对手价格体系砸出一个坑的低价。
从V3到R1再到预览版V4,DeepSeek每次亮相都让人眼前一亮——不仅模型性能持续突破,价格始终是其最锋利的武器。今年4月,V4预览版发布时本就定价很低,仅上线2天,DeepSeek又宣布了一次大幅降价:在输入输出打2.5折的基础上,缓存命中的输入再享受折上折至1折,且该折扣无时间限制。
当时DeepSeek研究员陈德里在社交平台明确表示,“输入缓存属于永久降价”。
因此,这次收到涨价邮件后,许多人自然会发出意料之外的惊叹。但细看细则会发现,涨价仅局限于高峰时段:世界协调时凌晨1:00-4:00及上午6:00-10:00,其余时段依然维持原来的地板价。
这种并非整体提价、而是通过高峰期调价来管理负载的做法,释放出的信号颇为微妙——“我也想继续便宜,但朋友们,实在有点撑不住了”。
回看DeepSeek近期的系列动作,会发现这次提价其实早有征兆。算力紧张是真实痛点,自建数据中心也已是箭在弦上。
4月份,DeepSeek已开始招聘数据中心高级运维工程师和高级交付经理,负责“数据中心从立项、建设、交付至运营的全流程项目管理”。选址地点定为乌兰察布——国家“东数西算”工程八大枢纽节点之一,也是内蒙古算力集群的核心区域。自那时起,这家以“低成本算法奇迹”闻名的公司,便将数据中心建设提升到了战略层级。
本月月初,DeepSeek又增设了“IDC设计规划工程师”岗位,招募土木方向人才。这类算力基建与通信基建的核心技术岗,负责数据中心从前期选址、方案、布局到施工图、落地配套的全流程规划设计。在前两天的大规模招聘中,超算集群研发工程师等岗位也位列其中。
DeepSeek V4预览版:这几个高频被提及的问题
但涨价绝不意味着空涨。DeepSeek在邮件中明确表明:此次更新将带来更多功能优化与性能提升。
推特网友@teortaxesTex也发现了一些端倪。
除了性能提升,已经运行两个多月的V4预览版积累了大量的用户反馈,以下几个问题被反复提及。
第一个问题是幻觉率偏高。V4预览版在某些任务中会频繁给出非常自信但实际并不可靠的答案。日常对话场景尚可,但对于写代码、查资料、做研究的人来说,这一点体验较差。
第二个问题是超长上下文的实际稳定性仍有待收敛。尽管宣传上声称“百万上下文窗口”,但真实体验却不尽人意。上下文累积、复杂推理或多轮工具调用叠加时容易出现不稳定,甚至直接崩溃,在agent workflow(多工具调用、多轮决策)场景中尤其突出。当然,这也是MoE模型的共性问题。
第三个期待是复杂代码任务能表现更优。一方面,面对复杂代码任务时,V4有时过于保守;另一方面,有开发者反馈在真实代码审查测试中,它会出现明显的“过度标记问题”——将大量正常逻辑当作潜在bug进行提示。
此外,DeepSeek在文本与推理方面已经具备足够的影响力,大家都在期待它推出原生多模态功能,并将价格进一步压低。
综合来看,用户的核心诉求其实相当集中:能力要强、价格要低、速度要快、上下文要长、代码要准。最好多模态也能一并补齐。
你看,需求并不多,只是一些朴实的小愿望。不过这也挺好,正是推动DeepSeek持续进步的动力所在。
