近日,众多DeepSeek用户陆续收到官方发出的升级提醒邮件。邮件内容显示,DeepSeek V4正式版预计于7月中旬正式发布,本次迭代将带来多项功能优化与性能提升,进一步满足用户对AI大模型的高效使用需求。

与此同时,为更合理地分配计算资源并增强服务稳定性,正式版上线后将对API定价策略进行调整,引入峰谷定价模式。简单来说,就像电力行业那样——高峰时段价格较高,低谷时段价格较低。
DeepSeek V4 Pro与V4 Flash模型的日常价格维持不变,但在高峰时段API价格将调整为平时的2倍。高峰时段为每日上午9点至12点、下午2点至6点。具体来看,DeepSeek V4 Pro在高峰时段缓存命中输入价格为0.05元/百万Tokens,缓存未命中输入价格为6元/百万Tokens,输出价格为12元/百万Tokens。V4 Flash高峰时段缓存命中输入价格为0.04元/百万Tokens,缓存未命中输入价格为2元/百万Tokens,输出价格为4元/百万Tokens。
有网友感叹:“这是峰谷收费,不是阶梯收费。未来Token真和电能一样,都是资源——高频消耗时段价格贵,低频时段价格低。真没想到AI大模型发展得这么快。” 话说回来,这种定价思路其实很合理:资源紧张时适当提价,既能引导需求分流,也能保障真正有需要的用户获得稳定服务。
回顾一下,今年4月DeepSeek-V4预览版已正式上线并开源。DeepSeek-V4具备百万字超长上下文能力,在Agent能力、世界知识及推理性能方面均达到国内及开源领域的领先水平。该模型根据参数量分为两个版本:DeepSeek-V4-Pro与DeepSeek-V4-Flash。
值得关注的是,DeepSeek官方强调,DeepSeek-V4开创了一种全新的注意力机制,在Token维度上进行压缩,并搭配DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文处理能力,同时显著降低了对计算资源与显存的需求。从现在起,1M(一百万)上下文将成为DeepSeek所有官方服务的标配。这意味着,大模型在长文本处理、复杂推理等应用场景下的能力又向前迈出了重要一步。
