9月29日,DeepSeek正式推出V3.2-Exp实验性模型,该版本已在Huggingface与魔搭平台开源。目前官方App、网页端及小程序都已同步更新至V3.2-Exp版本,同时API服务价格也迎来大幅下调。
据介绍,DeepSeek-V3.2-Exp是通向新一代架构的过渡版本。在V3.1-Terminus基础上,该版本创新性地采用了DeepSeek Sparse Attention(DSA)稀疏注意力机制,重点优化了长文本处理时的训练与推理效率。这种细粒度稀疏注意力机制在不影响模型性能的前提下,显著提升了长文本的处理速度。
根据华为官方公众号披露,昇腾计算平台已对vLLM/SGLang等推理框架完成适配部署,实现对DeepSeek-V3.2-Exp的即日支持,并向开发者开源全部推理代码及算子实现。
研发团队表示,新模型开发过程中采用了TileLang高级语言进行快速原型开发,使得探索性研究更加高效。最终开源版本同时包含TileLang和CUDA两种算子实现,建议研究型项目优先使用TileLang版本以便调试和迭代。

随着模型服务成本的大幅降低,DeepSeek对API定价进行了相应调整。新版API调用费用较之前降低了50%以上,为开发者提供了更具性价比的服务选择。

回顾此前进展:8月21日发布的DeepSeek-V3.1首创混合推理架构,支持思考与非思考两种模式,在推理效率和Agent能力方面都有显著提升。9月22日推出的Terminus版本进一步优化了语言一致性和Agent性能,使模型表现更加稳定。
为确保实验可靠性,研发团队特意保持V3.2-Exp与V3.1-Terminus相同的训练设置。经各类公开评测集验证,两个版本在各项性能指标上基本保持相当水平。
