DeepSeek发布V3.2-Exp实验版模型
9月29日,DeepSeek正式推出DeepSeek-V3.2-Exp实验性版本。该版本是通往新一代AI架构的重要过渡,在V3.1-Terminus的基础上创新性地采用了DeepSeek Sparse Attention技术,有效提升了长文本处理的训练和推理效率。
目前,DeepSeek所有平台包括App、网页端和小程序都已同步升级为V3.2-Exp版本。与此同时,官方宣布API调用价格进行大幅调整,降价幅度超过50%。
更新后的API定价方案
输入缓存命中:0.2元/次
输入未缓存命中:2元/次
输出:3元/次

特别值得关注的是,本次升级首次实现的DeepSeek Sparse Attention(DSA)技术采用细粒度稀疏注意力机制,在保证模型输出质量的前提下,显著提升了长文本处理的效率。

为确保数据严谨性,DeepSeek严格遵循了与V3.1-Terminus相同的训练设置。经公开评测数据集测试,V3.2-Exp保持了与上个版本相当的性能表现。

开源社区支持
DeepSeek-V3.2-Exp现已同步开源至Huggingface和ModelScope平台:
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp

