9月29日最新动态,DeepSeek正式推出DeepSeek-V3.2-Exp测试版本,这一实验性模型将为用户带来全新体验。

作为升级下一代架构的关键一跳,V3.2-Exp在V3.1-Terminus版本基础上创新整合了DeepSeek稀疏注意力机制(DSA),专门针对长文本处理效率进行了突破性的优化实验。

DeepSeek首创的精细粒度稀疏注意力机制(DSA)实现了技术突破,在保持模型输出品质不变的前提下,显著提升了长文本训练的运算效率。

为确保评估的严谨性,开发团队特地将V3.2-Exp的训练参数与V3.1-Terminus保持完全一致。经过多领域公开测试集的全面验证,两个版本的核心表现基本持平。

目前,DeepSeek全平台(包括App、网页端和小程序)已同步更新至V3.2-Exp版本。
此次升级特别降低了API调用费用,开发者使用成本直降50%以上,带来更实惠的开发体验。
需要注意的是,尽管V3.2-Exp已在标准化测试中表现优异,但仍需在实际应用场景中接受大规模验证。为此,平台特别保留了V3.1-Terminus版本的API接口,方便用户进行对比测试。
DeepSeek-V3.2-Exp现已开放下载,可在Huggingface和ModelScope平台获取开源代码。
