DeepSeek发布了V3.2的标准版与V3.2-Speciale深度学习版本,最新评测结果显示:
V3.2在128k上下文场景下的表现与GPT-5不相上下
V3.2-Speciale在MMLU、HumanEval等基准测试中与Gemini 3 Pro持平,并在IMO2025盲测中获得83.3%的金牌分数线
转正稀疏注意力机制成为核心升级亮点:通过目录式路由token,将长文本计算复杂度从O(n²)降至O(n),显存占用降低40%,推理速度提升2.2倍,首次在开源模型中实现百万token的单卡推理能力
在后训练环节中,研发团队将超过10%的集群算力投入强化学习,采用组对强化学习与多数投票机制,使模型在代码、数学与工具调用任务上逼近闭源对手。V3.2-Speciale取消了“思考长度惩罚”机制,鼓励更长链式的推理过程,平均输出token较Gemini 3 Pro高出32%,同时准确率提升了4.8个百分点
模型已正式上线GitHub和Hugging Face平台,权重采用Apache 2.0开源协议,支持商业化应用。DeepSeek表示,下一步将开源长文本DSA内核与强化学习训练框架,持续将技术优势转化为社区基础设施。行业评论指出,若后续版本保持迭代节奏,开源阵营有望在2026年前实现“长文本+推理”双轨领先
