近期,开源模型与闭源模型之间的性能差距似乎进一步拉大,然而DeepSeek发布的两款全新模型,无疑为开源阵营注入了强劲活力。最新推出的DeepSeek V3.2及其高性能版本DeepSeek-V3.2-Speciale在多项测试中均展现出色实力。其中V3.2与GPT-5展开了激烈角逐,而Speciale版本更是在国际数学奥林匹克(IMO 2025)与中国数学奥林匹克(CMO 2025)等权威赛事中斩获金牌,甚至与闭源领域的标杆产品Gemini形成了分庭抗礼之势。
这家公司在今年已连续发布了九款模型,尽管备受期待的R2版本尚未问世,但其技术突破已引发业界广泛关注。通过优化算法架构,DeepSeek成功突破了传统模型的计算瓶颈。以稀疏注意力机制(DSA)为例,该技术通过引入“固定页面数目目录”的智能筛选方式,将注意力计算范围从全局压缩至关键区域。实验数据显示,当输入文本长度增加时,采用传统架构的V3.1模型推理成本呈指数级上升,而搭载DSA的V3.2版本则保持稳定,有效解决了长文本处理中的算力浪费问题。
在模型训练策略上,DeepSeek创造性地将强化学习引入后续训练阶段。以往的开源模型在此环节普遍存在投入不足的问题,导致模型虽具备基础能力却难以应对复杂任务。为此,研究团队设计了全新的强化学习协议,投入超过总训练算力10%的资源进行专项优化。这种“名师辅导”模式显著提升了模型在数学推理、代码生成等领域的表现,特别是Speciale版本通过取消传统模型对思考时长的限制,允许模型进行深度持续思考,最终实现了与Gemini 3的正面交锋能力。
针对智能体(Agent)能力的提升,研究团队构建了包含24667个真实代码环境、50275个搜索任务及4417个合成场景的虚拟训练环境。在工具调用机制方面,新模型彻底革新了前代产品“思考-调用”割裂的缺陷。现在模型能完整保留工具调用过程中的推理链条,将工具查询记录作为上下文持续保存,仅当用户发起新提问时重置推理状态。这种改进使模型处理简单查询(如日期查询)的效率提升数倍,避免了重复构建推理路径的算力消耗。
尽管取得了显著进步,DeepSeek团队在技术论文中坦诚披露了现存不足。测试数据显示,在解答专业问题时,Speciale版本平均消耗8077个Token,较Gemini 3的4972个高出61%。然而成本对比却呈现戏剧性反转:DeepSeek的解决方案单价仅为0.0032美元,不到谷歌同类产品0.06美元的二十分之一。这种“高性能低价格”的特性,使其在预算敏感型应用场景中展现出独特优势。
在技术演进路径方面,DeepSeek的选择与行业主流形成了鲜明对比。当多数企业通过扩大参数规模提升性能时,该团队持续深耕算法优化领域。从V2版本的混合专家架构(MoE),到V3版本引入的多头潜在注意力机制(MLA),再到当前版本采用的稀疏注意力技术,每次迭代都聚焦于算力效率的提升。这种发展模式印证了OpenAI前首席科学家Ilya Sutskever的观点:单纯堆砌硬件资源无法引领行业未来,算法创新才是突破性能瓶颈的关键。
