DeepSeek新模型以小博大：挑战AI巨头，开辟智能新路径

时间：2025-12-03 22:53

近期，开源模型与闭源模型之间的差距呈现扩大趋势，但DeepSeek发布的两款新模型为开源阵营注入新活力。此次推出的DeepSeek V3 2及高性能版本DeepSeek-V3 2-Speciale，

近期，开源模型与闭源模型之间的性能差距似乎进一步拉大，然而DeepSeek发布的两款全新模型，无疑为开源阵营注入了强劲活力。最新推出的DeepSeek V3.2及其高性能版本DeepSeek-V3.2-Speciale在多项测试中均展现出色实力。其中V3.2与GPT-5展开了激烈角逐，而Speciale版本更是在国际数学奥林匹克（IMO 2025）与中国数学奥林匹克（CMO 2025）等权威赛事中斩获金牌，甚至与闭源领域的标杆产品Gemini形成了分庭抗礼之势。

这家公司在今年已连续发布了九款模型，尽管备受期待的R2版本尚未问世，但其技术突破已引发业界广泛关注。通过优化算法架构，DeepSeek成功突破了传统模型的计算瓶颈。以稀疏注意力机制（DSA）为例，该技术通过引入“固定页面数目目录”的智能筛选方式，将注意力计算范围从全局压缩至关键区域。实验数据显示，当输入文本长度增加时，采用传统架构的V3.1模型推理成本呈指数级上升，而搭载DSA的V3.2版本则保持稳定，有效解决了长文本处理中的算力浪费问题。

在模型训练策略上，DeepSeek创造性地将强化学习引入后续训练阶段。以往的开源模型在此环节普遍存在投入不足的问题，导致模型虽具备基础能力却难以应对复杂任务。为此，研究团队设计了全新的强化学习协议，投入超过总训练算力10%的资源进行专项优化。这种“名师辅导”模式显著提升了模型在数学推理、代码生成等领域的表现，特别是Speciale版本通过取消传统模型对思考时长的限制，允许模型进行深度持续思考，最终实现了与Gemini 3的正面交锋能力。

针对智能体（Agent）能力的提升，研究团队构建了包含24667个真实代码环境、50275个搜索任务及4417个合成场景的虚拟训练环境。在工具调用机制方面，新模型彻底革新了前代产品“思考-调用”割裂的缺陷。现在模型能完整保留工具调用过程中的推理链条，将工具查询记录作为上下文持续保存，仅当用户发起新提问时重置推理状态。这种改进使模型处理简单查询（如日期查询）的效率提升数倍，避免了重复构建推理路径的算力消耗。

尽管取得了显著进步，DeepSeek团队在技术论文中坦诚披露了现存不足。测试数据显示，在解答专业问题时，Speciale版本平均消耗8077个Token，较Gemini 3的4972个高出61%。然而成本对比却呈现戏剧性反转：DeepSeek的解决方案单价仅为0.0032美元，不到谷歌同类产品0.06美元的二十分之一。这种“高性能低价格”的特性，使其在预算敏感型应用场景中展现出独特优势。

在技术演进路径方面，DeepSeek的选择与行业主流形成了鲜明对比。当多数企业通过扩大参数规模提升性能时，该团队持续深耕算法优化领域。从V2版本的混合专家架构（MoE），到V3版本引入的多头潜在注意力机制（MLA），再到当前版本采用的稀疏注意力技术，每次迭代都聚焦于算力效率的提升。这种发展模式印证了OpenAI前首席科学家Ilya Sutskever的观点：单纯堆砌硬件资源无法引领行业未来，算法创新才是突破性能瓶颈的关键。

来源：https://www.itbear.com.cn/html/2025-12/1038665.html

上一篇戴尔科技IT资产管理：企业资产回收服务实战指南 下一篇丰田世纪坚持燃油路线，混动V8将成主力引擎

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-04

理想新车布局预测：L9L与i9上半年发布

1月23日消息，综合权威公开信息与行业趋势研判，理想汽车2026年度新车布局规划正式曝光。此番产品线布局，不仅持续深耕SUV市场，同时加速补齐全场景覆盖的拼图。理想L9旗舰SUV 在增程动力领域，理想L系列将迎来一位新成员——L9L，预计2026年上半年正式上市，预估售价区间为45万至55万元。与

科技数码 · 2026-07-04

三星消息应用7月停用部分旧设备可继续使用

6月29日，多家海外媒体援引三星官方消息证实，三星消息（Samsung Messages）应用将于2026年7月正式终止服务。随着这个截止日期越来越近，依然在使用该应用的Galaxy用户需要尽快迁移到新的默认信息工具。其实过去两年里，三星一直在悄悄引导用户转向谷歌信息（Google Messages

科技数码 · 2026-07-04

吉利发布2030战略：年销650万辆全面迈向全球前五

1月22日，吉利控股集团在北京召开战略解析大会，正式发布“一个吉利，全面领先”的2030战略蓝图。战略目标清晰明确：到2030年，全球总销量（含乘用车与商用车）突破650万辆，稳居全球车企前五。其中，新能源车型占比预计达到75%左右，海外销量占比超过三分之一。尤为关键的是，依托全新全球化架构，单车型

科技数码 · 2026-07-04

OPPO Find X9系列旗舰手机累计销量突破250万部Ultra版超12万部

OPPO Find X9 Ultra 旗舰机型回顾产品发布背景：Find X9系列于2025年10月正式登场，作为OPPO年度旗舰产品线，涵盖标准版、Pro版与Ultra版三大版本。该系列的核心竞争力十分明确——影像系统与综合性能的双重显著提升。上市以来，凭借芯片算力、屏幕显示素质、续航表现以及影

科技数码 · 2026-07-04

IntelliJ IDEA 2025.3.2 版本正式发布

IntelliJ IDEA 2025 3 2 版本现已正式发布。除了常规的漏洞修复与功能完善，本次更新有几个修复点值得格外关注——特别是如果你经常使用终端工具执行命令，或者正在采用远程开发工作流。终端工具窗口的闪烁问题终于得到彻底解决。此前在调用支持同步输出的命令行工具（例如 Claude Code