DeepSeek‑R1、DeepSeek‑R1‑Zero
DeepSeek‑V3、DeepSeek‑V3.1、DeepSeek‑V3.1-Terminus、DeepSeek‑V3.2‑Exp
DeepSeek‑OCR、DeepSeek‑Math-V2
DeepSeek再度重磅出击,一次性发布了四款在数学和编程奥林匹克竞赛中斩获金牌级成绩的AI模型。全新推出的DeepSeek-V3.2系列专为智能体应用场景打造,以推理能力为核心优先考量。
具体来看,DeepSeek-V3.2是此前V3.2-Exp版本的正式迭代,现已登陆App、网页端及API接口;而V3.2-Speciale则是突破推理能力天花板的终极版本,目前仅通过API提供服务。这两款模型均达到世界级推理水准:V3.2在推理与文本长度处理上表现均衡,日常使用游刃有余,性能直逼GPT-5;Speciale版本更是一举夺得四项金牌级成就——包括IMO 2025、CMO 2025、ICPC World Finals 2025和IOI 2025,其中在ICPC和IOI上的成绩分别达到人类选手第二名与第十名的水平。在主流推理基准测试中,V3.2-Speciale的表现甚至可与Gemini 3.0 Pro一较高下。

更值得关注的是,V3.2是首个将推理思考过程直接整合到工具使用中的模型,支持在思考模式与非思考模式下调用工具。目前,这两款模型均已开源,用户可直接从HuggingFace和ModelScope平台下载。
· DeepSeek-V3.2
HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3.2
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2
· DeepSeek-V3.2-Speciale
HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale
从「引擎验证」到「全能车手」,DeepSeek V3.2的进化之路
两个月前发布的DeepSeek-V3.2-Exp,本质上是一台呼啸而过的“概念车”——它的使命在于向业界证明稀疏注意力(DSA)架构的强大潜力。而如今正式转正的V3.2,则是一辆完成了内饰精装、配备了顶级导航系统、随时可以开出去解决复杂问题的“量产超跑”。核心引擎未变,但其智能体能力(Agent能力)实现了质的飞跃。

V3.2正式版 vs. Exp:学会了「边干边想」
在架构层面,V3.2沿用了Exp版验证成功的DSA,但在“软实力”上取得了关键突破——成功解决了长期困扰AI领域的“思考与行动断裂”问题。早期的V3.2-Exp(以及其他多数推理模型)如同记性不佳的老学究:先花大量时间思考,决定调用某个工具(比如查询天气),当工具返回结果时,它往往忘了之前的推理脉络,不得不重新规划。V3.2正式版引入了“思维上下文管理”,相当于为模型配备了一个“工作记忆暂存区”。如今的V3.2像经验丰富的外科医生:伸手要手术刀的间隙,脑海中的手术方案依然清晰连贯,拿到器械后便能无缝衔接下一步操作。

为练就这项绝活,DeepSeek搭建了一个“虚拟演练场”——合成了1800多个虚拟操作系统、代码库和浏览器环境,生成了8.5万条极具挑战性的指令,迫使V3.2在虚拟世界中反复练习修复Bug、查找资料、制作报表。正是这种高强度的特训,将V3.2从一个只会解题的“做题家”,进化为能熟练运用工具解决现实问题的“实干家”。
最大技术亮点:给注意力装上「闪电索引器」
V3.2能够同时兼顾“聪明”与“低成本”,最大功臣依然是底层的稀疏注意力(DSA)技术。

要理解它的威力,得先看看传统模型有多“笨”。传统模型在处理长文档时,就像一位强迫症晚期的图书管理员:为了回答一个简单问题,强迫自己把图书馆里每本书的每一页都读一遍,计算所有内容之间的关联,导致计算量随文本长度呈指数级爆炸(O(L²))。而DSA则为这位管理员配备了一套“闪电索引器”:问题一来,先用极低成本扫描“索引”,瞬间判断哪些页码可能包含答案,过滤掉99%无关内容,只对筛选出的1%关键信息进行深度分析。这种“查阅目录”而非“死磕全书”的策略,将计算复杂度从指数级拉低至接近线性(O(L))。
带来的显著提升:打破「不可能三角」
DSA技术直接突破了AI领域“速度、成本、智能”的不可能三角。

其一,成本大幅下降,长文本处理无忧。将一本几十万字的书籍或代码库丢给模型,不再是“烧钱”的奢侈行为,处理速度也从“泡杯咖啡”提升至“眨眼之间”。其二,算力盈余催生“智力涌现”。正因DSA节省了大量算力,DeepSeek才有底气推出性能惊人的Speciale版本——既然读得快,那就让它思考得更久。Speciale利用节省下来的资源进行更深度的“长思考”与逻辑推演,结果令人震撼:在数学和编程等硬核指标上,不仅超越了GPT-5 High,还与谷歌最强的Gemini 3.0 Pro打成平手。

从验证DSA引擎潜力的V3.2-Exp,到将智能体能力、思维上下文管理、虚拟演练场训练全部集成的V3.2正式版,DeepSeek展示了一条通往强智能的新路径:在算力受限的条件下,依靠更聪明的架构、更精细的训练和更开放的生态,不断逼近推理能力的极限。如果说之前的Scaling Law是“无脑烧钱”,那么V3.2的横空出世,则是通过更巧妙的算法在算力缝隙中开辟出一条通往顶峰的捷径——这或许就是开源AI最激动人心的时刻。
