游乐游手机版
首页/科技数码/文章详情

DeepSeek新模型以小博大:挑战AI巨头,开辟智能新路径

时间:2025-12-03 22:53
近期,开源模型与闭源模型之间的差距呈现扩大趋势,但DeepSeek发布的两款新模型为开源阵营注入新活力。此次推出的DeepSeek V3 2及高性能版本DeepSeek-V3 2-Speciale,

近期,开源模型与闭源模型之间的性能差距似乎进一步拉大,然而DeepSeek发布的两款全新模型,无疑为开源阵营注入了强劲活力。最新推出的DeepSeek V3.2及其高性能版本DeepSeek-V3.2-Speciale在多项测试中均展现出色实力。其中V3.2与GPT-5展开了激烈角逐,而Speciale版本更是在国际数学奥林匹克(IMO 2025)与中国数学奥林匹克(CMO 2025)等权威赛事中斩获金牌,甚至与闭源领域的标杆产品Gemini形成了分庭抗礼之势。

这家公司在今年已连续发布了九款模型,尽管备受期待的R2版本尚未问世,但其技术突破已引发业界广泛关注。通过优化算法架构,DeepSeek成功突破了传统模型的计算瓶颈。以稀疏注意力机制(DSA)为例,该技术通过引入“固定页面数目目录”的智能筛选方式,将注意力计算范围从全局压缩至关键区域。实验数据显示,当输入文本长度增加时,采用传统架构的V3.1模型推理成本呈指数级上升,而搭载DSA的V3.2版本则保持稳定,有效解决了长文本处理中的算力浪费问题。

在模型训练策略上,DeepSeek创造性地将强化学习引入后续训练阶段。以往的开源模型在此环节普遍存在投入不足的问题,导致模型虽具备基础能力却难以应对复杂任务。为此,研究团队设计了全新的强化学习协议,投入超过总训练算力10%的资源进行专项优化。这种“名师辅导”模式显著提升了模型在数学推理、代码生成等领域的表现,特别是Speciale版本通过取消传统模型对思考时长的限制,允许模型进行深度持续思考,最终实现了与Gemini 3的正面交锋能力。

针对智能体(Agent)能力的提升,研究团队构建了包含24667个真实代码环境、50275个搜索任务及4417个合成场景的虚拟训练环境。在工具调用机制方面,新模型彻底革新了前代产品“思考-调用”割裂的缺陷。现在模型能完整保留工具调用过程中的推理链条,将工具查询记录作为上下文持续保存,仅当用户发起新提问时重置推理状态。这种改进使模型处理简单查询(如日期查询)的效率提升数倍,避免了重复构建推理路径的算力消耗。

尽管取得了显著进步,DeepSeek团队在技术论文中坦诚披露了现存不足。测试数据显示,在解答专业问题时,Speciale版本平均消耗8077个Token,较Gemini 3的4972个高出61%。然而成本对比却呈现戏剧性反转:DeepSeek的解决方案单价仅为0.0032美元,不到谷歌同类产品0.06美元的二十分之一。这种“高性能低价格”的特性,使其在预算敏感型应用场景中展现出独特优势。

在技术演进路径方面,DeepSeek的选择与行业主流形成了鲜明对比。当多数企业通过扩大参数规模提升性能时,该团队持续深耕算法优化领域。从V2版本的混合专家架构(MoE),到V3版本引入的多头潜在注意力机制(MLA),再到当前版本采用的稀疏注意力技术,每次迭代都聚焦于算力效率的提升。这种发展模式印证了OpenAI前首席科学家Ilya Sutskever的观点:单纯堆砌硬件资源无法引领行业未来,算法创新才是突破性能瓶颈的关键。

来源:https://www.itbear.com.cn/html/2025-12/1038665.html
上一篇戴尔科技IT资产管理:企业资产回收服务实战指南 下一篇丰田世纪坚持燃油路线,混动V8将成主力引擎
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
理想新车布局预测:L9L与i9上半年发布
科技数码 · 2026-07-04

理想新车布局预测:L9L与i9上半年发布

1月23日消息,综合权威公开信息与行业趋势研判,理想汽车2026年度新车布局规划正式曝光。此番产品线布局,不仅持续深耕SUV市场,同时加速补齐全场景覆盖的拼图。 理想L9旗舰SUV 在增程动力领域,理想L系列将迎来一位新成员——L9L,预计2026年上半年正式上市,预估售价区间为45万至55万元。与

三星消息应用7月停用 部分旧设备可继续使用
科技数码 · 2026-07-04

三星消息应用7月停用 部分旧设备可继续使用

6月29日,多家海外媒体援引三星官方消息证实,三星消息(Samsung Messages)应用将于2026年7月正式终止服务。随着这个截止日期越来越近,依然在使用该应用的Galaxy用户需要尽快迁移到新的默认信息工具。其实过去两年里,三星一直在悄悄引导用户转向谷歌信息(Google Messages

吉利发布2030战略:年销650万辆全面迈向全球前五
科技数码 · 2026-07-04

吉利发布2030战略:年销650万辆全面迈向全球前五

1月22日,吉利控股集团在北京召开战略解析大会,正式发布“一个吉利,全面领先”的2030战略蓝图。战略目标清晰明确:到2030年,全球总销量(含乘用车与商用车)突破650万辆,稳居全球车企前五。其中,新能源车型占比预计达到75%左右,海外销量占比超过三分之一。尤为关键的是,依托全新全球化架构,单车型

OPPO Find X9系列旗舰手机累计销量突破250万部Ultra版超12万部
科技数码 · 2026-07-04

OPPO Find X9系列旗舰手机累计销量突破250万部Ultra版超12万部

OPPO Find X9 Ultra 旗舰机型 回顾产品发布背景:Find X9系列于2025年10月正式登场,作为OPPO年度旗舰产品线,涵盖标准版、Pro版与Ultra版三大版本。该系列的核心竞争力十分明确——影像系统与综合性能的双重显著提升。上市以来,凭借芯片算力、屏幕显示素质、续航表现以及影

IntelliJ IDEA 2025.3.2 版本正式发布
科技数码 · 2026-07-04

IntelliJ IDEA 2025.3.2 版本正式发布

IntelliJ IDEA 2025 3 2 版本现已正式发布。除了常规的漏洞修复与功能完善,本次更新有几个修复点值得格外关注——特别是如果你经常使用终端工具执行命令,或者正在采用远程开发工作流。终端工具窗口的闪烁问题终于得到彻底解决。此前在调用支持同步输出的命令行工具(例如 Claude Code