游乐游手机版
首页/科技数码/文章详情

DeepSeek发布两款开源模型,性能比肩谷歌且坦言与闭源差距扩大

时间:2025-12-02 10:45
人工智能领域迎来重要进展,DeepSeek近日正式推出两款新模型——DeepSeek-V3 2与DeepSeek-V3 2-Speciale。这两款模型在推理能力方面展现出全球领先水平,引发行业广泛

人工智能领域迎来令人振奋的突破,DeepSeek近日正式推出两款重磅模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale。这两款模型在推理能力方面展现出国际领先水准,引发了业界的广泛关注。其中,V3.2定位为平衡推理性能与输出长度的通用型模型,擅长处理日常对话场景和智能体任务等应用。该模型此前已发布实验版本,此次正式版在公开测试中达到GPT-5的基准水平,仅在部分指标上略逊于谷歌Gemini3+Pro。

作为技术升级的核心产品,V3.2-Speciale被定位为“开源模型推理能力的极限探索者”。该模型创新性地融合了长思考增强技术与DeepSeek-Math-V2的数学证明能力,构建起包含指令跟随、逻辑验证和数学推理的复合能力体系。在数学竞赛测试中,Speciale在美国数学邀请赛、哈MIT数学竞赛等权威赛事中均超越Gemini3+Pro,国际奥数竞赛成绩更是达到人类选手前1%的水平。不过在编程和理工科博士生测试中,其表现与谷歌模型仍存在一定差距。

技术测评数据显示,Speciale在ICPC全球总决赛和IOI竞赛中分别取得人类选手第二名和第十名的成绩,展现出接近顶尖人类选手的复杂问题解决能力。但DeepSeek团队坦言,与闭源专有模型相比,V3.2系列仍存在三方面局限:世界知识广度不足、Token使用效率偏低,以及复杂任务处理能力有待提升。针对这些短板,研发团队计划通过扩大预训练计算量和优化推理链密度进行改进。

当前开源与闭源模型的发展差距成为行业焦点。技术报告指出,自推理模型技术突破以来,虽然开源社区持续进步,但谷歌、OpenAI等闭源模型的性能增速明显更快。这种分化主要体现在三个层面:标准注意力机制对长序列处理的效率制约、后训练阶段计算资源投入不足,以及智能体泛化能力与指令遵循能力的差距。这些因素导致专有系统在复杂任务中的优势持续扩大。

为突破技术瓶颈,DeepSeek在9月实验版中引入的稀疏注意力机制(DSA)已通过验证。该机制通过优化计算复杂度,在不损失长上下文处理能力的前提下,显著提升模型效率。正式版两款模型均采用这项创新技术,使得V3.2在智能体场景中成为兼具性能与成本优势的解决方案。实际测试表明,其推理性能提升的同时,计算资源消耗较前代降低37%。

目前DeepSeek-V3.2已完成全平台更新,用户可通过网页端、移动应用和API接口使用。增强版Speciale则以临时API形式开放,供研究机构和开发者进行深度测评。海外技术社区对此反响热烈,部分专家认为这两款模型的发布标志着开源模型与专有系统的性能差距进入动态平衡阶段。虽然完全消除差距仍需时间,但DeepSeek通过工程优化突破参数规模限制的路径,为行业提供了新的发展思路。

来源:https://www.itbear.com.cn/html/2025-12/1036290.html
上一篇百人团队打造Runway Gen-4.5:性能领先谷歌OpenAI视频模型 下一篇罗永浩12月30日举办年度科技大会,分享创新干货
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5

电动汽车电池新国标7月实施热失控不起火不爆炸
科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起,两项关乎电动汽车安全的核心强制性国家标准将正式实施,为行业加装“安全锁”——《电动汽车安全要求》(GB 18384-2025)与《电动汽车用动力蓄电池安全要求》(GB 38031-2025)同步落地。此次标准升级,从整车架构与电池系统两大维度,精准填补了近年来多起事故暴露出的