DeepSeek-Math-V2开源：国产数学金牌模型性能对标GPT-4o

时间：2025-11-29 22:49

11月27日，DeepSeek 团队在 Hugging Face 扔出236B 参数巨兽——DeepSeek-Math-V2，采用 MoE 架构，活跃参数仅21B，上下文一口气拉到128K toke

11月27日，DeepSeek团队在Hugging Face平台重磅发布参数量高达236B的数学大模型DeepSeek-Math-V2。该模型采用MoE混合专家架构，虽然总参数量庞大，但激活参数仅21B，上下文长度更是突破128K token。更令人惊喜的是，团队当天同步开放了Apache 2.0协议授权，商业使用零限制，强大的开源诚意瞬间引爆服务器带宽。

数学能力成绩单（零样本思维链测试）：

- MATH基准测试中取得75.7%的优异成绩，与GPT-4o（76.6%）几乎并驾齐驱；

- AIME 2024挑战中成功解答4/30的题目，表现优于Gemini 1.5 Pro和Claude-3-Opus；

- Math Odyssey测试中获得53.7%的分数，同样跻身第一梯队。

模型的核心突破在于创新的“自验证”双引擎机制：Generator负责生成解题初稿，Verifier则逐步检查推理过程，发现错误立即打回重写，最多支持16轮迭代优化。最终通过多数投票结合元验证器有效抑制幻觉现象。训练语料规模达到1000亿token，涵盖学术论文、竞赛试题与合成数据，并引入GRPO强化学习技术精准对齐人类解题偏好。

受益于代码与数学混合训练策略，DeepSeek-Math-V2在编程领域同样展现出强大实力：Humaneval得分90.2%、MBPP达到76.2%，更在SWEBench测试中成为首个突破10%准确率大关的开源模型，直接对标GPT-4-Turbo和Claude 3 Opus等顶级闭源模型。

目前模型已在Hugging Face平台上线，仅需80GB显存即可实现多卡推理。技术社区正在火热复现相关成果。若想为AI装备一颗专业的“数学大脑”，现在只需一行`transformers`代码即可加载——这款国产开源模型，再次将闭源巨头的技术壁垒变成了显微镜下的裂缝。

来源：https://www.itbear.com.cn/html/2025-11/1033387.html

上一篇6G新突破：声波与自旋波融合解锁通信新可能 下一篇谷歌TPU突破算力瓶颈：AI泡沫下英伟达护城河面临挑战

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

科技数码 · 2026-07-05

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

HMDGlobal推出4款诺基亚功能手机，均配1450mAh可拆卸电池及独立AI按键，支持语音控制，免费180天后付费。部分机型带摄像头，支持microSD卡扩展至32GB，具双SIM卡、3 5mm接口及蓝牙5 0。

科技数码 · 2026-07-05

云南以旧换新补贴扩围新增智能影音与无人机

云南省自2026年7月起扩大消费品以旧换新补贴范围，新增智能门锁、智能影音、无人机、数码相机等数码智能产品及吸油烟机、燃气灶、洗碗机、净水器等家电。按最终售价15%补贴，每类每件最高1500元，商户报名无限制。

科技数码 · 2026-07-05

小米Redmi 7英寸高性能手机传闻即将发布

最近圈内又有新动静了。据博主 @数码闲聊站今天爆料，某家厂商的子系列下一代打算推出两款屏幕尺寸差异明显的机型：一块是 6 59 英寸的中屏 Pro，另一块则是 7 英寸的巨屏性能机。从该博主以往的爆料习惯来看，基本可以锁定是小米 REDMI 品牌的产品线布局。有意思的是，早在今年 2 月，这位博

科技数码 · 2026-07-05

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

深光影像AF35mmF2 2CE全画幅镜头开售，提供E卡口和L卡口，标准版七百三十九元，套装版七百八十九元。全金属机身，重约一百七十五克，高三十六毫米，滤镜口径五十二毫米，光学结构五组七片，九片光圈叶片，最近对焦零点三五米，支持自动对焦。