首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
DeepSeek新版上线:揭秘奥数金牌解题能力的技术内幕

DeepSeek新版上线:揭秘奥数金牌解题能力的技术内幕

热心网友
21
转载
2025-11-30

2025年11月28日

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

本文共计1072字,阅读时间约2分钟

作者 | 第一财经 刘晓洁

11月27日晚间,DeepSeek悄然在Hugging Face平台开源了全新模型——DeepSeek-Math-V2。这款专注于数学领域的模型,堪称行业首个达到国际奥林匹克数学竞赛金牌水准并开放源代码的AI。

在同步发布的技术论文中,DeepSeek透露,Math-V2在部分关键指标上超越了谷歌旗下Gemini DeepThink,并在IMO-ProofBench基准测试及近期数学竞赛中展现出卓越性能。

具体来看,在基础基准测试中,DeepSeek-Math-V2以接近99%的超高得分遥遥领先其他模型,而位列第二的谷歌Gemini DeepThink (IMO Gold)得分仅为89%。不过在难度更高的高级子集中,Math-V2获得61.9%的分数,略低于Gemini DeepThink (IMO Gold)的65.7%。

在这篇题为《DeepSeek Math-V2:迈向可验证的数学推理》的论文中,研究团队指出,大语言模型在数学推理领域取得的重要突破,标志着人工智能发展进入新阶段。若持续推进,或将深刻影响科学研究范式。

然而当前AI在数学推理方面仍面临技术瓶颈:以最终答案正确与否作为评判标准,但正确答案未必代表推理过程的严谨性。特别是数学定理证明等任务,需要严密的逐步推导而非简单数字答案,这使得传统奖励机制难以适用。

为突破深度推理的极限,DeepSeek认为有必要验证数学推理的完整性与严谨性。团队特别强调,自我验证对于延长测试时间的计算尤为关键,特别是那些尚未存在已知解决方案的开放性问题。

此次推出的Math-V2实现了从结果导向到过程导向的重要转变,展现出强大的定理证明能力。该模型不依赖大量数学题答案数据,而是通过教导AI如何像数学家一样严谨审查证明过程,从而在无人干预的情况下持续提升解决高难度数学证明题的能力。

论文中提到,Math-V2在IMO 2025和中国数学奥林匹克2024中取得金牌级成绩,并在Putnam 2024竞赛中通过扩展测试实现了接近满分的优异表现(118/120)。

DeepSeek表示,虽然仍有诸多挑战需要攻克,但这些成果表明,可自我验证的数学推理是一个可行的研究方向,有望助力开发更强大的数学AI系统。

对于DeepSeek此次发布的模型,海外社区反响热烈,网友戏称“巨鲸终于归来”。有评论感慨,DeepSeek以十个百分点的显著优势击败了谷歌的IMO金牌模型DeepThink,这一成就超出业界预期。“想象一下,当他们公布编程模型时会发生什么,我打赌他们绝对会推出编程模型。”

当前,头部厂商的模型迭代已进入新一轮竞争周期。11月以来,先是OpenAI发布了GPT-5.1,几天后xAI推出Grok 4.1,紧接着上周谷歌发布Gemini 3系列引爆AI圈,“这回该轮到DeepSeek出手了”。不过,更受业界关注的仍是DeepSeek旗舰模型的更新计划,行业正期待着“巨鲸”的下一步动作。

来源:https://www.itbear.com.cn/html/2025-11/1033541.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

通过ollama安装本地模型运行openclaw
AI
通过ollama安装本地模型运行openclaw

首先安装 Git 版本控制工具 要在您的 Windows 电脑上安装 Git,操作非常简单。只需打开终端或命令提示符,输入下面的安装命令,即可快速完成部署。 winget install git git 安装 Ollama 本地 AI 客户端 现在有个好消息分享给大家:最新版本的 Ollama 已经

热心网友
04.02
《三角洲行动》国服宣布日活跃用户突破5000万!全服发放福利!
游戏资讯
《三角洲行动》国服宣布日活跃用户突破5000万!全服发放福利!

战术射击大作《三角洲行动》国服DAU突破5000万,官方发布重磅福利共庆里程碑 近日,射击游戏市场捷报频传——战术射击网游《三角洲行动》国服日活跃用户数(DAU)正式突破5000万大关。这一数据不仅是游戏上线后的关键性成就,也标志着其已牢固占据国内战术射击类游戏的领先地位。为纪念这一里程碑式的突破,

热心网友
04.02
Best in AWE2026:追觅全球首创动态声擎 引领声学应用新突破
科技数码
Best in AWE2026:追觅全球首创动态声擎 引领声学应用新突破

追觅INNIX Aura Mini LED R8000F电视评测:全球首创动态声擎,实现声音智能追踪 你是否想过,家中的电视机能够智能感知你的位置,并让声音始终追随你的双耳?这已不再是科幻构想。在刚刚闭幕的以“AI科技 慧享未来”为主题的AWE2026展会上,追觅INNIX旗下的一款Mini LED

热心网友
04.02
索尼 PlayStation 5 首席架构师:PSSR 超分辨率升级版采用 INT8 数据格式
科技数码
索尼 PlayStation 5 首席架构师:PSSR 超分辨率升级版采用 INT8 数据格式

揭秘索尼 PSSR 技术方案:PlayStation 5 Pro 首席架构师详解 INT8 数据格式优势 2024年3月27日,行业传来一则关键信息。索尼PlayStation 5系列产品首席系统架构师Mark Cerny在接受著名技术媒体Digital Foundry专访时正式确认,最新推出的PS

热心网友
04.02
龙岛异兽起源恐龙蛋孵化玩法是什么-龙岛异兽起源恐龙蛋孵化怎么玩
游戏资讯
龙岛异兽起源恐龙蛋孵化玩法是什么-龙岛异兽起源恐龙蛋孵化怎么玩

恐龙蛋孵化全面指南:从获取到培育全流程详解 在热门游戏《龙岛异兽起源》中,拥有一只专属的恐龙伙伴是每位玩家的核心目标,而这段旅程始于一枚蛋。获取恐龙蛋主要有以下几种途径:完成主线或支线任务、探索地图上的神秘区域与隐藏地点,以及积极参与游戏内的节日或限时活动。得到恐龙蛋后,首要任务是建立一个安全的孵化

热心网友
04.02