字节跳动发布专用形式化数学模型Seed Prover 1.5
12月24日消息,字节跳动Seed团队今日正式发布新一代形式化数学推理专用模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,其推理能力和推理效率均取得了显著提升。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
相较于上一代模型,Seed Prover 1.5在16.5小时内,针对IMO 2025的前5道题目生成了完整可编译验证的Lean证明代码,换算成绩为35/42,达到了此前IMO评分标准的金牌分数线。
针对北美本科级别数学竞赛Putnam,Seed Prover 1.5仅用时9小时,便对12道Putnam 2025赛题中的11道生成了可编译验证的Lean代码。
在更系统的评估中,Seed Prover 1.5在完整的Putnam历史评估集上解决了88%的问题。在代表硕士数学难度的Fate-H和代表博士生数学难度的Fate-X评估集上,则分别解决了80%和33%的题目,刷新了形式化数学推理模型在这几个测评集上的SOTA表现。

Seed Prover 1.5的技术报告已对外公开,最新后续将开放API,附链接如下:
技术报告:
https://arxiv.org/abs/2512.17260
Lean证明代码:
https://github.com/ByteDance-Seed/Seed-Prover/blob/main/SeedProver-1.5/Putnam2025.zip
相关攻略
3月27日消息,字节跳动企业纪律与职业道德委员会今日发布中国大陆地区 2026 年 1 号通报,披露 2025 年四季度内部违规案例的处理情况。从通报中获悉,本次通报字节跳动共对 65 名触碰纪律红
3月27日消息,字节跳动旗下 CapCut(剪映)3 月 26 日在 X 平台宣布推出 CapCut Video Studio,无需时间轴即可创建视频,支持 Dreamina Seedance 2
3月27日消息,今日,字节跳动企业纪律与职业道德委员会发布2026年1号通报,披露2025年四季度内部违规案例的处理情况。通报显示,本次通报字节跳动共对65名触碰纪律红线的员工予以辞退。其中10名违
芯片大消息!3月26日,在2026中关村论坛年会RISC-V(第五代精简指令集)生态科技论坛上,中国科学院发布RISC-V领域关键技术突破、产业协同创新及人才培养的系列重要成果,推出“香山”开源计算
3月25日消息,易点天下(301171 SZ)昨日发布财报。财报显示,易点天下2025年营收为38 3亿元,较上年同期的25 47亿元增长50 39%,其中,第四季度营收为11 13亿元。易点天下2
热门专题
热门推荐
首先使用系统内置工具校准显示器颜色,调整伽马、亮度、对比度和色彩平衡;其次可借助专业校色仪进行硬件级校准并生成ICC配置文件;接着检查并更换高质量视频线缆以确保信号稳定;然后更新显
1、第一步,在手机中打开萤石云应用程序,然后单击萤石云智能相机设备进入,见下图,转到下面的步骤。2、第二步,执行完上面的操作之后,可以检查摄像机的实时监控屏幕,此时,单击右上角的三
《洛克王国:世界》是由腾讯IEG魔方工作室群开发的大世界精灵收集养成战斗游戏,在游戏中有许许多多不同的精灵,游戏中可以用果实来产生精灵,那么有不少小伙伴好奇机械方方果实怎么获得,下
近日,泰国普吉岛的一则噩耗引发全球关注——33岁的英国真人秀男明星乔丹·赖特,被发现溺亡于当地一处排水沟中。无独有偶,就在上个月,一名中国女子在泰国芭提雅参加泳池派对后失联,最终被警方发现其不幸遇害
CPU位于主板中央偏上、散热器正下方的专用插槽中,可通过机箱目视、系统软件(如msinfo32、HWiNFO64)或主板说明书图示三步精准定位。如果您想定位电脑中负责核心运算与指令





