字节形式化数学推理模型Seed+Prover 1.5发布，提升智能证明效率_游乐游手机版

首页/科技数码/文章详情

字节形式化数学推理模型Seed+Prover 1.5发布，提升智能证明效率

时间：2025-12-24 15:01

近日，字节跳动 Seed 团队推出新一代形式化数学推理专用模型Seed Prover 1 5 ，通过大规模的Agentic RL训练，其推理能力和推理效率取得显著进步。相比上一代模型，Seed Pr

近日，字节跳动Seed团队正式发布了新一代形式化数学推理专用模型Seed Prover 1.5。通过大规模Agentic RL训练，该模型在推理能力和效率上均取得了显著进步。相比上一代模型，Seed Prover 1.5在短短16.5小时内，便针对IMO 2025竞赛的前五道题目，生成了完整且可编译验证的Lean证明代码。换算成竞赛成绩为35/42分，已达到历届IMO金牌分数线。

在北美本科级别数学竞赛Putnam的测试中，Seed Prover 1.5仅用时9小时，就为2025年赛题中的11道题目生成了可编译验证的Lean代码。在更系统的评估中，它的表现同样出色：在完整的Putnam历史评估集上解决了88%的问题；在代表硕士数学难度的Fate-H和代表博士生数学难度的Fate-X评估集上，分别解决了80%和33%的问题，刷新了形式化数学推理模型在这几项基准测试上的最佳纪录。

Seed Prover 1.5 在多个评估集上与此前其他最佳方法的比较

目前，Seed Prover 1.5的技术报告已对外公开。团队后续将开放API，邀请感兴趣的数学与AI研究者亲身体验该模型。

来源：https://www.163.com/dy/article/KHI0QFG90550WHYR.html

代码 seed 数学推理 prover

上一篇俞敏洪选定东方甄选接班人：老将孙东旭担任执行总裁 下一篇从《流浪地球》到万家灯火：中国工程院院士详解核能未来

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容，方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

科技数码 · 2026-07-10

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

一位技工在客户家地下室发现一台属于AMD前CEORoryRead的旧PC，机箱上留有苏姿丰等高管签名，配置为推土机时代硬件且从未开机。这台电脑封存了AMD从推土机失败到Zen架构崛起的关键转折历史。

Laravel 12生态成熟助力全栈开发效率提升

科技数码 · 2026-07-10

Laravel 12生态成熟助力全栈开发效率提升

Laravel12延续开发体验优势，在项目结构、查询构建、API开发、调试及性能上持续优化。其生态日趋成熟，形成Reverb、Pulse等完整工具链，覆盖API、SaaS、企业后台及AI应用开发。与Next js的组合逐渐流行，Laravel已演变为现代Web开发平台，保持社区活力。

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

科技数码 · 2026-07-10

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

LinuxKernel6 15重大更新：Rust驱动正式入主线，NOVADRM成为首个实践案例；io_uring新增零拷贝网络接收，降低CPU开销与延迟；Btrfs增强实时zstd压缩、DirectIO及稳定性。内核同步推进安全化与高性能网络化。

谷歌Gemini进入Agent时代打造全天候AI助理

科技数码 · 2026-07-10

谷歌Gemini进入Agent时代打造全天候AI助理

Google推出GeminiSpark、Omni等新功能。Spark可全天候在后台运行，主动处理邮件、日历等任务；Omni侧重视频理解与环境推理，布局世界模型。AI正从被动回答转向主动观察、规划与执行，标志着竞赛进入新阶段。

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

科技数码 · 2026-07-10

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

CPU-Z2 20 2正式版发布，新增支持IntelPantherLake、WildcatLake、BartlettLake三大架构及AMD锐龙AIMax、Pro系列，加入锐炫G3识别库，修复缓存错误和锐龙77700X3D检测问题，免费下载。