字节跳动发布专用形式化数学模型Seed Prover 1.5
12月24日消息,字节跳动Seed团队今日正式发布新一代形式化数学推理专用模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,其推理能力和推理效率均取得了显著提升。
相较于上一代模型,Seed Prover 1.5在16.5小时内,针对IMO 2025的前5道题目生成了完整可编译验证的Lean证明代码,换算成绩为35/42,达到了此前IMO评分标准的金牌分数线。
针对北美本科级别数学竞赛Putnam,Seed Prover 1.5仅用时9小时,便对12道Putnam 2025赛题中的11道生成了可编译验证的Lean代码。
在更系统的评估中,Seed Prover 1.5在完整的Putnam历史评估集上解决了88%的问题。在代表硕士数学难度的Fate-H和代表博士生数学难度的Fate-X评估集上,则分别解决了80%和33%的题目,刷新了形式化数学推理模型在这几个测评集上的SOTA表现。

Seed Prover 1.5的技术报告已对外公开,最新后续将开放API,附链接如下:
技术报告:
https://arxiv.org/abs/2512.17260
Lean证明代码:
https://github.com/ByteDance-Seed/Seed-Prover/blob/main/SeedProver-1.5/Putnam2025.zip
相关攻略
字节跳动开源原生统一多模态模型Lance,仅30亿参数即实现视觉理解与生成任务的全能覆盖。其采用共享上下文与双流专家架构,通过统一交错序列和模态感知位置编码化解能力冲突。模型经四阶段高效训练,在多项基准测试中表现超越更大参数模型,显著降低多模态应用部署成本与算力需求。
字节跳动旗下“小荷健康”计划在上海开设门诊部,推进线上线下医疗融合。此前通过更名、收购及推出AI应用,逐步构建诊疗闭环。上海作为重要市场,成为其深化布局的关键一步,但线下医疗面临专业性及回报周期等挑战,未来发展有待观察。
字节跳动完成懂车帝业务组织架构调整,新设商业与交易产品部门,由Erick负责,涵盖商业产品、策略及新车交易等。原“巨懂车”业务整合为大客户、经销商等团队,由卜丽军负责。原负责人向锐调离,加入集团广告销售平台。
字节跳动旗下火山引擎的视频生成大模型Seedance2 0在戛纳电影节亮相,已应用于多家顶尖公司的工作流程。电影节展映了8部AI影片,其中全球首部95分钟AI长片《HELLGRIND》由15人团队在14天内以不足50万美元成本完成。导演吕克·贝松也将使用该技术制作首部AI动画电影,标志着AI在创意领域的应用进入新阶段。
《时代》杂志评选出2026年全球十大最具影响力AI公司。字节跳动凭借“豆包”等产品推动AI助手大规模普及;亚马逊通过巨型计算集群成为AI基础设施巨头;智谱AI展示了不依赖西方芯片的发展路径,其开源模型性能领先。OpenAI虽面临争议,仍以ChatGPT引领行业;谷歌通过Gemini模型实现收入突破。Meta、Anthropic、阿里巴巴、Mistral和Hu
热门专题
热门推荐
比特币匿名交易指南:原理、方法与关键注意事项 提到比特币,很多人第一反应是“匿名”。但真相是,比特币交易在区块链上公开记录,其本质是“化名”而非完全匿名。这意味着,只要采取恰当的方法,完全可以将交易隐私提升一个层级。本文将系统梳理实现比特币匿名交易的几种实用方法,并为你提供相关可信工具的官方获取途径
PowerLawGLM:法律领域的AI“专家” 在人工智能大模型深刻变革各行各业的今天,法律这一专业壁垒高、知识体系复杂的领域,也迎来了其专属的智能解决方案。由幂律智能与智谱AI联合推出的PowerLawGLM,是一款拥有千亿级参数、专为中文法律场景深度优化的垂直大模型。它本质上是一位经过海量法律文
新SSR比斯塔天赋可叠加“蔷薇花刺”,三层后目标无法复活,有效克制副本复活机制。其技能多为全体伤害,适合PVP竞技场。闪避可减敌怒气,暴击能回复生命,兼具续航与干扰能力。终结技提升闪避,配合额外魂玉实现连招。奥义击倒目标后可回血,增强生存能力。
手游《代号:逍遥游》即将上线,以“选择”为核心玩法。玩家将在宏大仙侠世界中,面对飞升或逆天等不同道路,通过自身决策破解宿命迷局,体验多线命运走向。
在《方舟:生存进化》中,探险者笔记是揭示世界秘密的关键物品。可通过探索地图角落、完成特定任务、与NPC互动、寻找隐藏地点以及参与游戏内特殊事件等多种途径获取。收集过程融合了探索、解谜与社交,集齐笔记不仅能获得经验加成,更能深入理解游戏世界的背景与故事。





