我国通用AI逻辑推理领域实现重大跨越

时间：2026-01-27 11:07

来源：科技日报科技日报记者杨雪我国科研团队开发出全球首个同时具备自主出题（Proposing）和自动解题（Solving）双重能力的通用人工智能系统——“通矩模型”（TongGeometry）。相

来源：科技日报

科技日报记者杨雪

来自我国的科研团队成功研发出全球首个兼具自主出题与自动解题双重能力的通用人工智能系统——“通模型”。相关研究成果已于1月26日发表在《自然·机器智能》顶级期刊上。

奥林匹克数学竞赛素来被视作衡量人工智能逻辑推理能力的“试金石”。今年年初，DeepMind 公司开发的 AlphaGeometry 系统曾在全球引发轰动，展现出 AI 在解题方面的巨大潜力。然而，AlphaGeometry 本质上仍是一个“被动解题者”，其训练过程高度依赖海量合成数据和昂贵的计算资源。相比之下，我国团队自主研发的 TongGeometry 则展现出更高维度的智能水平：它不仅能像“优等生”一样完成满分答卷，更是一位能够创造优美、新颖题目的“出题名师”。

论文第一作者、北京通用人工智能研究院张弛博士介绍：“我们在研究中发现一个深刻的对偶关系：当一个几何命题的证明难度显著高于其构建复杂度时，它就具备了作为奥赛题目的‘审美价值’。通过对这种关系的建模，TongGeometry 能够从浩如烟海的空间组合中，精准捕捉到那些符合人类数学家审美标准的高质量题目。这在国际上首次实现了从‘模仿解题’到‘自主创造’的范式转变。”

在性能表现上，TongGeometry 展现了卓越的国产原创技术优势。相较于 AlphaGeometry 需要庞大的算力集群支撑，TongGeometry 仅需单张消费级显卡即可在最多 38 分钟内，解决近25年来的所有奥数几何难题，其推理效率和准确率均达到世界顶尖水准。此外，该系统通过创新的“规范化表示”技术，将搜索空间压缩了几个数量级，有效解决了传统方法中的路径爆炸问题。

论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示，TongGeometry 的意义不仅在于解题速度的提升，更在于它通过模拟人类数学家的直觉和审美，实现了“小数据、大任务”的范式转化。这种不依赖海量标注数据、通过内部逻辑自我演化的路径，正是通用人工智能发展的关键。“我们的系统不仅能与国际最先进的 AI 系统对标，更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。

目前，TongGeometry 的原创能力已获得专业学术界和竞赛圈的认可。系统自主生成的3道几何新题，已正式入选2024年全国中学生数学联赛（北京赛区）及美国精英奥赛，这是AI原创题目首次进入高规格人类数学竞赛。

这一成果标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研，并在性能与功能多样性上全面超越了以DeepMind为代表的国际顶尖水平。该科研团队由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院，以及北京大学武汉人工智能研究院联合组成，未来将继续深耕“通系列”通用智能模型，推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。

来源：https://www.163.com/dy/article/KK95U97Q0514R9OJ.html