首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
中国AI突破奥数几何:首次实现自主出题

中国AI突破奥数几何:首次实现自主出题

热心网友
22
转载
2026-01-28

北京1月28日电 记者赵竹青报道,1月26日,北京通用人工智能研究院(BIGAI)联合北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院及北京大学武汉人工智能研究院共同组成的科研团队,成功研发出“基于引导树搜索的奥数几何问题提出与解答系统”,相关成果已发表于国际顶级学术期刊《自然·机器智能》。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

团队自主研发的“通矩模型”(TongGeometry)是全球首个同时具备自主出题和自动解题双重能力的通用人工智能系统。这一突破性成果标志着中国科研团队在自动化推理这一逻辑核心领域实现了关键技术自主创新,为推动人工智能辅助数学研究及AI赋能教育迈出了坚实一步。

长期以来,国际数学奥林匹克竞赛被视为检验人工智能逻辑推理能力的“试金石”。2024年初,由DeepMind开发的AlphaGeometry曾引起全球轰动,展现了AI在解决高难度几何问题方面的巨大潜力。然而,AlphaGeometry本质上是一个“被动解题者”,其训练过程极度依赖海量合成数据与昂贵的算力资源。相比之下,我国科研团队自主研发的“通矩模型”不仅仅是一位能拿满分的“优等生”,更是一位能够创造优美、新颖题目的“出题名师”。

该研究论文的第一作者、北京通用人工智能研究院张驰博士介绍道:“我们在研究中发现了一个深刻的对称性。当一个几何命题的证明难度显著高于其构造复杂度时,它便具备了作为奥赛题目的‘审美价值’。通过对这种对称关系的建模,‘通矩模型’能够从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目。这在全球范围内尚属首次,成功实现了从‘模仿解题’到‘自主创造’的范式转变。”

在具体性能上,“通矩模型”同样展现了显著的效率优势。相比AlphaGeometry需要庞大的算力集群支持,“通矩模型”仅需单张消费级显卡(如RTX 4090)即可在最多38分钟内,解决近25年来的所有国际数学奥林匹克(IMO)几何难题,其推理效率和准确率均达到世界顶尖水平。此外,该系统通过创新的“规范化表示”技术,将搜索空间压缩了数个数量级,有效解决了传统方法中常见的路径组合爆炸问题。

目前,“通矩模型”的原创出题能力已在实际竞赛中得到验证与认可。该系统自主生成的3道几何新题,已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛(Ersatz Math Olympiad)的题目库,这标志着由AI原创的竞赛题目首次进入了高水平的人类数学竞赛舞台。

“‘通矩模型’的意义远超数学竞赛本身。”论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,“它通过‘小数据、大任务’的范式转换,证明了人工智能可以不再单纯依赖‘暴力计算’,而是通过理解逻辑底层的对称性与美感,实现自主的科学发现。这对于未来具身智能在复杂环境下的逻辑决策、自动化定理证明以及个性化教育等领域,都具有深远的战略价值。”

来源:https://www.163.com/dy/article/KKBSS98H0514R9M0.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

林俊杰离职后,首次发布长篇告别自述
科技数码
林俊杰离职后,首次发布长篇告别自述

新京报贝壳财经讯(记者罗亦丹)3月26日,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为From "Reasoning " Thinking to "Agentic "

热心网友
03.27
普林斯顿团队颠覆传统模型推理,速度提升19%的神奇方法
科技数码
普林斯顿团队颠覆传统模型推理,速度提升19%的神奇方法

在人工智能飞速发展的今天,大型语言模型已经成为我们日常生活中不可或缺的助手。然而,就像一台高性能跑车需要不断优化才能跑得更快一样,这些AI模型在生成文本时也面临着速度瓶颈。最近,由普林斯顿大学和LM

热心网友
03.26
MIT团队突破:AI系统如何掌握真实工程推理能力?
科技数码
MIT团队突破:AI系统如何掌握真实工程推理能力?

这项由麻省理工学院机械工程系和土木环境工程系联合开展的研究发表于2026年3月,论文编号为arXiv:2603 04124v1。研究团队针对一个关键问题展开探索:当我们用严格的奖励机制训练小型AI模

热心网友
03.16
MIT全新RandOpt算法,破解大模型训练久耗痛点
AI
MIT全新RandOpt算法,破解大模型训练久耗痛点

只需向模型添加高斯噪声,性能就能比肩甚至超越GRPO PPO等经典调参算法。MIT新论文向大家都在头疼的“调参”开炮了!为了将预训练模型变成某一任务领域专家,无数人夜以继日,纷纷掉发。然而现在,一对

热心网友
03.16
AI与基础科研融合的三大关键问题解析
科技数码
AI与基础科研融合的三大关键问题解析

(来源:麻省理工科技评论)好奇心驱动的研究长期以来一直是技术变革的火种。一个世纪前,对原子的好奇催生了量子力学,并最终孕育出现代计算核心的晶体管;反过来看,蒸汽机是一项实用的突破,但人们在热力学领域

热心网友
03.15

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

华为鸿蒙6.0.0.328升级:透明质感、灵动物与动态效果全解析
网络安全
华为鸿蒙6.0.0.328升级:透明质感、灵动物与动态效果全解析

每次系统更新,用户最怕的是什么?不是新功能不够多,而是又卡了、又耗电了、更新了个寂寞,这也导致许多用户不敢尝鲜。不过随着各大厂商的内卷程度加深,以及对系统本身的工艺技术得到了进一步的提升,如今系统更

热心网友
03.28
Excel查找最后一项匹配公式详解:5步精准定位
电脑教程
Excel查找最后一项匹配公式详解:5步精准定位

Excel中定位值最后一次出现位置并提取结果,可用五种公式:一、LOOKUP(2,1 (条件),返回列);二、INDEX+MATCH数组公式;三、XLOOKUP(search,lo

热心网友
03.28
小米SU7深度试驾体验:日常驾驶亮点与真实用户评测
科技数码
小米SU7深度试驾体验:日常驾驶亮点与真实用户评测

在新能源汽车市场竞争愈发激烈的当下,小米新一代SU7凭借专业媒体试驾反馈中的亮眼表现,成为近期车圈焦点。这款车虽定位运动型轿车,却在日常驾驶舒适性上展现出独特优势,收获众多好评。多家媒体在试驾过程中

热心网友
03.28
深蓝汽车电驱突破百万台,新一代技术如何创新效率新高
科技数码
深蓝汽车电驱突破百万台,新一代技术如何创新效率新高

深蓝汽车近日迎来重要里程碑,其第100万台电驱系统正式下线,标志着该品牌在电动化领域迈出关键一步。与此同时,全新一代原力超集电驱技术揭开面纱,以94 13%的系统工况效率刷新全球量产电驱纪录,功率密

热心网友
03.28
中建材携手吉利 共建南非新能源全链条合作共赢蓝图
科技数码
中建材携手吉利 共建南非新能源全链条合作共赢蓝图

在南非约翰内斯堡举办的2026年国际太阳能暨储能展上,一场备受瞩目的签约仪式吸引了众多目光。中国建材集团旗下的中建材南非有限公司与吉利控股集团旗下的吉利南非有限公司,正式签署了南非新能源转型战略合作

热心网友
03.28