中国科学家实现通用人工智能推理突破:难题解决与创新出题
新华社北京1月26日电(记者魏梦佳)由中国科研团队自主研发的“通矩模型”近日取得重要突破,该成果于26日晚在线发表于国际权威学术期刊《自然-机器智能》。相关专家表示,这是国际上首个同时具备自主出题和自动解题双重能力的通用人工智能系统,标志着中国科研团队在自动化推理的逻辑核心领域实现关键核心技术自研,并在性能与功能多样性上达到国际领先水平。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
长期以来,人工智能在逻辑推理领域面临着两大核心挑战:其一是“组合爆炸”问题,即几何推理往往需要寻找并添加精妙的辅助线,每增加一个点或圆,搜索空间(即探索模型中所有可能的解决方案)都会呈指数级增长;其二是“高质量数据匮乏”问题,即现有的几何题目库规模较小,难以支持大规模模型的训练。
由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院以及北京大学武汉人工智能研究院组成的联合科研团队,通过开发一套精密的逻辑推理搜索架构,将复杂的几何世界抽象建模,使得AI系统能像人类数学家一样,在逻辑推理的每个节点上都能进行有序地系统性探索,避免了无效的重复尝试。
据悉,团队创新性地引入了“规范化表示”技术。这套机制赋予了AI一种“识破伪装”的能力:在复杂的几何空间中,同一个命题往往会因为图形的旋转、翻转或缩放而产生无数种表现形式。通矩模型能自动识别并合并这些对称或同构的拓扑结构,将庞杂的搜索空间压缩了几个数量级。例如,无论一个三角形在空间中如何摆放,系统都能精准锁定其本质的几何关系。这种对物理对称性的深度利用,极大地提升了搜索效率。
而在AI寻找解题“灵感”的过程中,系统通过价值函数来模拟人类的数学审美。借助强化学习技术,系统内置的“价值模型”能实时预判每一条推理路径的潜力——不仅判断结论是否成立,更在乎推导过程是否简洁。
“当AI发现一个命题的证明难度显著高于其构建复杂度时,它便捕捉到了那一抹‘直觉性的灵感’。”论文第一作者、北京通用人工智能研究院研究员张驰表示,这种“价值引导”能让模型从浩如烟海的组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目,“实现了从‘模仿解题’到‘自主创造’的范式转变,这在国际上尚属首次。”
图为团队成员正在讨论算法设计的几何问题。新华社发
张驰介绍,通矩模型仅需单张消费级显卡即可在最多38分钟内解决2000年以来所有国际数学奥林匹克竞赛的几何难题。实验表明,其推理效率和准确率均达国际先进水平。
论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,通矩模型的意义不仅在于解题速度的提升,更在于其通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。
“这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能发展的关键。我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。
据悉,目前通矩模型自主生成的3道原创几何新题,已入选2024年全国中学生数学联赛(北京赛区)。
张驰表示,这一成果为未来自动化数学证明、个性化智能教育及科学大模型的开发提供了技术支撑,有助于为更多感兴趣的青少年提供优质题目和讲解服务。未来,团队将继续深耕通用智能模型,推动中国人工智能技术在更复杂逻辑与科学发现领域实现领跑。
相关攻略
新京报贝壳财经讯(记者罗亦丹)3月26日,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为From "Reasoning " Thinking to "Agentic "
在人工智能飞速发展的今天,大型语言模型已经成为我们日常生活中不可或缺的助手。然而,就像一台高性能跑车需要不断优化才能跑得更快一样,这些AI模型在生成文本时也面临着速度瓶颈。最近,由普林斯顿大学和LM
这项由麻省理工学院机械工程系和土木环境工程系联合开展的研究发表于2026年3月,论文编号为arXiv:2603 04124v1。研究团队针对一个关键问题展开探索:当我们用严格的奖励机制训练小型AI模
只需向模型添加高斯噪声,性能就能比肩甚至超越GRPO PPO等经典调参算法。MIT新论文向大家都在头疼的“调参”开炮了!为了将预训练模型变成某一任务领域专家,无数人夜以继日,纷纷掉发。然而现在,一对
(来源:麻省理工科技评论)好奇心驱动的研究长期以来一直是技术变革的火种。一个世纪前,对原子的好奇催生了量子力学,并最终孕育出现代计算核心的晶体管;反过来看,蒸汽机是一项实用的突破,但人们在热力学领域
热门专题
热门推荐
鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;
3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失
预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个





