首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
我国通用AI逻辑推理领域实现重大跨越

我国通用AI逻辑推理领域实现重大跨越

热心网友
41
转载
2026-01-27

来源:科技日报

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

科技日报记者 杨雪

来自我国的科研团队成功研发出全球首个兼具自主出题与自动解题双重能力的通用人工智能系统——“通模型”。相关研究成果已于1月26日发表在《自然·机器智能》顶级期刊上。

奥林匹克数学竞赛素来被视作衡量人工智能逻辑推理能力的“试金石”。今年年初,DeepMind 公司开发的 AlphaGeometry 系统曾在全球引发轰动,展现出 AI 在解题方面的巨大潜力。然而,AlphaGeometry 本质上仍是一个“被动解题者”,其训练过程高度依赖海量合成数据和昂贵的计算资源。相比之下,我国团队自主研发的 TongGeometry 则展现出更高维度的智能水平:它不仅能像“优等生”一样完成满分答卷,更是一位能够创造优美、新颖题目的“出题名师”。

论文第一作者、北京通用人工智能研究院张弛博士介绍:“我们在研究中发现一个深刻的对偶关系:当一个几何命题的证明难度显著高于其构建复杂度时,它就具备了作为奥赛题目的‘审美价值’。通过对这种关系的建模,TongGeometry 能够从浩如烟海的空间组合中,精准捕捉到那些符合人类数学家审美标准的高质量题目。这在国际上首次实现了从‘模仿解题’到‘自主创造’的范式转变。”

在性能表现上,TongGeometry 展现了卓越的国产原创技术优势。相较于 AlphaGeometry 需要庞大的算力集群支撑,TongGeometry 仅需单张消费级显卡即可在最多 38 分钟内,解决近25年来的所有奥数几何难题,其推理效率和准确率均达到世界顶尖水准。此外,该系统通过创新的“规范化表示”技术,将搜索空间压缩了几个数量级,有效解决了传统方法中的路径爆炸问题。


论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,TongGeometry 的意义不仅在于解题速度的提升,更在于它通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能发展的关键。“我们的系统不仅能与国际最先进的 AI 系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。

目前,TongGeometry 的原创能力已获得专业学术界和竞赛圈的认可。系统自主生成的3道几何新题,已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛,这是AI原创题目首次进入高规格人类数学竞赛。

这一成果标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上全面超越了以DeepMind为代表的国际顶尖水平。该科研团队由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院,以及北京大学武汉人工智能研究院联合组成,未来将继续深耕“通系列”通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。

来源:https://www.163.com/dy/article/KK95U97Q0514R9OJ.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

林俊杰离职后,首次发布长篇告别自述
科技数码
林俊杰离职后,首次发布长篇告别自述

新京报贝壳财经讯(记者罗亦丹)3月26日,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为From "Reasoning " Thinking to "Agentic "

热心网友
03.27
普林斯顿团队颠覆传统模型推理,速度提升19%的神奇方法
科技数码
普林斯顿团队颠覆传统模型推理,速度提升19%的神奇方法

在人工智能飞速发展的今天,大型语言模型已经成为我们日常生活中不可或缺的助手。然而,就像一台高性能跑车需要不断优化才能跑得更快一样,这些AI模型在生成文本时也面临着速度瓶颈。最近,由普林斯顿大学和LM

热心网友
03.26
MIT团队突破:AI系统如何掌握真实工程推理能力?
科技数码
MIT团队突破:AI系统如何掌握真实工程推理能力?

这项由麻省理工学院机械工程系和土木环境工程系联合开展的研究发表于2026年3月,论文编号为arXiv:2603 04124v1。研究团队针对一个关键问题展开探索:当我们用严格的奖励机制训练小型AI模

热心网友
03.16
MIT全新RandOpt算法,破解大模型训练久耗痛点
AI
MIT全新RandOpt算法,破解大模型训练久耗痛点

只需向模型添加高斯噪声,性能就能比肩甚至超越GRPO PPO等经典调参算法。MIT新论文向大家都在头疼的“调参”开炮了!为了将预训练模型变成某一任务领域专家,无数人夜以继日,纷纷掉发。然而现在,一对

热心网友
03.16
AI与基础科研融合的三大关键问题解析
科技数码
AI与基础科研融合的三大关键问题解析

(来源:麻省理工科技评论)好奇心驱动的研究长期以来一直是技术变革的火种。一个世纪前,对原子的好奇催生了量子力学,并最终孕育出现代计算核心的晶体管;反过来看,蒸汽机是一项实用的突破,但人们在热力学领域

热心网友
03.15

最新APP

猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25

热门推荐

iOS 7状态栏美化指南:4步打造个性界面
电脑教程
iOS 7状态栏美化指南:4步打造个性界面

如何利用WinterBoard为iOS7状态栏及iPhone整体界面进行个性化美化?1、 打开Cydia应用,在顶部搜索框中输入“WinterBoard”,找到对应插件后点击安装并

热心网友
03.29
抖音视频封面无法更换?3步教你解决替换问题
手机教程
抖音视频封面无法更换?3步教你解决替换问题

在使用抖音时,有时会遇到视频封面无法更换的情况,这确实会让人有些困扰。不过别着急,以下为您提供一些可能的解决办法。首先,检查网络连接是否正常。不稳定的网络可能导致操作无法及时响应,

热心网友
03.29
第二代刀片电池上车:腾势D9预售38.98万起,快充仅9分钟
编程语言
第二代刀片电池上车:腾势D9预售38.98万起,快充仅9分钟

3月29日消息,今日上午,第二代腾势D9开启预售,共推出纯电、插混两种动力六款车型,预售价区间为38 98万-48 98万元。新车将于4月正式到店,预售期内下订可享受18个月免费闪充权益。新车纯电版

热心网友
03.29
DNF次元对决:奥术神袍强度解析与实战测评
游戏攻略
DNF次元对决:奥术神袍强度解析与实战测评

DNF次元对决模式已经上线,这是一个DNF的吃鸡游戏,游戏中玩家可以获得全新的装备,比如终极圣光奥术神袍,那么DNF次元对决终极圣光奥术神袍好用吗?下面就给大家带来DNF次元对决终

热心网友
03.29
阮喻许淮颂久别重逢:双向暗恋终成圆满欢喜
娱乐
阮喻许淮颂久别重逢:双向暗恋终成圆满欢喜

谁说暗恋只能是无声的独角戏呢?若暗恋被加上了双向的箭头,那不就成了两个人的兵荒马乱了吗?青春岁月里,一场无疾而终的怦然心动,成为了许淮颂与阮喻深埋心底的秘密。遗憾错过的他们,一个将暗恋写进小说里,一

热心网友
03.29