首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
周伯文:当前大模型在专业推理能力方面的主要短板

周伯文:当前大模型在专业推理能力方面的主要短板

热心网友
27
转载
2026-01-28

“科学发现将成为人工智能发展的下一个前沿阵地,大规模深度推理将赋能科学探索,而科学发现也将反过来推动AI推理能力的进化。”在第四十届人工智能协会年会(AAAI 2026)上,上海人工智能实验室主任、首席科学家周伯文发表特邀报告,提出了这一判断。他表示,当前我们正处在通用人工智能来临的前夜,但现有的智能仍然缺乏“通专融合”的能力,亟需推动科学智能从1.0向2.0迭代演进,即从AI4S迈向AGI4S。

通往AGI必须打破“通”与“专”的二元对立

人工智能的发展历程并非线性堆叠,而是呈现出明显的阶段性跃迁。回顾AI发展的历史坐标,有助于我们厘清当下所处的位置,并看清未来的前进方向。

早在上世纪90年代涉足AI研究之初,周伯文便开始思考智能的本质。他在担任IBM人工智能基础研究院院长期间,便提出了通往通用人工智能的战略路线图,将AI发展划分为三个关键阶段:ANI(狭义人工智能)、ABI(广义人工智能)与AGI。

在他看来,ANI在2016年已经趋于成熟,而通往AGI的必经之路并非直接跃迁,而是必须率先实现具备跨领域泛化能力的ABI。这一跨越需要技术范式的根本性变革,至少包括从有监督学习转向自监督学习、从人类分割任务级联式系统转向端到端架构、以及从判别式工具进化为生成式助手。ChatGPT的问世,第一次验证了人工智能系统能同时达成这三方面的变革,实质上宣告了ABI阶段的到来。这一历史性突破验证了规模法则(Scaling Law)的有效性——通过扩大Transformer架构并将“下一个词预测”作为优化目标,人类首次实现了对世界知识的“压缩”。

Scaling Law赋予了大语言模型广泛的泛化能力(ABI),而通往AGI的下一步,绝不仅仅是计算量的堆叠。一条可行的路径是实现“通专融合”,其核心思想是动态地融合人类认知思维中的“系统1”(直觉式快思考)和“系统2”(逻辑式慢思考),以应对现实世界纷繁复杂的各类任务。

过去的七十年间,AI的发展长期在“专业性”与“通用性”两个维度上分别进展。以AlphaFold为代表的早期系统是极致的“专家”,在特定领域超越人类却缺乏迁移能力;而当前的大语言模型则是“博闻广识”的“通才”,虽具备广度但在处理复杂专业任务时,往往难以企及专家的深度,也缺乏对关键细节的把握。

周伯文表示,真正的AGI必须打破这种二元对立,构建一种能够动态融合系统1与系统2的智能架构。这意味着在保持通用认知底座的同时,AI能够针对任意特定任务,通过持续学习与深度推理,实现专家级别的专精。上海AI实验室提出的“智者SAGE”技术架构,便是一个旨在弥合广泛泛化与深度专精鸿沟的统一认知生态系统。

过度依赖现有模型可能阻碍创新

人工智能的下一个前沿领域是什么?周伯文的答案是科学发现。他表示:“除了科学智能(AI for Science, AI4S)所承诺的治愈癌症等诸多益处之外,科学发现更是对推理智能的终极考验,因此也是AI探索的绝对前沿。” 科学发现是已知与未知之间复杂的相互作用,它涵盖了从假设生成、实验验证到理论总结的全过程。

这对AI提出了三重挑战:首先是“已知的未知”,典型的如组合爆炸,比如分子设计或材料科学的搜索空间高达量级,远超传统遍历能力;其次是“未知的未知”,科学探索本质上是对分布外知识的泛化,是对模型创造力的真正考验;最后是稀疏与延迟奖励,科学实验周期长、反馈慢,是对强化学习算法的严峻测试。

尽管以AlphaFold为代表的AI4S技术在蛋白质折叠、气象预测等特定领域取得了里程碑式成就,但近期《Nature》发表的研究指出,过度依赖现有深度学习模型可能会局限新知识的探索边界,甚至在某种程度上阻碍创新。

周伯文表示,擅长处理数据充足、定义明确任务的传统深度学习,如果仅作为工具存在,难以应对科学发现中“未知的未知”。一项系统性的评估进一步揭示了当前前沿模型的短板。上海人工智能实验室联合来自10个不同科学领域的100位科学家设计了评估体系,结果显示,前沿模型在通用科学推理任务中得分可达50分(满分为100分),但在专项文献检索、具体实验方案设计等各类专业推理任务中,得分则骤降至15-30分。

这种明显的“木桶效应”表明,科学发现全周期的效能正受制于专业推理能力的薄弱环节。因此,整合通用推理与专业能力,进而推动科学智能从AI4S向AGI4S迭代成为必然选择。从AI4S迈向AGI4S,这一升级旨在推动研究者、研究工具与研究对象的协同演进。通过AGI促进三者相互作用、协同演进、螺旋式上升,将创造出真正革命性的工具,推动科研范式变革。

周伯文重申,当前我们已身处通用人工智能的前夕,但仍缺乏通专融合的智能,亟需推动科学智能从1.0向2.0迭代演进,即从AI4S迈向AGI4S。他认为,“可深度专业化的通用模型”是实现AGI的可行路径,其关键挑战与思路在于:专业化模型在训练过程中需要低成本、能规模化的密集反馈,能够持续不断地学习与主动探索,并具备为同一个问题提供多视角、多种解决方案的能力。

澎湃新闻记者 张静

来源:https://www.163.com/dy/article/KKCP25K10514R9P4.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

搜索成本仅为推理十分之一却鲜为人知的行业真相
科技数码
搜索成本仅为推理十分之一却鲜为人知的行业真相

OpenClaw的爆火,让众多AI应用开发者第一次直面了高昂的Token账单——一个用户请求可能触发多轮工具调用,每次调用都携带超长上下文,实际的API成本远超预期,甚至可能达到订阅费用的数十倍。如何有效控制Token成本,正成为AI Agent开发者面临的核心挑战与增长瓶颈。 这显然不是可持续的商

热心网友
05.12
EPFL等机构发现大语言模型的内部思维与人类创造性大脑高度同步
科技数码
EPFL等机构发现大语言模型的内部思维与人类创造性大脑高度同步

这项由瑞士洛桑联邦理工学院(EPFL)、意大利卢加诺大学(USI)、韦斯利安大学、巴黎脑研究所(ICM)以及宾夕法尼亚州立大学联合开展的研究,以预印本形式发布于2026年4月,论文编号为arXiv:2604 03480。对这一交叉领域感兴趣的读者,可以通过该编号在arXiv平台上查阅完整原文。 一、

热心网友
04.22
摩尔线程完成智谱GLM-5.1适配
科技数码
摩尔线程完成智谱GLM-5.1适配

北京商报讯(记者 陶凤 王天逸) 人工智能领域又传来一条振奋人心的消息。4月8日,摩尔线程正式宣布,其旗舰级AI训推一体全功能GPU——MTT S5000,已经成功完成了对智谱新一代旗舰模型GLM-5 1的Day-0极速适配。这意味着,推理部署与训练复现的全部流程,现在都能在这条国产算力路径上获得支

热心网友
04.15
如何利用SQL进行推理
数据库
如何利用SQL进行推理

如何用SQL求解逻辑推理题:经典楼层分配谜题实战 今天我们来探讨一个非常有趣的技术应用:使用SQL来求解逻辑推理题。这听起来或许有些大材小用,但正是这种跨界应用,充分展现了SQL语言的强大灵活性以及开发者分析问题的思维能力。我们将以一个经典的五人楼层分配谜题作为案例,逐步拆解如何用纯粹的SQL找到答

热心网友
04.14
AI看图能力真伪探秘:它是否真是编出来的?
科技数码
AI看图能力真伪探秘:它是否真是编出来的?

一个学生忽视了一行代码,结果发现了一件很不对劲的事:在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。按理说系统应该报错,或者至少拒绝回

热心网友
04.01

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

华硕枪神10X发布 搭载9950X3D与全息光显风扇
科技数码
华硕枪神10X发布 搭载9950X3D与全息光显风扇

华硕在ROGDAY2026上发布了枪神10X整机,首次搭载三颗可联动显示的全息光显风扇,外观极具未来感。其核心配置顶级,采用AMD锐龙99950X3D2处理器、ROGRTX5080显卡、64GB内存及4TBSSD,并配备高效三区独立散热系统,定价69999元。

热心网友
05.16
鹿客V3 Max智能门锁发布 支持4米远距离无线充电
科技数码
鹿客V3 Max智能门锁发布 支持4米远距离无线充电

智能门锁领域迎来重磅新品。知名品牌鹿客近期于京东平台正式发售其旗舰型号V3 Max智能门锁,该产品凭借创新的隔空无线充电技术与先进的AI视觉识别系统引发市场关注。官方定价为3572元,在部分参与促销活动的地区,消费者可享受补贴,最终入手价有望低至2799元,性价比优势显著。 鹿客V3 Max在视觉安

热心网友
05.16
华硕ROG魔霸10系列游戏本发布 搭载9955HX3D与RTX 5070 Ti
科技数码
华硕ROG魔霸10系列游戏本发布 搭载9955HX3D与RTX 5070 Ti

在备受瞩目的ROG DAY 2026广州站活动中,华硕重磅发布了其新一代高性能游戏笔记本电脑——ROG魔霸10系列。该系列包含16英寸的魔霸10与屏幕更大的18英寸魔霸10 Plus两款机型,旨在为硬核玩家带来顶级的游戏体验。 ROG魔霸10系列的硬件配置堪称顶级。处理器方面,用户最高可选择搭载AM

热心网友
05.16
小米手环10 Pro配置曝光 双灯组双PD传感器升级详解
科技数码
小米手环10 Pro配置曝光 双灯组双PD传感器升级详解

5月15日,小米官方正式公布了小米手环10 Pro的完整配置信息。作为新一代旗舰手环,它在健康监测精准度、运动功能专业度以及佩戴舒适度上均实现了显著突破,为用户带来了更全面的智能穿戴体验。 小米手环10 Pro 健康监测:精度与维度的双重跃升 本次升级的核心在于健康监测能力的全面进化。小米手环10

热心网友
05.16
金士顿推出新款FURY Renegade Pro DDR5 RDIMM内存散热马甲
科技数码
金士顿推出新款FURY Renegade Pro DDR5 RDIMM内存散热马甲

金士顿扩展其可超频的ECCRDIMM内存系列,新增高达7600MT s型号。其中高速型号采用全新铝制散热马甲,提升散热效率以保障高负载下的稳定运行。该系列同时支持ECC校验与超频,兼顾性能与数据完整性,适用于AI计算、工程仿真等高要求专业场景。

热心网友
05.16