周伯文:当前大模型在专业推理能力方面的主要短板
“科学发现将成为人工智能发展的下一个前沿阵地,大规模深度推理将赋能科学探索,而科学发现也将反过来推动AI推理能力的进化。”在第四十届人工智能协会年会(AAAI 2026)上,上海人工智能实验室主任、首席科学家周伯文发表特邀报告,提出了这一判断。他表示,当前我们正处在通用人工智能来临的前夜,但现有的智能仍然缺乏“通专融合”的能力,亟需推动科学智能从1.0向2.0迭代演进,即从AI4S迈向AGI4S。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
通往AGI必须打破“通”与“专”的二元对立
人工智能的发展历程并非线性堆叠,而是呈现出明显的阶段性跃迁。回顾AI发展的历史坐标,有助于我们厘清当下所处的位置,并看清未来的前进方向。
早在上世纪90年代涉足AI研究之初,周伯文便开始思考智能的本质。他在担任IBM人工智能基础研究院院长期间,便提出了通往通用人工智能的战略路线图,将AI发展划分为三个关键阶段:ANI(狭义人工智能)、ABI(广义人工智能)与AGI。
在他看来,ANI在2016年已经趋于成熟,而通往AGI的必经之路并非直接跃迁,而是必须率先实现具备跨领域泛化能力的ABI。这一跨越需要技术范式的根本性变革,至少包括从有监督学习转向自监督学习、从人类分割任务级联式系统转向端到端架构、以及从判别式工具进化为生成式助手。ChatGPT的问世,第一次验证了人工智能系统能同时达成这三方面的变革,实质上宣告了ABI阶段的到来。这一历史性突破验证了规模法则(Scaling Law)的有效性——通过扩大Transformer架构并将“下一个词预测”作为优化目标,人类首次实现了对世界知识的“压缩”。
Scaling Law赋予了大语言模型广泛的泛化能力(ABI),而通往AGI的下一步,绝不仅仅是计算量的堆叠。一条可行的路径是实现“通专融合”,其核心思想是动态地融合人类认知思维中的“系统1”(直觉式快思考)和“系统2”(逻辑式慢思考),以应对现实世界纷繁复杂的各类任务。
过去的七十年间,AI的发展长期在“专业性”与“通用性”两个维度上分别进展。以AlphaFold为代表的早期系统是极致的“专家”,在特定领域超越人类却缺乏迁移能力;而当前的大语言模型则是“博闻广识”的“通才”,虽具备广度但在处理复杂专业任务时,往往难以企及专家的深度,也缺乏对关键细节的把握。
周伯文表示,真正的AGI必须打破这种二元对立,构建一种能够动态融合系统1与系统2的智能架构。这意味着在保持通用认知底座的同时,AI能够针对任意特定任务,通过持续学习与深度推理,实现专家级别的专精。上海AI实验室提出的“智者SAGE”技术架构,便是一个旨在弥合广泛泛化与深度专精鸿沟的统一认知生态系统。
过度依赖现有模型可能阻碍创新
人工智能的下一个前沿领域是什么?周伯文的答案是科学发现。他表示:“除了科学智能(AI for Science, AI4S)所承诺的治愈癌症等诸多益处之外,科学发现更是对推理智能的终极考验,因此也是AI探索的绝对前沿。” 科学发现是已知与未知之间复杂的相互作用,它涵盖了从假设生成、实验验证到理论总结的全过程。
这对AI提出了三重挑战:首先是“已知的未知”,典型的如组合爆炸,比如分子设计或材料科学的搜索空间高达量级,远超传统遍历能力;其次是“未知的未知”,科学探索本质上是对分布外知识的泛化,是对模型创造力的真正考验;最后是稀疏与延迟奖励,科学实验周期长、反馈慢,是对强化学习算法的严峻测试。
尽管以AlphaFold为代表的AI4S技术在蛋白质折叠、气象预测等特定领域取得了里程碑式成就,但近期《Nature》发表的研究指出,过度依赖现有深度学习模型可能会局限新知识的探索边界,甚至在某种程度上阻碍创新。
周伯文表示,擅长处理数据充足、定义明确任务的传统深度学习,如果仅作为工具存在,难以应对科学发现中“未知的未知”。一项系统性的评估进一步揭示了当前前沿模型的短板。上海人工智能实验室联合来自10个不同科学领域的100位科学家设计了评估体系,结果显示,前沿模型在通用科学推理任务中得分可达50分(满分为100分),但在专项文献检索、具体实验方案设计等各类专业推理任务中,得分则骤降至15-30分。
这种明显的“木桶效应”表明,科学发现全周期的效能正受制于专业推理能力的薄弱环节。因此,整合通用推理与专业能力,进而推动科学智能从AI4S向AGI4S迭代成为必然选择。从AI4S迈向AGI4S,这一升级旨在推动研究者、研究工具与研究对象的协同演进。通过AGI促进三者相互作用、协同演进、螺旋式上升,将创造出真正革命性的工具,推动科研范式变革。
周伯文重申,当前我们已身处通用人工智能的前夕,但仍缺乏通专融合的智能,亟需推动科学智能从1.0向2.0迭代演进,即从AI4S迈向AGI4S。他认为,“可深度专业化的通用模型”是实现AGI的可行路径,其关键挑战与思路在于:专业化模型在训练过程中需要低成本、能规模化的密集反馈,能够持续不断地学习与主动探索,并具备为同一个问题提供多视角、多种解决方案的能力。
澎湃新闻记者 张静
相关攻略
一个学生忽视了一行代码,结果发现了一件很不对劲的事:在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。按理说系统应该报错,或者至少拒绝回
雷递网 乐天 3月31日智谱CEO张鹏今日在智谱2025年年报沟通会上表示,智谱曾经历过质疑,经历过挫折,但无数事实反复验证了一个判断——智能上界的提升,是大模型AGI时代唯一的 "第一性 "。张鹏说,
快科技3月31日消息,近日,比利时布鲁塞尔自由大学(VUB)数据分析实验室发布重磅研究成果,证实商用大型语言模型已具备独立生成原创数学证明的能力。OpenAI旗下ChatGPT-5 2(Thinki
这项由谷歌智能范式团队联合芝加哥大学、圣塔菲研究所等多家机构完成的突破性研究发表于2026年3月,研究编号为arXiv:2603 20639v1。有兴趣深入了解的读者可以通过这个编号查询完整论文。这
这项由高通AI研究院领导的突破性研究发表于2026年3月的预印本论文,论文编号为arXiv:2603 08462v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究解决了一个让所有AI研究
热门专题
热门推荐
《逸剑风云决》叶飞支线任务全攻略:触发条件与莲心湖位置详解 不少《逸剑风云决》玩家在推进支线任务时,常会困惑于叶飞角色的触发条件。尤其是在到达莲心湖地图后,许多玩家反复探索却无法找到叶飞,“莲心湖找不到叶飞”已成为常见问题。实际上,这并非游戏BUG,而是一系列精密的剧情前置要求未被满足。本指南将系统
《永恒树之歌:创世》世界种子攻略:获取方法、选址布局与高效家园建设指南 初次来到《永恒树之歌:创世》的阿莱瑞亚大陆,面对这片等待复苏的丰饶世界,你需要掌握的第一个核心机制就是“世界种子”。这款以自然共生与家园重建为主题的治愈系模拟经营游戏中,世界种子不仅是开启建设的钥匙,更是决定未来发展潜力的基石。
《纪念碑谷3》全章节图文攻略:从灯塔解密到莲花祭坛的完整流程解析 备受期待的视觉解谜游戏《纪念碑谷3》延续了系列标志性的极简美学与沉浸式空间叙事。游戏关卡设计由浅入深,即便是新手也能快速掌握核心机制,逐步建立对空间变换与机关互动的直觉。近期,“纪念碑谷3怎么通关”、“第三章攻略”、“莲花机关怎么过”
速览 你是否正在寻找《红色沙漠》中最强装备升级的关键材料——动力核心?本指南将为你精准揭秘动力核心的唯一高效获取途径:击败强大的阿比斯生命体。我们将详解如何根据不同核心定位特定目标怪物,传授运用法则之力的实战击杀技巧,并分享一个关键的核心掉落「S L小技巧」,助你系统性地提升收集效率,快速武装你的角
速览 在《红色沙漠》中,影子森林遗迹以其复杂的内部结构,成为许多玩家挑战的难点区域。解谜的关键路径其实并不复杂:首先我们需要前往阿方索领地,在此区域仔细探索,找到并触发一个被称为“可疑气息”的交互点,这即是通往遗迹内部的入口。进入遗迹后,最引人注目的便是那个被大量古老树藤严密包裹的核心机关。此时,玩





