周伯文：当前大模型在专业推理能力方面的主要短板

时间：2026-01-28 21:07

“科学发现是AI的下一个前沿阵地，大规模深度推理将赋能科学发现，科学发现亦将反哺推理能力的进化。”上海人工智能实验室主任、首席科学家周伯文日前在第四十届人工智能协会年会（AAAI 2026）发布特邀

“科学发现将成为人工智能发展的下一个前沿阵地，大规模深度推理将赋能科学探索，而科学发现也将反过来推动AI推理能力的进化。”在第四十届人工智能协会年会（AAAI 2026）上，上海人工智能实验室主任、首席科学家周伯文发表特邀报告，提出了这一判断。他表示，当前我们正处在通用人工智能来临的前夜，但现有的智能仍然缺乏“通专融合”的能力，亟需推动科学智能从1.0向2.0迭代演进，即从AI4S迈向AGI4S。

通往AGI必须打破“通”与“专”的二元对立

人工智能的发展历程并非线性堆叠，而是呈现出明显的阶段性跃迁。回顾AI发展的历史坐标，有助于我们厘清当下所处的位置，并看清未来的前进方向。

早在上世纪90年代涉足AI研究之初，周伯文便开始思考智能的本质。他在担任IBM人工智能基础研究院院长期间，便提出了通往通用人工智能的战略路线图，将AI发展划分为三个关键阶段：ANI（狭义人工智能）、ABI（广义人工智能）与AGI。

在他看来，ANI在2016年已经趋于成熟，而通往AGI的必经之路并非直接跃迁，而是必须率先实现具备跨领域泛化能力的ABI。这一跨越需要技术范式的根本性变革，至少包括从有监督学习转向自监督学习、从人类分割任务级联式系统转向端到端架构、以及从判别式工具进化为生成式助手。ChatGPT的问世，第一次验证了人工智能系统能同时达成这三方面的变革，实质上宣告了ABI阶段的到来。这一历史性突破验证了规模法则（Scaling Law）的有效性——通过扩大Transformer架构并将“下一个词预测”作为优化目标，人类首次实现了对世界知识的“压缩”。

Scaling Law赋予了大语言模型广泛的泛化能力（ABI），而通往AGI的下一步，绝不仅仅是计算量的堆叠。一条可行的路径是实现“通专融合”，其核心思想是动态地融合人类认知思维中的“系统1”（直觉式快思考）和“系统2”（逻辑式慢思考），以应对现实世界纷繁复杂的各类任务。

过去的七十年间，AI的发展长期在“专业性”与“通用性”两个维度上分别进展。以AlphaFold为代表的早期系统是极致的“专家”，在特定领域超越人类却缺乏迁移能力；而当前的大语言模型则是“博闻广识”的“通才”，虽具备广度但在处理复杂专业任务时，往往难以企及专家的深度，也缺乏对关键细节的把握。

周伯文表示，真正的AGI必须打破这种二元对立，构建一种能够动态融合系统1与系统2的智能架构。这意味着在保持通用认知底座的同时，AI能够针对任意特定任务，通过持续学习与深度推理，实现专家级别的专精。上海AI实验室提出的“智者SAGE”技术架构，便是一个旨在弥合广泛泛化与深度专精鸿沟的统一认知生态系统。

过度依赖现有模型可能阻碍创新

人工智能的下一个前沿领域是什么？周伯文的答案是科学发现。他表示：“除了科学智能（AI for Science， AI4S）所承诺的治愈癌症等诸多益处之外，科学发现更是对推理智能的终极考验，因此也是AI探索的绝对前沿。” 科学发现是已知与未知之间复杂的相互作用，它涵盖了从假设生成、实验验证到理论总结的全过程。

这对AI提出了三重挑战：首先是“已知的未知”，典型的如组合爆炸，比如分子设计或材料科学的搜索空间高达量级，远超传统遍历能力；其次是“未知的未知”，科学探索本质上是对分布外知识的泛化，是对模型创造力的真正考验；最后是稀疏与延迟奖励，科学实验周期长、反馈慢，是对强化学习算法的严峻测试。

尽管以AlphaFold为代表的AI4S技术在蛋白质折叠、气象预测等特定领域取得了里程碑式成就，但近期《Nature》发表的研究指出，过度依赖现有深度学习模型可能会局限新知识的探索边界，甚至在某种程度上阻碍创新。

周伯文表示，擅长处理数据充足、定义明确任务的传统深度学习，如果仅作为工具存在，难以应对科学发现中“未知的未知”。一项系统性的评估进一步揭示了当前前沿模型的短板。上海人工智能实验室联合来自10个不同科学领域的100位科学家设计了评估体系，结果显示，前沿模型在通用科学推理任务中得分可达50分（满分为100分），但在专项文献检索、具体实验方案设计等各类专业推理任务中，得分则骤降至15-30分。

这种明显的“木桶效应”表明，科学发现全周期的效能正受制于专业推理能力的薄弱环节。因此，整合通用推理与专业能力，进而推动科学智能从AI4S向AGI4S迭代成为必然选择。从AI4S迈向AGI4S，这一升级旨在推动研究者、研究工具与研究对象的协同演进。通过AGI促进三者相互作用、协同演进、螺旋式上升，将创造出真正革命性的工具，推动科研范式变革。

周伯文重申，当前我们已身处通用人工智能的前夕，但仍缺乏通专融合的智能，亟需推动科学智能从1.0向2.0迭代演进，即从AI4S迈向AGI4S。他认为，“可深度专业化的通用模型”是实现AGI的可行路径，其关键挑战与思路在于：专业化模型在训练过程中需要低成本、能规模化的密集反馈，能够持续不断地学习与主动探索，并具备为同一个问题提供多视角、多种解决方案的能力。

澎湃新闻记者张静

来源：https://www.163.com/dy/article/KKCP25K10514R9P4.html