
当大模型陷入到扩展定律的增长瓶颈时,下一代技术范式将会走向何方?
1月10日,在由清华大学基础模型北京市重点实验室、智谱AI发起的AGI-Next前沿峰会上,腾讯控股CEO/总裁办公室首席AI科学家姚顺雨、阿里巴巴Qwen技术负责人林俊晔、Kimi创始人杨植麟、智谱创始人唐杰等人工智能行业人士齐聚,共同探讨大模型的未来技术路径。
对于下一代范式的探讨中,自主学习成为了一个备受关注的核心概念,旨在帮助大模型摆脱对人工标注数据与离线预训练的严重依赖。通过自主生成学习信号、基于闭环环境进行不断迭代优化,从而实现持续进化的创新模式。在姚顺雨看来,自主学习已成为业界热议的焦点,从硅谷的咖啡馆到学术会议,大家逐渐形成了共识。然而,每个人对其具体定义与实践路径的看法仍不尽相同。
具体而言,自主学习并非一套通用的方法论,而是高度依赖于特定数据与任务场景的针对性实践。探索新的科学原理、进化至该领域的专业深度,本身也是一种自主学习的体现。其次,今天的Claude已能承担自身项目95%的代码转换工作,通过帮助自己变得更好,这算不算一种自我学习?
因此,姚顺雨认为,自主学习这件事已经在发生,只是受效率等因素的限制,仍存在诸多待解决的问题。在他看来,当前自主学习的范式迭代更趋近于渐进式演变,而非突然的突破。
至于目前全球市场中哪家企业最有可能率先引领范式创新,姚顺雨表示,尽管OpenAI经历了商业化等变革,创新基因有所弱化,但仍是最有可能孕育新范式的地方。
林俊晔认为,当前的强化学习范式尚处早期,潜力远未被充分挖掘,全球范围内仍面临诸多共性挑战。下一代范式的核心在于自主进化与主动行动能力。只是,自主进化是否需要更新模型参数,各家仍有不同的见解。
同时,主动性的提升也会引发新的安全议题,即AI可能基于自主意图在现实中采取行动。因此,在赋予AI主动性的同时,必须像教育孩子一样,为其注入正确的价值观与必要的行为约束。
杨植麟表示,在K2之后其团队也在持续探索下一代模型,其中最重要的改进之一是线性注意力机制,尝试在长程任务上超越传统全注意力机制的限制。
唐杰预测2026年将发生显著的范式革新,包括持续学习、记忆机制和多模态能力的融合,都有可能实现关键突破。过去工业界凭借远超学术界的算力优势主导了大模型发展,但这一局面正在显著改变。高校算力环境持续改善,尽管仍存在约十倍的计算差距,但学术界已具备孵化颠覆性技术的土壤。
现场,针对三五年后全球领先的AI公司来自中国团队的概率有多大这一问题,姚顺雨表示概率相当高。因为一旦某项技术路径被发现,在中国往往能够快速复现,并在许多应用场景中做得更好。关键要看中国在光刻机等关键技术上能否实现突破。中国市场具备电力优势与基础设施优势,主要瓶颈在于芯片产能与软件生态。
其次,需要培育更成熟的B端市场,或者尝试进入国际商业环境参与竞争。想要突破新范式或从事高风险探索的人才可能还不够多,这里有经济环境、商业环境以及文化等多重因素。姚顺雨如此说道。
另外,姚顺雨认为国内对刷榜或排名数字看得更重。相较而言,DeepSeek更注重什么是真正正确的事,什么是能实际体验出好与坏的东西。Anthropic的Claude模型在编程或软件工程榜单上排名或许不是最高,但行业都知道它的模型在这个领域是最好的。
