千问负责人林俊暋离职后首发声:大模型技术的未来思考
3月27日消息,3月26日晚间,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为《From "Reasoning" Thinking to "Agentic" Thinking》(从“推理式思维”到“智能体思维”)的文章。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
林俊旸在文章中并未透露与其职业规划相关的话题,而是聚焦技术探讨,详谈自己对大模型发展路线的理解及对AI下一阶段的预判。
林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可以成为一种被训练出来的能力。DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。
但 2025 年上半年,行业焦点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。
他提到,2025 年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。
林俊旸指出,概念上,这是正确的方向。但"合并"说起来容易,做好却极难。真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是,两种模式的数据分布和行为目标存在显著差异。
在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。分开做在实践中仍然有吸引力。
2025 年下半年,Qwen 的 2507 版本就发了独立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。
“推理链更长,不等于模型更聪明。很多时候,推理链越长,反而说明模型在乱花算力。”林俊旸在文中表示。随即,他提到千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,它的定义特征是跟真实世界的闭环交互。
智能体式思考和推理式思考,意味着不同的优化目标,推理式思考通常以最终答案前的内部思辨质量来评判:模型能否解出定理、写出证明、生成正确代码或通过基准测试。
而智能体思维关注的是:模型能否在与环境交互的过程中持续取得进展。这意味着,核心问题从“模型能否思考得足够久?”,转变为“模型能不能用一种撑得起有效行动的方式来思考?”模型训练的核心对象也随之变了,变成了模型加环境的整个系统。
在这之中,模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调,这些都进了核心圈。“好的思考”的定义也变了:在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条。林俊旸预测,智能体式思考会成为主流。
此前在3月4日凌晨,林俊旸在朋友圈发文告别阿里。他表示:“我要卸任了。再见,我亲爱的qwen。”
3月5日,阿里巴巴CEO吴泳铭在内部邮件中回应林俊旸离职一事,表示公司已决定批准林俊旸同学的辞职,感谢林俊旸过去在岗位上的付出。同时还表示,公司将继续坚持开源模型策略,持续加大AI研发投入和吸纳优秀人才力度。

相关攻略
阿里通义发布Fun-ASR1 5语音识别大模型:支持30种语言与汉语七大方言,识别准确率大幅提升 近日,语音识别技术领域迎来重大突破。阿里通义实验室正式推出其新一代语音识别大模型——Fun-ASR1 5。此次发布并非简单的功能升级,其展现出的强大技术包容性与广泛适用性,已在行业内引起广泛关注。 那么
阿里云桌面Agent工具CoPaw正式更名QwenPaw,深化开源生态整合 4月12日,开源社区迎来一则动态更新:阿里云旗下的桌面Agent工具CoPaw,发布了全新的1 1 0版本,并正式宣布更名为QwenPaw。 项目团队表示,这次品牌重塑绝非简单的“换马甲”,而是标志着项目进入了一个全新的开源
智谱GLM-5 说到GLM-5,它的优势其实非常聚焦,主要就体现在两个核心能力上:编程与智能体(Agent)。 如果你手头的项目涉及复杂的业务逻辑编码、系统架构设计,或是需要高标准的全工程代码审查,GLM-5的表现会相当亮眼。它不仅能理解代码,还能把背后的业务逻辑给你梳理得七七八八,这个能力在业内确
阿里千问重磅发布Qwen3 5-Omni:全能全模态大模型,解锁音视频实时交互新时代 2025年,阿里千问(通义千问)正式推出了其革命性的Qwen3 5-Omni全模态大型语言模型。此次发布标志着人工智能模型能力边界的重大突破,从传统的文本、图像处理,全面迈入了复杂的音频、视频理解与实时对话交互的新
3月27日消息,3月26日晚间,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为《From "Reasoning " Thinking to "Agentic " Thi
热门专题
热门推荐
HomeworkAI是什么 如果说有一款工具,能帮你把从微积分到生物学的作业难题拆解得明明白白,那HomeworkAI肯定榜上有名。它不是什么简单的搜题软件,而是一个由专业团队打造的AI学习伙伴,核心目标就是为学生提供步步引导的详细解决方案。无论是为了减轻课业压力,还是为了真正吃透知识点,这个智能平
Whatwide Productivity是什么 简单来说,Whatwide Productivity是一个帮你“偷懒”的高效工具箱。它由Whatwide公司打造,专门服务于那些日常需要处理大量文档、图像、音频,并且追求高效协作的专业人士。它的核心可以概括为四大支柱:智能文档生成、便捷的图像编辑、精
Mac开机静音全攻略:五种方法,总有一款适合你 经典的Mac开机“Duang”声,是许多用户熟悉的开机仪式。但在某些需要安静的场合,比如深夜、图书馆或会议室,这声清脆的提示音可能就显得有些不合时宜了。如果你也希望自己的Mac在启动时能保持低调,那么恭喜你,方法不止一种。从最便捷的系统设置,到一劳永逸
More Episodes!是什么 剧终意难平,是许多剧迷的共同体验。而今天要聊的这款工具,正是为此而生——More Episodes!。它由开发者tosh打造,核心基于GPT-4技术,专攻一件事:为你那些早已完结、看似再无下文的心爱剧集,续写全新的虚构故事。 简单来说,你可以把它想象成一个“剧集复
在区块链技术飞速演进的今天,互操作性已成为制约行业大规模应用的关键瓶颈。传统的“单链”世界如同一个个信息孤岛,资产与数据难以自由流通。而Polkadot的出现,以其革命性的多链架构,正在从根本上重塑这一格局,为构建一个真正互联的Web3世界提供了全新的解决方案。 Polkadot多链架构:超越单链的





