游乐游手机版
首页/业界动态/文章详情

千问负责人林俊暋离职后首发声:大模型技术的未来思考

时间:2026-03-27 09:48
3月27日消息,3月26日晚间,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为《From "Reasoning " Thinking to "Agentic " Thi

3月27日消息,3月26日晚间,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为《From "Reasoning" Thinking to "Agentic" Thinking》(从“推理式思维”到“智能体思维”)的文章。

林俊旸在文章中并未透露与其职业规划相关的话题,而是聚焦技术探讨,详谈自己对大模型发展路线的理解及对AI下一阶段的预判。

林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可以成为一种被训练出来的能力。DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。

但 2025 年上半年,行业焦点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。

他提到,2025 年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。

林俊旸指出,概念上,这是正确的方向。但"合并"说起来容易,做好却极难。真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是,两种模式的数据分布和行为目标存在显著差异。

在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。分开做在实践中仍然有吸引力。

2025 年下半年,Qwen 的 2507 版本就发了独立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。

“推理链更长,不等于模型更聪明。很多时候,推理链越长,反而说明模型在乱花算力。”林俊旸在文中表示。随即,他提到千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,它的定义特征是跟真实世界的闭环交互。

智能体式思考和推理式思考,意味着不同的优化目标,推理式思考通常以最终答案前的内部思辨质量来评判:模型能否解出定理、写出证明、生成正确代码或通过基准测试。

而智能体思维关注的是:模型能否在与环境交互的过程中持续取得进展。这意味着,核心问题从“模型能否思考得足够久?”,转变为“模型能不能用一种撑得起有效行动的方式来思考?”模型训练的核心对象也随之变了,变成了模型加环境的整个系统。

在这之中,模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调,这些都进了核心圈。“好的思考”的定义也变了:在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条。林俊旸预测,智能体式思考会成为主流。

此前在3月4日凌晨,林俊旸在朋友圈发文告别阿里。他表示:“我要卸任了。再见,我亲爱的qwen。”

3月5日,阿里巴巴CEO吴泳铭在内部邮件中回应林俊旸离职一事,表示公司已决定批准林俊旸同学的辞职,感谢林俊旸过去在岗位上的付出。同时还表示,公司将继续坚持开源模型策略,持续加大AI研发投入和吸纳优秀人才力度。

前千问大模型技术负责人林俊旸离职后首发长文 并谈及千问

来源:https://m.mydrivers.com/newsview/1111941.html
上一篇官方回应司机占道闯红灯竖中指:罚款200元扣6分 下一篇王兴:美团App将优先升级为AI应用,提升用户体验
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
诺基亚TA-1619入网:1400mAh电池双卡双待新机
业界动态 · 2026-07-01

诺基亚TA-1619入网:1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息,一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可,不过证件照目前还没公布。 从入网信息来看,这是一款TD-LTE数字移动电话机,支持TD-LTE网络,属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持,终端款式为直板。核心配置方面,电池额定容

芯佰微CBMRF900系列国产射频芯片突破海外壁垒
业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片,采用直接变频架构,覆盖10MHz至7250MHz频段,支持最大450MHz带宽及JESD204B高速接口,性能对标国际,满足5G基站与卫星通信等高端需求,突破海外技术壁垒。

月起私人充电桩可卖电 每度净赚5毛
业界动态 · 2026-07-01

月起私人充电桩可卖电 每度净赚5毛

近期有一则重大利好消息,值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起,湖北武汉的新能源车主,可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言,就是借助峰谷电价差,实现低买高卖,每度电净收益约5毛钱。过去,车网互动(V2G)基本只局限于特定的公共充电站,受试点规模限制,

谷歌发布Nano Banana 2 Lite 4秒出图1元4张
业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息:谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息,Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发,实际上它的技术代号是Gemini 3 1 Flash Lite Image,属于Gemini 3 1家族。最大的卖点就两个:快,便

技嘉专业电竞装备助力2025 CFS世界总决赛
业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行,来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴,以主板、显示器等专业硬件保障比赛稳定流畅,并通过赛事反哺研发的闭环模式支持电竞发展。