首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
千问负责人林俊暋离职后首发声:大模型技术的未来思考

千问负责人林俊暋离职后首发声:大模型技术的未来思考

热心网友
70
转载
2026-03-27

3月27日消息,3月26日晚间,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为《From "Reasoning" Thinking to "Agentic" Thinking》(从“推理式思维”到“智能体思维”)的文章。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

林俊旸在文章中并未透露与其职业规划相关的话题,而是聚焦技术探讨,详谈自己对大模型发展路线的理解及对AI下一阶段的预判。

林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可以成为一种被训练出来的能力。DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。

但 2025 年上半年,行业焦点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。

他提到,2025 年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。

林俊旸指出,概念上,这是正确的方向。但"合并"说起来容易,做好却极难。真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是,两种模式的数据分布和行为目标存在显著差异。

在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。分开做在实践中仍然有吸引力。

2025 年下半年,Qwen 的 2507 版本就发了独立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。

“推理链更长,不等于模型更聪明。很多时候,推理链越长,反而说明模型在乱花算力。”林俊旸在文中表示。随即,他提到千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,它的定义特征是跟真实世界的闭环交互。

智能体式思考和推理式思考,意味着不同的优化目标,推理式思考通常以最终答案前的内部思辨质量来评判:模型能否解出定理、写出证明、生成正确代码或通过基准测试。

而智能体思维关注的是:模型能否在与环境交互的过程中持续取得进展。这意味着,核心问题从“模型能否思考得足够久?”,转变为“模型能不能用一种撑得起有效行动的方式来思考?”模型训练的核心对象也随之变了,变成了模型加环境的整个系统。

在这之中,模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调,这些都进了核心圈。“好的思考”的定义也变了:在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条。林俊旸预测,智能体式思考会成为主流。

此前在3月4日凌晨,林俊旸在朋友圈发文告别阿里。他表示:“我要卸任了。再见,我亲爱的qwen。”

3月5日,阿里巴巴CEO吴泳铭在内部邮件中回应林俊旸离职一事,表示公司已决定批准林俊旸同学的辞职,感谢林俊旸过去在岗位上的付出。同时还表示,公司将继续坚持开源模型策略,持续加大AI研发投入和吸纳优秀人才力度。

前千问大模型技术负责人林俊旸离职后首发长文 并谈及千问

来源:https://m.mydrivers.com/newsview/1111941.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

千问负责人林俊暋离职后首发声:大模型技术的未来思考
业界动态
千问负责人林俊暋离职后首发声:大模型技术的未来思考

3月27日消息,3月26日晚间,在本月初离职,广受科技圈关注的原阿里千问技术负责人林俊旸在社交账号发布了一篇名为《From "Reasoning " Thinking to "Agentic " Thi

热心网友
03.27
通义千问2.5升级:18万亿字符打造强大中英文AI助手
科技数码
通义千问2.5升级:18万亿字符打造强大中英文AI助手

如果说人工智能是当今科技发展的明珠,那么大语言模型就是这颗明珠上最璀璨的光芒。来自阿里巴巴集团的研究团队最近发布了他们的最新成果——通义千问2 5技术报告,这项研究于2025年1月发表,论文编号为a

热心网友
03.09
千问团队震荡发酵!阿里回应核心成员离职并非集体辞
业界动态
千问团队震荡发酵!阿里回应核心成员离职并非集体辞

3月6日消息,3月5日晚间,针对近日网络流传阿里巴巴“千问模型核心团队集体离职”“开源策略调整”等不实信息,阿里集团辟谣表示:1、目前千问模型团队稳定,没有出现“集体离职”的情况,所有产品与服务运行

热心网友
03.06
阿里千问动荡:谷歌公开挖角多位关键研究员
业界动态
阿里千问动荡:谷歌公开挖角多位关键研究员

3月5日消息,近日,阿里通义千问团队出现多位人员变动,多位核心成员相继官宣离职。起因先是通义千问核心负责人林俊旸官宣自己从千问项目卸任,此举引发外界对其去向的广泛讨论。此后,Qwen后训练负责人郁博

热心网友
03.05
阿里最年轻P10林俊暎技术负责人发文卸任:千字回顾历程
业界动态
阿里最年轻P10林俊暎技术负责人发文卸任:千字回顾历程

3月4日消息,今日凌晨,千问核心负责人林俊旸在X发文:me stepping down bye my beloved qwen (我卸任了。再见了,我亲爱的千问。)此前,3月2日晚间,阿里千问正式

热心网友
03.04

最新APP

凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26

热门推荐

vivo Y500s与Y60m对比:双机深度解析,帮你选出最适合的一款
网络安全
vivo Y500s与Y60m对比:双机深度解析,帮你选出最适合的一款

如果你最近关注过手机市场,应该知道一件事:内存涨价了,而且涨得挺狠,相比之前,同配置的内存成本已经涨了近1000块。这对中低端机型的冲击最明显,本来利润就薄,成本一涨,要么涨价,要么砍配置,对于想换

热心网友
03.30
PPT演示模式鼠标消失怎么办?3种方法快速唤回光标
电脑教程
PPT演示模式鼠标消失怎么办?3种方法快速唤回光标

鼠标指针在PPT演示中消失通常因“指针选项”设为隐藏,可通过右键菜单选“可见”、按Ctrl+A快捷键、取消“自动隐藏鼠标指针”设置、Alt+Tab切换窗口重启渲染,或检查演示者视图

热心网友
03.30
豪威集团2025年业绩亮眼:营收净利双增,半导体业务全面开花
科技数码
豪威集团2025年业绩亮眼:营收净利双增,半导体业务全面开花

豪威集团近日发布最新财务公告,显示2025年业绩实现显著增长。全年营业收入达288 55亿元,较上年提升12 14%;净利润突破40 45亿元,同比增长21 73%。这一成绩主要得益于半导体设计业务

热心网友
03.30
乐聚建成国内首条年产万台人形机器人产线
科技数码
乐聚建成国内首条年产万台人形机器人产线

3月29日,国内首条年产能万台级的人形机器人自动化产线在广东正式投入使用,人形机器人规模化量产能力取得重大突破。该产线年产能突破一万台,可实现每30分钟下线一台人形机器人,高效满足市场规模化交付需求

热心网友
03.30
华羿机器人登陆港交所市值破百亿,领跑国内国际市场
AI
华羿机器人登陆港交所市值破百亿,领跑国内国际市场

今日,华沿机器人正式在港交所挂牌上市,开启了其资本市场的新征程。此次上市,华沿机器人发售价定为每股17 00港元,折合人民币约14 99元。开盘时,股价为16 8港元,即人民币14 82元,而收盘价

热心网友
03.30