首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
阿里大模型领军人物出走,背后原因与影响解析

阿里大模型领军人物出走,背后原因与影响解析

热心网友
46
转载
2026-03-05



阿里AI正在技术理想和商业现实之间,寻找新的平衡点。

文|《中国企业家》记者 闫俊文

见习编辑|李原编辑|何伊凡

头图来源|AGI Next前沿峰会主办方

3月4日凌晨,科技圈巨震。阿里Qwen技术负责人林俊旸在海外社交媒体发布状态:“me stepping down. bye my beloved qwen.”(我退下了,再见了我爱的Qwen。)

林俊旸的离去,直接引发了Qwen技术团队其他人员离职。

同一天,Qwen后训练负责人郁博文、Qwen3.5/VL/Coder核心贡献者李凯新宣布离职。李凯新在告别帖中写道:“从阿里Qwen签退。感谢与如此优秀的人共事,为我们的影响感到骄傲。继续前进!”而此前1月,惠彬原作为Qwen Code负责人、OpenDevin发起人,也已离职并加入Meta。

据了解,郁博文的工作将由今年初加入阿里通义实验室的前DeepMind高级资深研究员周浩接任,后者直接向阿里云CTO周靖人汇报。

3月4日14时,《中国企业家》从林俊旸社交媒体看到其更新最新动态:“抱歉各位朋友,今天不回复消息和电话了,我真的需要休息。Qwen 的兄弟们,按照原来安排继续干,没问题的。”

林俊旸的离职,很快引起圈内震动。有业内人士将其形容为:一个时代的终结。知名人工智能科学家田渊栋更在社交媒体上发言:“听到这个消息真让人难过!向Qwen团队致敬!干得漂亮!”

林俊旸的离职没有任何征兆。3月2日,千问正式开源4款Qwen3.5小尺寸模型系列:Qwen3.5-0.8B/2B/4B/9B,它能适配各类端到端硬件。林俊旸也将此信息,转发到了自己的海外社交媒体账号。

最近几天,他还在社交媒体更新发布了Qwen Coding Agent团队招聘信息。2月16日,阿里发布Qwen-3.5,并开源了Qwen3.5-397B-A17B版本,林俊旸预告:其余size模型预计在假期结束前发出。

《中国企业家》注意到,在林俊旸宣布离职的前一刻,3月3日深夜,他在社交媒体分享了一首名为《敬自己一杯》的歌曲,歌词提到:“这些年怕什么浪费,跌跌撞撞也是一种宝贵,错过的人就让他们心碎,我先学会把自己安慰。”

林俊旸的离职,在社区中也引发了对Qwen开源生态基因还能否延续的担忧。本土成长起来的团队,技术路线、文化认同感,是否将被未来的“空降者”承接,又是否会进一步加剧团队动荡,也被打上问号。

此外,林俊旸的离职或也与Qwen表现不如人意有关。据《晚点》报道,阿里内部有高管对除夕夜亮相发布的Qwen-3.5并不完全满意,称其是一个“半成品”。

《中国企业家》查询全球头部AI模型API聚合平台OpenRouter看到:2月16日上线后,截至3月2日,Qwen-3.5一直未能进入前9名。从海外API调用量来看,与同期发布的MiniMax M2.5、月之暗面的Kimi K2.5有较大数量差距——M2.5已连续三周位居第一。

林俊旸的离职,也被视为阿里要向MaaS、商业化落地更具实效的目标看齐。前阿里技术高管、现Lepton AI创始人贾扬清,凌晨在社交媒体上发布长文评论表示:“对公司而言,平衡开源和商业利益确实非常困难。”


来源:社交平台X截图

一家大模型创业公司的一号位曾告诉《中国企业家》:“当大公司认识到(大模型)很重要,就会投入很大的资源,然后快速布局。但它是不是能长久把事做下去?内部会不会出现其他问题?是一个有待时间考验的事。”

Qwen灵魂人物

作为阿里Qwen技术开发、开源的重要推动者,林俊旸与月之暗面创始人杨植麟、MiniMax创始人闫俊杰、智谱首席科学家唐杰等技术带头人相比,此前在业内比较低调。

林俊旸出生于1993年,系北京大学计算机科学本科、语言学硕士,他也是阿里最年轻P10级技术专家。


来源:AGI Next前沿峰会主办方

作为阿里大模型业务从技术储备到商业化落地的操盘手之一,林俊旸的晋升路径与阿里AI从内部研发,走向全球开源生态完美契合。

2019年,林俊旸以高级算法工程师身份加入阿里达摩院智能计算实验室,参与M6多模态大模型研发,并带队将参数规模一路推向十万亿级别,由此快速成长为核心骨干。

2020年,“通义千问”正式立项,林俊旸作为核心架构师,主导了OFA、Chinese CLIP等多模态基础框架研发,并在2024年底随组织调整并入通义实验室,正式出任通义千问技术负责人,全面主导基座模型、多模态与工程化体系建设。

2024年8月,通义千问前负责人周畅离职后,林俊旸扛起了Qwen全栈研发与开源战略,晋升至P9。2025年5月,林俊旸带队推出Qwen3-Max万亿参数旗舰模型,在32岁晋升为P10。

林俊旸最近一次公开演讲是在今年1月,《中国企业家》曾在现场聆听。他在发言中,表达了自己对开源的坚定拥护。

阿里Qwen大模型素以全系列尺寸著称,既有参数量千亿的大模型,也有0.8B/2B/4B/9B(B为十亿单位)等小尺寸模型,对开发者部署更为友好。

为什么要做小尺寸模型?林俊旸是这样定义其价值的:“手机厂商跟我们说7B太大,1.8B太小,能不能给我们做一个3B到4B的尺寸?一路做下来,模型的型号越来越多,跟服务大家多少有一点关系。”

但据相关人士向《中国企业家》透露,阿里内部有管理者认为,Qwen过多尺寸的模型增大了开发和运营压力,虽然得到了开发者推崇,但并未得到相应财务回报。

此外,阿里千问大模型除了文本,还有语音、视觉、Coding的全场景模型,林俊旸表示:如果你想做一个智能的东西,天然的应该是Multimode(多模态)。“我更多考虑的是Foundatien(创立)有更多的生产力,能不能更好地帮助人类。”

机器人和物理场景也是林俊旸关注的重点。他表示:内部曾有讨论,就算做VLA(视觉语言动作模型)、Coding模型,也是把语言转化成具身模型。“从这个角度上看,我们觉得大干一场,看一看能不能走向Digital Agent(数字化智能体),GUI操作,同时能够使用API,这就是非常完美的Digital Agent。”

阿里AI,压力山大

此次,林俊旸离职的直接原因,被指是对其团队的拆分和管理范围的缩小。

离职前,林俊旸同时负责模型团队预训练、后训练、代码、多模态等多个方向。据《晚点》报道:近期,通义实验室计划将Qwen团队分拆,从涵盖不同训练流程和模态的“垂直整合”体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队。

某种程度上,这确系行业梯队成熟后的标准做法。据《中国企业家》了解,OpenAI、DeepMind、字节都或多或少采用类似结构。

当前预训练、后训练、多模态等方向的技术栈差异越来越大,将其水平拆分,较有利于深度积累方向技术,更灵活地调配资源,并引入垂直领域专家。也可以让独立团队更深度专精于各自领域,避免“一人统管所有技术栈”带来的管理瓶颈。

将业务模块拆分,做更多技术解耦,也是阿里此前的常规做法,可更快向集团、平台以模块化能力传递资源,也避免重复造轮子。

此外,从2025年6月前后,海外便已有讨论,预训练是否已“走到尽头”。阿里云选择拆分预训练团队,也可解读为降低预训练战略优先级的信号。

但从更深维度上,阿里对于Qwen更多商业化的期待,让林俊旸正面临在模型探索层面,技术理想与商业变现之间的拉扯。

虽然Qwen系列模型凭借开源策略,累积了超6亿的全球下载量,超17万的衍生模型,获得了庞大的开发者生态,但免费策略影响了授权收入和商业化路径。一些开发者免费试用开源,却在付费时迁移到闭源。


来源:视觉中国

阿里云与AI如何协同,也还存在落地困境。AI基础设施投入居高不下,火山引擎、华为云仍在通过价格战挤压阿里云的市场份额。接下来,阿里计划未来三年在AI领域投入超3800亿元,阿里闪购也还要与美团在本地生活搏杀,这都会给阿里的现金流与盈利能力带去巨大冲击。

今年春节,字节豆包在C端入口凶猛进击,DAU破亿,初步建立起AI“原生入口”心智。而阿里千问App虽然依托于淘宝、支付宝等存量生态,规模化、高黏性的用户群体尚未真正形成。

近期,OpenClaw等Agent极大拉动了模型厂商的Token消耗,更引发了业内对大模型的价值重估。这些变化,都会给阿里云和阿里集团的管理层带去焦虑。如何在保持开源开放的同时,尽快探索出订阅、Token付费、企业定制等可持续盈利模式,是提给Qwen的待解问题。

如何留住顶尖人才?

虽然阿里大模型正面临转型,但林俊旸的离职,仍是组织、激励、技术与商业化多重矛盾下的集中爆发,也折射出了科技巨头在AI人才保留的系统性困境。

毫无疑问,顶尖人才已经是AI公司最重要的资产。一位大模型投资人曾对《中国企业家》谈到:模型竞争不是“大力出奇迹”的故事,技术带头人很大程度上决定成败。

“Meta超级智能实验室号称有3000人,但多数都是做辅助工作。核心团队就44个人,真正能主导技术路线的,只有几个人。”


来源:AI生成

因此,与移动互联网时代不同,只靠粗暴的“钞能力”不能打动AI顶尖人才。“他们更看重带头人的学术号召力、师门传承,对彼此技术路线的认可,以及工作文化的单纯。”

例如,月之暗面2025年下半年在K2等模型上卓有建树,很大程度上源于创始团队的稳定,以及杨植麟和清华实验室的深厚关系。“杨植麟在清华学生中很有号召力,会把看上的实验室‘连锅端’到公司。”月之暗面前员工告诉《中国企业家》。

这也意味着,技术带头人的变动,很可能会引发类似Qwen团队地震的连锁反应。为给人才提供更稳定的环境,不少公司为模型团队提供了相对独立的组织与考核体系。

如字节的Seed实验室、腾讯混元均采用独立于母体业务的组织架构,拥有独立的预算、人事权与技术路线决策权,避免被KPI绑架,并给予团队更多GPU资源倾斜。

在薪酬方面,国内外头部AI公司也给人才开出了激进的“战时保留机制”。

在海外,OpenAI员工入职即开始获得股权,并取消了“期权等待期”,允许员工即时财富兑现,绑定长期利益。

2025年9月,字节Seed部门更拿出了按月归属、高频发放的期权计划,核心员工每月可获得价值9万~13万元的期权,18个月累计可达百万级,并专门为豆包团队发放了“豆包股”。

今年2月,港股市场智谱、MiniMax一度冲上3000亿港元市值,也让不少持股员工实现了账面意义的财富自由。

据智谱招股书披露,截至2025年6月末,智谱共有883名员工,其中452人持有公司股份。据《中国企业家》了解,持股人除了在职人员,还有离职员工。但持股主要朝向核心技术算法人员倾斜。据MiniMax披露,公司共有385名全职员工,技术、产品、市场、职能几乎全员持股。

而林俊旸的离职,毕竟是阿里在AI转型深水区遭遇的一次人才受挫。如何建设AI时代的组织架构,用长期愿景留住人才,值得所有科技巨头思考。而阿里若想稳住Qwen,也必须在技术理想和商业现实之间,找到新的平衡点。

来源:https://www.163.com/dy/article/KN8M0PFL0550ANUU.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

具身智能研发框架Dexbotic重塑机器人开发流程
AI
具身智能研发框架Dexbotic重塑机器人开发流程

近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边

热心网友
05.13
RMS-MoE模型通过检索记忆优化专家路由调度效率
AI
RMS-MoE模型通过检索记忆优化专家路由调度效率

随着大模型参数规模不断增长,混合专家(Mixture-of-Experts, MoE)架构因其稀疏激活特性,成为平衡模型性能与计算开销的主流方案。然而,在实际的Web级应用部署中,一个关键挑战日益凸显:传统MoE的路由机制通常是“无记忆”的。 试想,在搜索引擎、智能问答或多轮对话等高并发场景下,用户

热心网友
05.12
编程入门指南从零基础到理解核心概念
编程语言
编程入门指南从零基础到理解核心概念

编程十年的一点分享 在软件开发的路上走过十几年,从一个爱好者到以此为业,有些体会或许值得聊聊,就当是抛砖引玉吧。 最早接触编程,是从BASIC和C语言开始的。工作后,随着需要,陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业,可以说始于FoxPro 5 0,之后技术栈随着项目

热心网友
05.07
编程初学者入门指南与核心思维解析
编程语言
编程初学者入门指南与核心思维解析

引言 编程,是一门实践科学。这意味着,学习它的最佳方式就是动手去敲代码。但这是否意味着,我们可以因此轻视理论的学习呢? 入门编程 如果你去各大技术社区提问“该如何入门编程”,五花八门的答案会瞬间涌来。 不过,仔细梳理一下,无外乎以下几种流派: 学院派 他们推荐从C语言入手,并辅以数据结构、操作系统等

热心网友
05.07
Agent 需要“油表”和“刹车”:一篇论文,扒光了 Agent 的“糊涂账”
科技数码
Agent 需要“油表”和“刹车”:一篇论文,扒光了 Agent 的“糊涂账”

想象一下这个场景: 你让 AI Agent 帮你修一个代码 Bug。它打开项目,读了 20 个文件,改了改,跑了一下测试,没过,又改,又跑,还是没过……来回折腾了十几轮,终于——还是没修好。 你关掉电脑,松了口气。然后收到了 API 账单。 上面的数字可能让你倒吸一口凉气——AI Agent 自主修

热心网友
05.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

阿里钉钉文档全功能解析在线协同办公套件使用指南
AI
阿里钉钉文档全功能解析在线协同办公套件使用指南

钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流

热心网友
05.15
商汤小浣熊智能助手基于自研大语言模型
AI
商汤小浣熊智能助手基于自研大语言模型

在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办

热心网友
05.15
MiniMax新一代智能模型矩阵全面解析与应用指南
AI
MiniMax新一代智能模型矩阵全面解析与应用指南

在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M

热心网友
05.15
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景
web3.0
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景

ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。

热心网友
05.15
智能客服机器人解决方案:AI客服系统提升企业服务效率
AI
智能客服机器人解决方案:AI客服系统提升企业服务效率

在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练

热心网友
05.15