就在Meta的超级智能实验室大幕初启之际,不仅资金与算力资源充沛,首席执行官扎克伯格更是亲自下场提出"人人享有超级智能"的愿景。
然而正是在这个关键节点,Meta研究科学家Rishabh Agarwal通过推特正式宣布了离职决定。
让我们仔细品味他的离职感言:
这将是我在@AIatMeta的最后一周。是否继续加入新成立的Superintelligence TBD实验室对我来说是个艰难抉择,特别是在人才与算力如此集中的环境里。但在Google Brain、DeepMind和Meta度过了七年半时光后,我内心涌现出新的渴望——去迎接另一种形式的挑战。
读到这是否觉得这只是常规的离职辞令?且慢,他还补充了关键一句:
Mark与Alexandr Wang提出的超级智能团队愿景确实令人心动。但最终我决定践行Mark本人曾给予的建议:"在这个瞬息万变的世界里,最大的风险其实就是拒绝冒险。"
颇具讽刺意味的是,扎克伯格当初这句激励团队的箴言,如今竟成了Rishabh递交辞呈的最佳注脚。
为了在人工智能竞赛中保持领先,Meta近期的招聘策略可谓激进。
扎克伯格为顶尖研究员开出了高达九位数的薪酬方案,甚至亲自通过电子邮件和WhatsApp等渠道从OpenAI、Google等竞争对手处挖掘人才,部分邀请的总薪酬甚至达到1亿美元。
截至8月中旬,Meta已成功从OpenAI引进超过20名精英,从Google招募至少13人,另有3名来自苹果,3名来自xAI,2名来自Anthropic,新增AI领域专业人才总数突破50人。
不过近期有消息称,在持续数月的大规模招聘后,Meta已于上周暂停AI部门的人员扩充,开始全面收缩团队规模并进行重组。
Meta的AI业务将被整合为研究、训练(待确定的TBD实验室)、产品与基础设施四大核心团队,多数团队负责人将直接向Wang汇报。此前负责Llama大模型开发的AGI基金会团队也在此次重组中正式解散。
或许组织架构的调整也影响了Rishabh的离职决定。但需要明确的是,Rishabh在Meta任职期间确实取得了切实成果。
据他透露,在短短数月内,他与团队在"思考型"模型的后训练领域实现了多项突破:
- 通过强化学习扩展技术,将80亿参数的稠密模型性能提升至接近Deepseek-R1水平
- 在中期训练阶段引入合成数据,显著提升强化学习启动效率
- 开发出更先进的在线策略蒸馏方法
纵观Rishabh的职业生涯,他在人工智能领域堪称实力派。
他毕业于印度理工学院孟买分校计算机科学与工程专业。
随后在加拿大魁北克人工智能研究院Mila攻读博士学位,专注深度强化学习前沿研究,师从知名学者Aaron Courville和Marc Bellemare。
Google Scholar数据显示,他参与的多项研究都具有广泛影响力,包括引用量分别超过2500和1200次的Gemini 1.5与Gemma 2;2021年发表的《Deep Reinforcement Learning at the Edge of the Statistical Precipice》和《Neural Additive Models》同样获得学界高度认可。
总体而言,他的学术论文总引用次数已突破1万次,h指数达34,i10指数为41。
其研究领域全面覆盖当今最前沿方向——多模态理解、开放语言模型、可解释神经网络以及离线强化学习。
从业经历方面,他目前兼任麦吉尔大学客座教授,自2024年9月开始执教。在加入Meta之前,他于2023至2025年间在Google DeepMind担任研究科学家。
更早之前,他在Google Brain服务五年,任职高级研究科学家专注深度强化学习,其研究成果曾荣获NeurIPS 2021最佳论文奖。2018年初他还在Waymo进行过实习。
对Rishabh而言,离职声明中那句"迎接不同类型风险"或许确实发自内心。
凭借着在Google、Meta等科技巨头积累的丰富经验与行业影响力,他完全有能力开启职业生涯新篇章,追寻更自由的研究空间或更广阔的发展平台。
