北京时间5月20日,人工智能领域迎来一则重磅人事变动:OpenAI创始成员、前特斯拉AI总监安德烈·卡帕西(Andrej Karpathy)正式宣布,加入知名大模型公司Anthropic。
他在公开声明中表示,未来几年将是决定大语言模型(LLM)技术格局的关键阶段,因此对于能够加入Anthropic团队并重返核心技术研发一线感到非常兴奋。同时,他并未放弃对AI教育的热情,承诺将在适当时机恢复相关教育工作。此前,卡帕西曾短暂专注于其创办的AI教育初创公司Eureka Labs。
据了解,卡帕西已于本周正式入职Anthropic的预训练团队,向同样来自OpenAI的团队负责人尼克·约瑟夫(Nick Joseph)汇报。公司发言人证实,卡帕西将在内部组建一个全新的研发小组,其核心使命极具前瞻性:利用Anthropic自家的旗舰大模型Claude自身的能力,来加速下一代前沿模型的预训练研究进程。这本质上是一项旨在实现AI模型递归式自我改进的战略探索。
作为全球AI界的顶尖科学家,卡帕西的职业生涯履历非常亮眼。他师从计算机视觉权威李飞飞教授,是OpenAI在2015年成立时的11位创始成员之一。2017年至2024年间,他担任特斯拉高级AI总监,主导了特斯拉全自动驾驶(FSD)系统与自动辅助驾驶技术的核心开发。2024年2月,他曾短暂重返OpenAI,主要负责大模型的中期训练与合成数据生成工作,一年任期结束后再次离开,随后创立了Eureka Labs。

卡帕西的加盟,在AI行业内引起了广泛关注。行业观察人士指出,他已成为近年来又一位转投Anthropic的OpenAI核心元老级人物。此前,前OpenAI对齐团队负责人扬·莱克(Jan Leike)、联合创始人约翰·舒尔曼(John Schulman,现已加入Thinking Machines Lab)、创始成员德克・金马(Durk Kingma)等均已加入Anthropic。在各大AI巨头竞相推进商业化与资本扩张的背景下,卡帕西这样的技术领袖选择加入,无疑将显著增强Anthropic在学术界与顶尖技术人才圈中的吸引力与行业号召力。
从技术路线分析,卡帕西新团队的核心任务——利用现有大模型能力加速预训练——揭示了一个明确的行业发展趋势。传统的大模型训练,严重依赖海量人工标注数据和纯粹的算力堆叠。而卡帕西一贯重视高质量、结构化的训练数据集以及高效的训练方法论,这与Anthropic坚持的技术理念高度契合。通过推动大模型的递归式自我改进与合成数据生成,AI研发有望向更高程度的自动化方向演进,这很可能成为未来几年顶尖大模型之间拉开性能差距的关键技术路径。
目前,由达里奥·阿莫代(Dario Amodei)领导的Anthropic公司正处于快速发展期。市场消息显示,公司计划在2026年下半年推进首次公开募股(IPO),最快有望于10月上市,整体估值正朝着万亿美元的目标迈进。核心技术领袖的持续加入,被视为对公司发展的关键背书,不仅向资本市场释放了强大的技术信心信号,也向企业级客户证明了其长期保持在AI研发第一梯队的核心实力与决心。
