十年论文终封神GPT天才本科与二本逆袭ICLR时间检验奖研究团队故事
ICLR 2026的时间检验奖刚刚揭晓,获奖者是一位我们熟悉又低调的名字——Alec Radford。
消息一出,社区里祝贺声不断,不少人感叹“实至名归”。
这位OpenAI的元老级人物,在社交媒体上异常低调,动态几乎全是转发和推荐他人的优秀工作。然而在技术圈内,他却是与Ilya Sutskever齐名的奠基者,初代GPT系列的核心架构正是出自他手。奥特曼曾将他比作爱因斯坦级别的天才,而OpenAI的总裁更是给出过这样的评价:只要他想要的,我们都给。
如今,这份迟来的荣誉终于落在他十年前以第一作者身份发表的DCGAN论文上。这篇论文引用量超过两万,不仅是机器学习领域最具影响力的文献之一,更是公认的将GAN成功推向工程应用的开山之作。
有趣的是,这篇里程碑论文的背后,站着三位当时都不是博士生的年轻人。这本身,就为这个故事增添了一抹传奇色彩。
时间检验奖首次颁给本科生
本届ICLR的时间检验奖罕见地开出了“双黄蛋”,两篇获奖论文分别是DCGAN和来自谷歌DeepMind的DDPG。前者为GPT系列模型奠定了核心逻辑,后者则证明了深度强化学习在连续控制任务上的可行性。ICLR连续三年以此奖项表彰经得起时间考验的成果,足见这两篇工作的经典程度。
评审委员会对DCGAN的评价极高:
这篇俗称DCGAN的论文,首次成功验证了基于学习的生成模型能够生成多样化、真实且结构复杂的图像。该研究成果正式开创了图像生成子领域,如今图像生成已是机器学习领域最热门的研究方向之一,同时在工业领域落地了大量成熟且成效显著的应用。尽管相关技术不断迭代升级(从生成对抗网络逐步发展至扩散模型),但DCGAN依旧历久弥新,是奠定这一重要研究领域的关键里程碑。
论文的三位作者,当时的身份是两位本科生和一位硕士生。
第一作者Alec Radford本科毕业于富兰克林·欧林工程学院。这所学院规模虽小,却以极高的师生比和强调项目实践的工程教育闻名,学术实力不容小觑。在校期间,他就与同学共同创立了公司Indico,并由此踏入了OpenAI的大门,一待就是八年。
他是早期GPT系列论文的核心贡献者,几乎参与了OpenAI所有重大突破,也是多模态模型CLIP的主导者。他所推动的Transformer架构与生成式预训练的结合,直接为后来的ChatGPT乃至整个大模型时代铺平了道路,同时在GPT-1到GPT-3、Whisper、DALL-E等关键项目中扮演了重要角色。截至目前,Alec Radford的论文总被引数已超过35万。
2024年底,他宣布离开OpenAI,转向独立研究。去年三月,他以顾问身份加入了前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab。
第二位作者Luke Metz,与Alec同校,毕业后加入了Alec创立的Indico,并成为OpenAI的初始成员之一。随后他加入谷歌担任长期研究员,研究方向从生成模型转向优化算法与元学习,并于2022年短暂回归OpenAI,最终在2024年底同样加入了Thinking Machines Lab。
第三位作者Soumith Chintala的故事则更为人熟知。他不仅是DCGAN的作者之一,更是PyTorch的核心创作者和Meta的前副总裁。他的求学之路颇具戏剧性:本科就读于印度的韦洛尔理工学院,在申请硕士时曾连续被12所高校拒绝,最终凭借坚持拿到了纽约大学的offer,并幸运地师从Yann LeCun,由此踏入深度学习研究领域。
硕士毕业后,他的求职之路同样坎坷,几乎全部申请都被拒绝,最终进入一家小型创业公司。转机发生在2014年,经LeCun引荐,他加入Meta,并带领团队主导开发了PyTorch——这个如今全球最主流的开源机器学习框架之一。在Meta工作的十一年间,他从L4工程师一路晋升至副总裁。2025年底,他离开Meta,出任Thinking Machines Lab的首席技术官。
至此,DCGAN的三位作者在各自经历了辉煌的职业旅程后,于Thinking Machines Lab再度聚首。
其余获奖情况
除了时间检验奖,本届ICLR还评选出了两篇优秀论文奖:
- 《Transformers are Inherently Succinct》:该研究率先提出“简洁性”是衡量Transformer表达能力的一个新维度,并证明Transformer在描述某些复杂概念时,相比RNN等模型具有指数级甚至双指数级的优势。
- 《LLMs Get Lost In Multi-Turn Conversation》:设计了一种可扩展的方法来评估大语言模型的多轮对话能力,同时发现当交互轮次增多且指令不够明确时,大语言模型的适应性和可靠性会出现显著下降。
以及一篇优秀论文提名:
该研究运用逼近理论,为主流的Muon优化器设计了一套极分解最优多项式逼近方案,获得了业界的广泛认可。
相关攻略
TurboQuant论文被质疑弱化与RaBitQ的关联,并存在理论比较与实验公平性问题。谷歌借助平台影响力将其定义为突破性成果,凸显了大厂在学术生态中的结构性优势。类似争议在伦理AI、芯片等领域亦有体现,反映了产业界将利益嵌入研究流程的机制。当前AI研究日益由大厂主导,其通过资本、渠道与话语权塑造。
进入 2026 年,人工智能领域被一只「龙虾」(OpenClaw)硬控了,这种具备高主动性、强活人感的私人 Agent 助理成为了新一代人机交互的标杆。与此同时,世界模型得到了前所未有的关注。年初英
IT之家 2 月 3 日消息,小米创办人、董事长兼 CEO 雷军今日宣布,小米团队的多篇最新研究成果,成功入选 ICLR 2026,研究方向涵盖多模态推理、强化学习、GUI Agent、端到端自动驾
AI 的竞争继续白热火,但衡量 AI 实力的标准也在发生微妙的变化:不只是训练算力和模型的参数规模,更要看 AI 在复杂应用场景中,能不能像人一样思考与行动。1 月 30 日,千问 C 端应用团队宣
机器之心编辑部昨晚深夜,ICLR 2026 官方向投稿者发送了今年的论文接收结果通知。作为机器学习领域的顶级会议, ICLR 2026 将于 2026 年 4 月 23 日至 27 日在巴西里约热内
热门专题
热门推荐
为庆祝成立50周年,苹果在全球多地门店举办系列庆祝活动。最盛大的庆典在其总部ApplePark举行,员工齐聚草坪,传奇音乐人保罗·麦卡特尼登台献唱,首席执行官蒂姆·库克也参与其中。这场科技与艺术交融的盛会,既是对过往传奇的致敬,也寓意着新篇章的开启。
苹果公司成立五十周年之际,首席执行官蒂姆·库克发布内部信回顾历程。信中指出,公司从车库中的一台原型机起步,如今全球活跃设备已达25亿台。库克强调,未来需主动创造而非等待,并鼓励员工铭记创新精神,共同把握机遇,开创下一个五十年。
苹果CEO库克在专访中回顾了iPod的诞生历程。该产品以口袋装千首歌的能力革新了音乐消费方式。其爆红要求苹果在三个月内生产约1500万台,这极大考验了供应链。此次极限压力测试为苹果锻造出世界级供应链能力奠定了基础。库克还透露,首台原型机播放的第一首歌是《HeyJude》。
知名投资人段永平家族办公室持仓市值升至约200亿美元。本季度清仓阿里,减持苹果、台积电;重仓AI与电动车赛道,大幅增持英伟达并新建仓特斯拉,拼多多获增持。其首次跨足Web3领域,建仓稳定币发行商Circle,显示对合规区块链基础设施的关注。
Mac内置的“缩放”辅助功能可放大屏幕细节。通过系统设置开启该功能后,可选择画中画或全屏模式。用户可使用修饰键配合触控板手势、快捷键组合、双击Control+Option或鼠标智能缩放等多种方式灵活操作,满足不同场景下的查看需求。





