Jason Wei揭秘2025年AI走向:OpenAI核心成员的三大前瞻思路
在AI加持下的这一年人类突飞猛进,停下来回头看去,似乎AI已经无所不能,但前OpenAI灵魂研究员认为AI不可能瞬间超越人类,他还提出了三个关于AI的最新洞见。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
用三句话总结下2025年AI的发展,你会想到什么?
所有能被验证的任务,最终都会被AI解决智能最后会变成商品,知识价格归零AI不会瞬间超过人类最近,前OpenAI核心研究员、CoT(思维链)作者Jason Wei在斯坦福大学AI Club做了一场精彩的演讲。
图片
这是他跳槽到Meta后少有的公开分享。
我们的世界,在AI大行其道的这一年,到底发生了什么?
AI继续发展下去是什么样子的?
图片
量化交易员说AI很酷,但并不能做我的工作;
顶级实验室AI研究院:2-3年后,AI就要取代我的工作了。
那么,谁对谁错?
智能的商品化
Jason Wei的原话是Intelligence as a Commodity。
AI的智能发展可以分为两个阶段:
第一阶段:前沿突破,当AI还无法很好地完成某任务时,研究的重点是「解锁新能力」。
第二阶段:能力商品化,一旦AI能完成该任务,该能力就会被快速复制、成本趋近于零。
例如在MMLU(多任务语言理解基准)上,过去几年模型性能稳步提升,而达到特定分数的成本却逐年下降。
图片
「自适应算力」的出现
AI的出现,也是首次深度学习真正实现自适应计算(AdaptiveCompute)。
过去无论任务简单还是困难,模型都消耗相同的算力。
图片
现在可以根据任务难度动态调整推理算力。
例如在o1模型中,推理时投入更多计算,就能在数学题上获得更高准确率。
这意味着:智能的成本可以持续下降,而无需无限扩大模型规模。
图片
Jason以「查找1983年釜山结婚人数」为例:
互联网时代前:去图书馆查百科,数小时互联网时代:搜索 、筛选资料,数分钟聊天机器人时代:直接问AI ,即时智能体(Agent)时代:自动查找并整合数据库,数秒到数分钟总结一下,Jason Wei认为智能作为一种「商品」,将越来越便宜
知识民主化:编程、生物黑客等曾需高门槛知识的领域被大众化。私有信息的相对升值:公开信息成本趋零,内幕或独家信息的价值反而更高。个性化互联网:未来每个人可能拥有一套完全定制的知识入口。验证者法则
什么是验证者法则?
所有能被验证的任务,最终都会被AI解决。
所以现在会出现各种各样的评测基准。
只要能建立「能够被验证的任务」,AI都会攻破这个领域。
很明显的一点是,越容易生成的任务,越难被验证。
这就是验证的非对称性。
比如数独和造一个 ,都属于中等难度和高难度的任务。
但是要验证一个数独题目的正确性,和验证一个 是否开发的不错,很简单!
许多任务存在「生成难,验证易」的不对称:

我们可将任务放在二维平面上:X轴,生成难度;Y轴,验证难度。
图片
某些任务可以通过提供额外信息使其更易验证:
例如提供答案或测试集,使「生成→验证」更高效。
AI能否学会一项任务,与该任务的可验证性成正比。
即:任何可验证、可量化的任务,AI终将掌握。
比如下面这种图,在过去5年中,大部分AI基准评测都非常容易被「验证」。
图片
Jason Wei给出了可验证性的五个因素:
是否存在客观真值;验证速度是否快;能否批量验证大量样本;结果是否低噪声、稳定;是否有连续反馈(不仅是「对/错」,还有质量梯度)。几乎所有AI基准(benchmarks)都具备这些特征,因此被迅速攻克。
Jason Wei重点描述一个案例:DeepMind的AlphaEvolve。
图片
该系统通过大规模采样与自我验证,解决了大量「易验证难求解」的任务。
图片
核心流程是:
用语言模型生成候选答案;自动打分(验证);取最优样本再输入模型,形成迭代;反复迭代后性能显著提升。
图片
这种策略绕过了「训练集-测试集」的泛化问题,只针对「单个任务」持续优化。
总结一下:
可轻易验证的任务将率先被AI自动化。新的创业机会:为AI创造「可测量的目标」。即——只要你能定义一个明确的度量指标,AI就能为你优化它。智能的锯齿边缘
这个关键点英文叫做The Jagged Edge of Intelligence,智能的锯齿边缘。
直接翻译有点抽象,但是如果看下图就很好理解了。
简单来说,就是AI的智能并不是「全知全能」,AI的智能水平就像锯齿一样,有高有低。
图片
AI为什么不会「瞬间超越人类」
Jason认为不会出现「AI快速爆炸式超越人类」的「Fast Take off」。
AI的自我改进能力将是渐进的、分任务发展的。
不同任务的学习速度和上限各不相同,不会「一夜超神」。
每个任务的改进速率不同:
一些任务进步快(如可验证的数学、编程)。一些任务改进慢(如需要真实世界交互或罕见数据的语言)。AI的发展呈「锯齿形」曲线:某些领域突飞猛进,某些长期停滞。
那么AI在哪些任务上发展快,哪些发展的慢?
判断任务进展速度的三条启发式法则:
数字化任务发展快:迭代速度高、实验成本低;例如软件开发远快于机器人制造。对人类简单的任务,对AI也简单:但AI也能在某些「人类极难但有明确目标」的领域超越人类,如癌症影像预测。数据越多,AI越强:语言模型在高频语言上性能显著优于低资源语言,若任务能提供单一客观指标,还可用强化学习生成合成数据。比如AI代码,现在基本已经被AI攻克,竞赛数学也被攻克了。
但是如果数据量很小,无法数字化的领域,AI就很难攻克。
图片
总结一下:
不存在统一的「AI超级智能爆发」;各任务将以不同速率演进;影响最大的领域是:数字化、人类已擅长、数据丰富的领域Jason Wei在演讲最后总结道:
智能与知识将变得快速且廉价,公共知识的获取时间趋零。
而「验证者法则」则预示着可度量性推动AI进步,任何可验证的任务都会被AI征服。
智能的边界是锯齿状的。各任务发展速率不同,不会出现瞬间的超智能崛起。
未来的信息将无摩擦地流动,而AI的边界,将由我们能定义和验证的事物所决定。
演讲嘉宾介绍
图片
Jason Wei,目前是Meta Superintelligence Labs的研究科学家。
他曾在OpenAI工作两年,参与创建了o1模型和DeepResearch项目;
在那之前,他是Google Brain的研究员,推动了Chain-of-Thought推理、InstructionTuning(指令微调)等技术的发展。
他的论文被引用超过9万次,是现代AI领域最具影响力的研究者之一。
参考资料:
https://www.youtube.com/watch?v=b6Doq2fz81U
相关攻略
那个给GPT-4o注入灵魂的人,走了 刚刚,一个消息在AI圈内悄然传开:被誉为“4o之母”的Joanne Jang发布了一篇长文,正式结束了自己在OpenAI长达四年半的旅程。 嗨!在待了4年半之后,我要离开OpenAI了。 随着GPT-4o的下线,如今,这位亲手塑造了4o独特“人格”的灵魂工程师,
人工智能 这一转向专业推理能力的趋势表明AI市场正在成熟,基础文本生成功能正逐渐商品化,服务提供商被迫通过高价值能力来实现差异化,以获取溢价收入…… 最近一份来自AI平台Poe的使用报告,揭示了一些耐人寻味的变化。OpenAI和谷歌在关键领域的领先地位持续巩固,而Anthropic的份额则有所下滑。
OpenAI Codex:半小时改写软件工程,AI编程智能体正式登场 今天,OpenAI的一场在线直播,可以说为整个开发界投下了一枚“重磅冲击波”。他们正式推出了全新的云端AI编程智能体——Codex。由Greg Brockman领衔的六人核心团队打造,这款产品的口号相当震撼:它能将原本需要数天才能
OpenAI高管同日离职潮背后:战略重心转移与成本压力浮现 来源:环球网 【环球网科技综合报道】4月19日消息,据《经济时报》报道,OpenAI正经历一场引人注目的战略转向。近日,公司三位高级管理层——凯文·韦尔、比尔·皮布尔斯、斯里尼瓦斯·纳拉亚南在同一天宣布离职,恰逢公司关停多项实验性项目,这一
程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时10倍额度 北京时间4月10日凌晨,OpenAI终于落下了重度用户期盼已久的那只靴子:正式推出每月100美元的全新订阅方案。 至此,OpenAI的商业化版图已经清晰地划分为四个核心层级: ·免费版(接入广告) ·每月8美元的G
热门专题
热门推荐
在数字货币快速发展的今天,如何选择一个靠谱的交易平台,往往是新手投资者迈出的第一步。面对市场上琳琅满目的交易所APP,从安全性、易用性到功能特色,究竟该怎么选?下面,我们就来梳理一下2026年主流的数字资产交易平台,帮你从多个维度看清它们的核心特点,无论是想尝试简单的现货买卖,还是计划涉足合约交易,
从音乐人到AI药物研发创业者:Aloe Blacc的跨界创业之路 近日,美国知名创作歌手Aloe Blacc做客TechCrunch旗下知名播客Equity,分享了他从音乐界成功跨界至AI驱动抗癌药物研发领域的独特经历。尤为引人关注的是,他创立的AI医药公司至今未进行任何外部融资。在访谈中,他深入阐
AI文生视频:从“猎奇玩具”到“生产力工具”的疾速进化 还记得几年前全网疯传的“威尔·史密斯吃意大利面”吗?那段画面扭曲、动作诡异的视频,一度成为AI文生视频技术稚嫩期的经典注脚——与其说是创作,不如说是一场数字世界的“恐怖谷”体验,离实际应用相距甚远。 然而,技术的演进速度总是超乎想象。过去一年,
百度开源文生图模型ERNIE-Image:消费级显卡畅享顶级文字生成效果 2024年4月15日,百度文心大模型团队正式宣布开源其参数规模达80亿的文生图模型ERNIE-Image。该模型最引人注目的优势在于,仅需24GB显存的消费级GPU即可实现高效部署与运行。同时,团队还发布了推理加速版本ERNI
欧亿交易所现货交易时间:如何理解其全球化设计逻辑? 在数字资产交易的世界里,交易时间的设定绝非小事。它直接关系到投资者的操作空间能否打开,以及整个市场的流动性是否充沛。作为行业内的头部平台,欧亿交易所(OYEX)在现货交易时间上的安排,可以说是一份深思熟虑的“全球时区解决方案”。它的设计,精准地瞄准





