奥尔特曼剧透GPT-5.2进展,一张火爆全网图表引热议 (49个字符)

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
新智元报道
编辑:犀牛
【新智元导读】Gemini 3的惊艳表现打乱了OpenAI的阵脚,公司进入「红色警戒」状态,不得不提前发布GPT-5.2,以作应对。
紧急反击!
自从谷歌放出Gemini 3之后,OpenAI快被逼疯了,奥特曼甚至宣布公司进入了「红色警戒」状态。
现在,他们终于出招了——ChatGPT-5.2。
据The Verge爆料,熟悉OpenAI计划的消息人士透露,OpenAI将在下周(12月9号)发布GPT-5.2,首次对Gemini 3做出正面回应。

据悉,GPT-5.2已经准备就绪,原计划本月下旬发布。
但Gemini 3的惊艳表现打乱了OpenAI的阵脚,他们不得不提前发布,做出应对。
《The Information》早些时候报道称,在OpenAI内部评估中,他们的下一代推理模型表现领先于谷歌的Gemini 3。
不知道此次发布的GPT-5.2是不是「下一代」。
网上流传的一张GPT-5.2测试分数图片倒还是相当夸张的。
图片显示,GPT-5.2的基准测试分数几乎全面超越Gemini 3 Pro。
断崖式领先。

不过,网友们大都质疑这张图片的真实性。
毕竟我们现在生活在后Nano Banana Pro时代。
x网友Wes Roth就将图片上传到Gemini分析,结果Gemini认定这张图就是谷歌AI生成的。

网友Tanuki指出,人类最后的考试67.4%的得分极不可信。
AIME 2025 100%以及MMMLU 100%也是极其可疑。

网友Parousia也表示,这张图几乎可以肯定是虚构的——「看起来纯粹是愿望投射」。

危机重重的OpenAI
谷歌发布的Gemini 3所展现出的强悍竞争力,让OpenAI措手不及。
自从ChatGPT问世以来,可以说它就是最先进模型的代表。
这是首次出现竞争对手在基准测试中全面领先的情况。
在知识、数学和编程领域的多项基准测试中,Gemini已经略微领先于OpenAI的最先进模型。
这让很多人不再将OpenAI视为默认的性能标杆。

有数据显示,OpenAI在一周内流失了大约6%的用户,这意味着数百万用户转向了其他平台。
这其中,最有可能的就是转向谷歌Gemini。
ChatGPT目前拥有8亿月活用户,但其移动端使用量和付费增长已陷入停滞。
而用户数接近6.5亿的Gemini凭借在谷歌搜索、安卓系统及办公工具中的集成优势持续扩张。

OpenAI披露2025年营收约130亿美元,但分析师预测其到2029年可能累计亏损达1400亿美元。
而谷歌每季度能够创造约300亿美元利润,足以支撑其开发成本更低的功能。
奥特曼宣布进入「红色警戒」状态,实际上是一个紧急信号——让ChatGPT重回巅峰。
他们为此全力专注于此次应对行动。
由于这种紧迫性,GPT-5.2可能只有数天的时间来完成并部署这次重大更新。
如此仓促的发布,也很有可能带来问题。
此外,谷歌还拥有分发优势,他们能在一夜之间通过搜索、Gmail和Workspace将新功能推送给数十亿用户。
更宏观的图景在于,AI领域刚刚从一家独大转变为多方竞逐的局面。
未来几年,将会出现这种持续的更新周期,各种模型在技术竞赛中不断互相超越。
若GPT-5.2能够成功夺回基准测试的桂冠,OpenAI将赢得宝贵的时间窗口与市场稳定期。
倘若发布时存在缺陷或未达预期,谷歌将主导行业话语权。
有趣的是,这正是当初ChatGPT横空出世时谷歌所承受的压力。
谁能持续站在AI性能的最前沿,并让用户确信其产品真正更胜一筹,谁就将赢得未来十年。
这正是此刻至关重要的原因。
参考资料:
https://x.com/kimmonismus/status/1997001299074982105
https://x.com/stratechery/status/1997003039505633714
https://www.theverge.com/report/838857/openai-gpt-5-2-release-date-code-red-google-response
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定新智元极速推送!
相关攻略
谷歌TurboQuant算法遭中国博士后质疑,论文争议点深度剖析 近日,AI模型压缩领域发生了一场引人关注的学术风波。事件的起因是谷歌研究院在3月25日重磅发布的全新极端压缩算法TurboQuant。该技术旨在破解大语言模型推理过程中的核心瓶颈——键值缓存(KV Cache)所导致的庞大内存占用问题
新智元报道编辑:倾倾【新智元导读】全世界都在等ASI降临,OpenAI却在年初悄悄上线广告位。9亿用户撑不起数百亿美元的算力账单,智力正在贬值,神仙也得下凡赚钱!2025年底,一份名为ChatGPT
谷歌Willow量子处理器启动限时早期访问,加速商业应用落地 近期,谷歌在量子计算领域的连续动作引发了业界广泛关注,其商业化节奏明显提速。从中性原子计算路径的探索,到后量子加密技术部署时间表的提前,一系列进展均显示出强烈的推进意图。而最新发布的 Willow 量子处理器限量早期访问计划,更被视为其从
谷歌 Pixel 手机将推“通勤模式”:智能优化公共交通出行体验 科技领域的最新动向显示,谷歌即将为其 Pixel 智能手机引入一项备受期待的新功能——“通勤模式”(Transit Mode)。该功能旨在深度优化用户在乘坐地铁、公交等公共交通工具时的手机使用体验,帮助乘客在嘈杂或拥挤的环境中更好地管
12 月 9 日消息,科技媒体 Android Authority 今天(12 月 9 日)发布博文,通过拆解谷歌翻译(Google Translate)安卓版 v9 29 安装包代码,发现了多项
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





