群雄逐鹿,AGI桂冠究竟花落谁家?
OpenAI与Anthropic围绕代码领域的霸主地位展开激烈交锋,你来我往,战况持续升温,从未有过片刻冷场。
AGI Ranker最新发布的Coding排行榜上,Claude Opus 4.8刚刚登顶王座。此前位居榜首的GPT-5.5(77.48分)被拉下马,双方差距拉大至3.5分。
在过去三个月里,编程领域的王座几度易主,交替频繁。
第一次,Claude Opus 4.7率先夺魁,Anthropic上下弹冠相庆。
第二次,GPT-5.5强势反超,OpenAI成功扳回一城。
第三次,Opus 4.8卷土重来,以81.01分的成绩让Anthropic重新站上巅峰。

尽管Anthropic已秘密提交IPO申请,但先天算力不足的短板依然存在,而OpenAI与谷歌DeepMind随时可能再度迎头赶上。

今天,OpenAI将于美国东部时间上午举办「Intelligence at Work」直播活动,奥特曼将亲自出席。随后,纳德拉将于美国东部时间下午在Microsoft Build大会上发表开幕主题演讲。微软预计也将在今天推出自研的新模型。Anthropic则透露,很快将发布Mythos级别的新模型。Polymarket预测,GPT-5.6在6月8日至14日之间发布的概率高达68%。

这一周对OpenAI而言,意义非凡。

Codex迎来重大更新,硬刚Claude Code?
OpenAI将于今天发布一次重量级的Codex更新。历经数月开发,成果令人瞩目。

这绝非小修小补。据OpenAI内部人士透露,Codex团队为此次更新投入了数月心血,核心方向是让Codex从「代码补全工具」彻底进化为「编程智能体」。

昨日,OpenAI确认Codex及前沿模型现已全面登陆AWS Bedrock,并将其描述为「更广泛扩展的开端」。紧接着Codex大版本更新随之而来,这显然是协调一致的布局,而非巧合。
与此同时,奥特曼还在积极宣传OpenAI基金会关于社会韧性的相关工作。这种软实力布局通常出现在重大发布前后,而非发布进程中。

此外还有一个小插曲:Anthropic昨天向美国证券交易委员会(SEC)秘密提交了S-1文件。如今,两家公司正同时竞相推进IPO,并争夺智能编码领域的主导权。Anthropic提交S-1文件的次日清晨,OpenAI便发布了Codex的重要里程碑,这要么是绝佳时机,要么就是绝佳时机。
GPT-5.6爆料炸裂!性能价格双杀?
内部人士透露,该模型本周内即将发布,性能有望直逼Anthropic Mythos顶级水准,但价格仅为其2-3倍更低。同步进行的Codex重大升级,在推理、前端生成、个性与智能体工作流方面全面进化,效率优化让长流程Agent真正落地——这可能是2026年最重磅的AI发布之一!
- GPT-5.6预计将于本周发布,同时Codex也将迎来重大更新
- 它的价格大约仅为前代的2–3分之一,却能达到Anthropic Mythos级别的水平
- 它将在推理、前端生成、个性化和智能体工作流等方面带来显著改进
- 据知情人士透露,GPT-5.6原本完全可以被称为GPT-6
- 重点似乎放在效率上,旨在让智能体更快、更便宜,并在更长的工作流中更加实用


关于GPT-5.6的讨论并非空穴来风,但距离正式发布还有不少距离。据称,一个引用gpt-5.6的rollout-mapping条目曾短暂出现在OpenAI内部Codex日志中随后消失,而绝大多数条目指向的是GPT-5.5。这符合金丝雀测试或有限内部探针的特征——它表明工作进行中,而非已发布,更不是最终功能清单。

Polymarket上有一个关于GPT-5.6是否会在某个日期前发布的市场。截至2026年5月中旬,交易员认为在2026年6月30日前公开发布的概率约为80-89%。这只是大众对时间节点的押注,是一个概率,而非OpenAI的承诺,类似市场此前也曾出现过偏差。
但从发布节奏规律来看:OpenAI快速连续发布了GPT-5.4、GPT-5.5、GPT-5.5 Instant。延续这一节奏再推出一个小版本更新是合理的推测。「基于规律的合理推测」是三个信号中最弱的一个——它只能说明GPT-5.6值得期待,并不能证明它已存在或何时发布。
但有网友透露,OpenAI胸有成竹,志在必得:GPT-5.6并非被动应对式发布。OpenAI意在取胜,而非追赶。据透露,GPT-5.6在某些方面的目标是比GPT-5.5提升12%到15%。相比许多人测得的Opus 4.7到4.8之间约6.5%的平均提升幅度,这一步幅可谓巨大。

真正的重头戏是GPT-6。该模型不仅要回应Anthropic的Mythos系列,更要以显著优势超越它。这也是OpenAI没有在Opus 4.8之后仓促跟进的原因。
Anthropic的算力困局:最强模型,最浅口袋
Anthropic目前的处境相当微妙。手中的牌面无疑是顶级的:Opus 4.8登顶Coding榜,Mythos在网安领域碾压对手,Claude Code在开发者社区口碑持续攀升。在模型能力上,Anthropic目前不惧任何对手。
但是,模型能力并非唯一战场。Anthropic的算力来源高度依赖亚马逊和谷歌的云基础设施,它没有OpenAI背后微软Azure那种级别的独占算力协议,也没有谷歌DeepMind那种与硬件团队同处一个屋檐下的垂直整合优势。
IPO是Anthropic补齐这块短板的关键一步。秘密提交申请已经确认,但资金何时到位、到位多少、是否足够在算力军备竞赛中跟上节奏,都还是未知数。Anthropic手里握着最强模型,但口袋里却没有最深的资金。
Mythos的定价策略也暴露了这一矛盾。

6倍于Opus的Token价格说明,Anthropic正通过高定价来覆盖高昂的推理成本。这种策略在短期内可以靠能力领先来支撑,但一旦竞品以更低价格实现近似能力,高价策略就会变成沉重的价格包袱。
IPO能否在OpenAI追上来之前,为Anthropic续上算力的弹药?这堪称整个AGI决赛阶段最大的悬念之一。
AGI的计时赛:王座以周为单位易手
代码能力排行榜的王座以周为单位频繁易手,这件事本身在AI历史上从未出现过。过去的技术竞赛中,领先者的优势往往以年计——搜索引擎领域,谷歌领先了二十年;移动操作系统领域,iOS与安卓的格局十几年没有本质变化。
但在AGI竞赛的最前沿,两家公司的差距已压缩至3.5分——一个季度内三次易主。这意味着决定胜负的不再仅仅是模型本身。当模型能力趋近时,算力、资本、生态、速度、定价策略,甚至IPO时机,每一个非技术因素都在成为胜负手。
Anthropic拥有最强模型,但需要IPO来补足算力。OpenAI拥有最深口袋,但需要GPT-5.6来夺回王座。谷歌拥有最大基础设施,但Gemini的Coding分数正在被拉开。

人类历史上第一次,两家公司以周为单位争夺「最接近通用智能」的桂冠。
今天OpenAI亮见之后,排行榜上的数字会不会再次变动?
81.01分的王座,还能坐稳多久?
