实测GPT-5-Codex:前端能力出色,复杂项目高效完成
时间:2026-06-23 14:32
近日,OpenAI正式发布专为编码智能体打造的GPT-5-Codex,实测表明其前端能力显著提升,可快速生成像素风游戏、贪吃蛇、复杂网页等前端项目。其运行速度较预期慢约两倍,但用户需求极为旺盛,算力正在紧急补充。
昨天,OpenAI正式发布了GPT-5-Codex——一个专门为Codex编码智能体量身打造的GPT-5版本。
看了全球网友的实测反馈后,结论很清晰:Claude Code可以放一放,Cursor可以先收起来,Codex值得直接上手。
为了验证这些说法是否靠谱,我们做了一次全面的实测。结果证明,这次OpenAI没有“狼来了”。不少项目的表现确实令人眼前一亮——比如一键生成像素风小游戏,效果相当丝滑。

或者做一个页面,演示强化学习里经典的CartPole平衡实验——让小车左右移动,同时保持杆子竖直不倒。

几分钟内,一个贪吃蛇游戏就能秒出。

甚至,你还可以给某些知名角色制作一段火柴人动画——只需上传一张经典图片即可。

当然,这种任务多少有点为难GPT-5-Codex了。下面这张图虽然比较完美地还原了场景,但动作识别出了偏差,物理逻辑也不太对。

而这张呢,动作是对的,但少了一点那个味儿……

最终效果大概就是下面这样。等GPT-5-Codex再“练习两年半”,应该就能完美生成了。

不得不说,这次GPT-5-Codex的前端能力提升非常大。随手就能制作一个记录每日AI精选新闻的网站。

顺便提一句,有网友感慨:现在这个阶段,最前沿的程序员面对的技术迭代速度快得惊人。实际上,他们都不怎么写代码了——直接对着Codex智能体“大喊大叫”(发号施令),AI包揽一切。

而且,GPT-5-Codex上线后,OpenAI自己也没料到需求会如此猛烈——运行速度竟然比预期慢了整整两倍。研究人员已经确认,正在补上GPU,算力即将再次起飞。可见,确实好用,用户才会“疯狂使用”。

## GPT-5-Codex实测
先简单介绍一下实测方法。Codex官方提供了多种使用方式:可以用npm安装在终端,也可以以扩展形式在Cursor、VS Code等编辑器中使用。

这次我们实测了终端方式和Cursor中的扩展方式。

### 像素风游戏
OpenAI Developers官方账号给出了几个示例,我们就拿这些来测试。
第一个任务:“制作一个像素风游戏,让我可以四处走动、与村民交谈,并捕捉野外昆虫。”
以下是官方给出的效果。

下面是我们实测的效果。

玩起来还是相当丝滑的。
### 手稿直出
还可以将手画的草稿直接制作成一个网页。

效果相当不错,毕竟只有一张图和简单的提示。
提示词:“以这张图片为灵感,在此创建一个简单的 HTML 页面 aiera.html,包含所有资源/Ja vaScript 和内容,以实现该网络应用的展示版本。宜人的动画和响应式设计会很棒,但不要弄得太花哨。”

### 复杂项目
直接使用OpenAI开发者账号的草图,将这个图片制作为一个复杂的项目。刚开始GPT-5-Codex给了一个和草图类似的HTML页面,所以我要求它用Next.js框架重新制作。

最终效果如下,UI设计稿的页面布局还原得相当到位。

实测过程中,也不得不感叹:自从有了AI智能体,写代码真的就是“大喊大叫”。比如在测试GPT-5-Codex时,可以后台同步开启N个项目并行测试。这次ChatGPT给Plus和Pro用户的用量也很大方。

### 贪吃蛇游戏
这次Codex提供的终端体验也很棒,比如制作一个贪吃蛇游戏。

效果如下,Codex严格按要求实现了。

### 飞行器
用GPT-5-Codex测试了经典的“飞行器从火星飞往地球”的动画演示,整体表现还行,飞行器能飞起来。
当然,这个模型并非完美。实测中发现,GPT-5-Codex生成的页面UI经常出现“堆叠”情况,这一点也得到了其他网友的印证。

这些都是小瑕疵。更值得关注的是:当Claude Code还在偷偷给模型降智的时候,OpenAI却专门为Codex更新了编程场景优化的GPT-5-Codex——高下立判。

这次,还是要支持奥特曼的。
## 彩蛋
有意思的是,GPT-5-Codex发布后不久,Grok 4宣布在AGI基准测试中取得了突破。马斯克今天突然发帖说,他觉得Grok 5有可能实现通用人工智能,让我们拭目以待。
也许谷歌的Gemini 3和马斯克的Grok 5,年底前就会给我们一个惊喜。

另外,有网友爆料Codex的提示词现已泄露,不妨一探究竟。
