先说几个核心判断。OpenAI这次拿出的GPT-5-Codex,绝不是一次简单的小版本迭代。它是在GPT-5的基座之上,专门为软件工程场景做了深度适配的超级特化版,说是Codex家族有史以来最强的一次进化也不为过。很多人会下意识拿它跟Claude Code对标,但实际用下来会发现,从架构设计到使用体验,它走的是完全不同的路子。
这次升级,信息量不小。可以这样理解,它带来的核心变化集中在三个方面:一个全新训练的专用模型、一套深度整合的工具链、以及大幅进化的代码审查能力。
先看模型。全新上线的GPT-5-Codex,训练数据聚焦于真实的工程场景。这意味着什么?从零搭建一个完整项目、做大规模的重构、编写测试用例、进行调试,乃至代码审查,这些都可以交给它。最让人印象深刻的是,它能动态调度计算资源,有报告称它曾一口气独立完成了持续7小时的复杂重构任务,中间不需要人工干预。
再来看工具链的升级。Codex CLI进行了彻底重构,IDE插件已经全面支持VS Code和Cursor等主流编辑器,与GitHub的集成也变得更深入。更重要的是,它支持在云端和本地环境之间无缝切换,上下文不会丢失。
代码审查能力的提升,则是一个容易被低估但实际价值极高的变化。现在它不仅能自动在Pull Request中发现关键漏洞,大幅减少无效评论,还能直接帮助你修改代码,真正实现了“评论即修复”的闭环。
回顾一下OpenAI的节奏:四月推出Codex CLI,五月发布Codex Web版,两周前把所有功能整合到了ChatGPT的统一账户体系下。到现在,无论你使用终端、IDE、网页端、GitHub还是iOS客户端,Codex已经实现了真正的全平台覆盖。
目前GPT-5-Codex已面向ChatGPT Plus、Pro、Business、Edu和Enterprise用户开放,使用额度根据订阅类型有所不同。Business和Enterprise用户还支持额外购买积分或使用共享积分池。API也已经在路上了。如果你是开发者,终端安装只需要一句命令:$ npm i -g @openai/codex。详细的定价和使用限制,可以参考官方的说明文档。
这次升级的灵魂,毫无疑问是全新训练的GPT-5-Codex模型。它是针对Agentic Coding场景高度优化的GPT-5特化版。和通用模型不同,它学会了如何处理真实世界中充满不确定性的复杂工程任务——搭建完整项目、添加功能、写测试、重构甚至代码审查,都在它的能力范围之内。
更让人感到方便的是,现在只需要一个ChatGPT账号,就能在本地与云端之间无缝切换,上下文完全打通。Codex已经深度融入了开发的全流程:终端、IDE、网页、GitHub,甚至连iOS版的ChatGPT都支持使用。从定价策略来看,OpenAI的目标很明确——打造一个真正懂你、足够可靠、还能帮整个团队分担任务的编程搭档。
GPT-5-Codex 核心能力
关键基准成绩惊人

一组实打实的数据可以说明问题。在SWE-bench Verified(n=500)上,它的准确率高达74.5%,超越了GPT-5本身的72.8%。在高难度代码重构任务中(支持Python、Go、OCaml等语言),准确率从33.9%飙升至51.3%。举个例子,它成功处理了Gitea中一个修改了232个文件、涉及3541行代码的Pull Request。
动态分配“思考时间”,又快又深

它的工作模式很有意思。小任务秒级响应,大任务则愿意花时间去思考。最长可独立连续工作超过7小时,迭代方案、修复测试、提交代码,全流程自动完成。Token的使用也变得极为智能:处理简单任务时,比GPT-5少用了93.7%的Token;而面对复杂任务时,则多用102.2%的Token来确保输出质量。这种动态调度的能力,是它区别于其他工具的关键所在。
代码审查:精准、高质量

代码审查方面的进步,同样值得关注。不正确评论率从13.7%降低到了4.4%,高影响力评论的比例从39.4%提升到了52.4%。平均每个PR的评论数从1.32减少到了0.93——意思是它学会了只聚焦关键问题,拒绝无关紧要的废话。
另外,它在前端方面的表现也令人印象深刻,能构建漂亮的桌面和移动应用,还支持多模态输入。你可以直接扔一张截图或设计稿给它,让它照着做,并在云端实时查看进度。不过需要特别注意的是,官方建议仅在Codex或类似的编程环境中使用这个模型,并不建议将其作为通用模型。
Codex 生态工具全面焕新
全新 Codex CLI

命令行工具也迎来了全面重写,主要升级包括:支持附加图像,可直接发送截图、线框图、设计稿作为参考;智能任务跟踪,自动生成待办列表,复杂工作不再迷失方向;工具集成更强了,支持网页搜索和MCP协议连接外部系统,工具调用的准确性大幅提升;终端UI也做了优化,Diff展示更加清晰,会话状态支持压缩,大大提升了使用体验。
Codex IDE 扩展

IDE插件方面,已经全面支持VS Code、Cursor及其他衍生版本。它会利用本地上下文——基于当前打开的文件和选中的代码生成提示,结果更精准。云端协作实现了无缝衔接,在IDE内就能创建、跟踪、审查云端任务,上下文始终保持同步。Codex云袋里的性能提升尤为显著,容器缓存让中位完成时间减少了90%。环境设置也实现了自动化,比如自动执行pip install等依赖安装操作。可视化工作流方面,支持上传图片来指定UI,Codex会边做边截图向你反馈进度。
智能代码审查
不只是一个静态分析工具。GPT-5-Codex能够理解PR的整体意图,结合整个代码库进行推理,甚至能通过运行测试来验证修改的正确性。自动审查功能会在PR准备就绪时自动发布分析报告;交互式修复则提供了更灵活的玩法——你只需要在评论区@codex,它就能直接帮你修改代码。当然,也支持按需触发,比如@codex review for security vulnerabilities这样的指令。目前,OpenAI内部绝大多数PR已经是Codex在审查,每天拦截数百个潜在问题,开发效率和信心都得到了显著提升。
安全机制
值得强调的是,安全机制也做了充分考虑。默认采用沙盒环境,禁用网络访问,以防止提示注入和有害操作。权限控制方面,高危操作需要人工批准,并且支持自定义安全等级。整个过程透明可追溯,系统会提供引用来源、终端日志和测试结果,但官方依然建议以人作为最终的审查者。
与GPT-5保持一致,GPT-5-Codex在生物学和化学等领域也被认定为高能力模型,并已部署了严格的安全措施。完整的技术公告可以在OpenAI官方网站上查阅。
