OpenAI最新编程AI模型GPT-5.3 Codex发布

首页

AI资讯

热心网友

转载

2026-05-23

GPT-5.3 Codex是什么

如果说之前的AI编程助手还停留在“辅助写代码”的阶段，那么OpenAI最新推出的GPT-5.3 Codex，则标志着一次根本性的跨越。它不再仅仅是一个工具，更像是一位具备全栈工程思维的数字同事。

这款旗舰级智能编码模型，深度融合了专业的编程能力与逻辑推理知识。最直观的提升在于效率：推理速度较前代提升了25%，同时处理任务所消耗的token数量却减半了。在SWE-Bench Pro、Terminal-Bench 2.0等一系列严苛的行业基准测试中，它都创下了新的纪录。

更值得玩味的是其能力边界。GPT-5.3 Codex支持长时间自主任务执行与实时的人机协作交互。一个颇具象征意义的突破是，它已能参与自身开发训练的部分流程。这预示着智能体正从单纯的“代码生成器”，向能够驾驭“全流程计算机操作”的自主工程师进化。从调试、部署到文档撰写和数据分析，软件工程生命周期的各个环节，它都能胜任。

GPT-5.3 Codex的主要功能

那么，这位“数字同事”具体能做什么？它的技能树相当全面：

编码开发：具备真正的自主软件工程能力。无论是多语言环境下的真实开发任务，还是需要长周期迭代的复杂全栈项目，它都能独立构建。
终端操作：对命令行工具了如指掌，可以高效、准确地执行各类终端命令和脚本，让自动化运维变得轻而易举。
视觉计算机操作：这项能力堪称革命性。通过视觉感知桌面环境，它能像真人一样进行点击、输入和导航，完成GUI自动化任务，打通了数字世界的“最后一公里”。
实时协作交互：工作不再是黑盒。它会在过程中主动汇报进度，用户可以随时介入讨论、调整方向，实现上下文不中断的流畅协作。
网络安全能力：它还是首个获得「高能力」评级的网络安全模型，不仅能识别软件漏洞，在专业的CTF（夺旗赛）中也成绩斐然。
自我改进开发：模型的迭代正在进入“自举”阶段。早期版本已能参与自身的训练调试和部署管理，为加速进化提供了可能。
基础设施优化：基于NVIDIA GB200系统运行，不仅推理更快，还支持动态GPU扩缩容，确保了服务的高效与稳定。

如何使用GPT-5.3 Codex

目前，GPT-5.3 Codex已面向ChatGPT的付费套餐用户开放。你可以通过所有Codex支持的场景来调用它：无论是直接的应用端、命令行界面(CLI)，还是集成在IDE中的扩展插件，乃至网页端，都能体验到它的强大能力。

GPT-5.3 Codex的性能表现

数据不会说谎。GPT-5.3 Codex在多项关键测试中交出的成绩单，清晰地勾勒了其能力象限：

SWE-Bench Pro：在这个更严格的多语言真实软件工程评估中，达到了56.8%的通过率，不仅超越了所有前代模型，而且是用更少的token完成了精度更高的任务。
Terminal-Bench 2.0：77.3%的得分，相比前代的64.0%实现了大幅领先，充分证明了其在终端操作和命令行工具使用上的卓越能力。
OSWorld-Verified：取得64.7%的突破性成绩，较前代的38.2%提升了近26个百分点。要知道，人类在此测试中的平均水平约为72%，这意味着它的视觉计算机操作能力已经非常接近真人水平。
网络安全CTF：以77.6%的得分显著超越前代（约67%），这也是其获得「高能力」评级的核心依据。
SWE-Lancer IC Diamond：在模拟高端软件工程自由职业任务的测试中，达到81.4%，较前代提升5.4个百分点，展现了解决复杂、开放性商业需求的能力。
速度与效率：综合来看，25%的推理速度提升结合更高的token效率，使其能够更经济、更流畅地支持长周期任务执行。