OpenAI推出macOS版Codex：AI编程助手赋能开发者

时间：2026-02-03 10:52

IT之家 2 月 3 日消息，人工智能已然对软件开发的方式产生颠覆性影响，如今编程中大量繁重琐碎的工作，都由一众智能体与子智能体完成。但开发者们仍在不断探索人机协作的全新交互界面与产品形态，即便最顶

人工智能正以颠覆性的方式重塑软件开发领域。过去那些繁琐重复的编码任务，如今已越来越多地交由各类智能体完成。然而，开发者们并未止步，他们仍在持续探索人机协作的全新交互界面与产品形态。即便是顶尖的人工智能实验室，也难以完全跟上这快速迭代的技术步伐。

当前的主流趋势是智能体化的软件开发，即人工智能能够独立完成编码任务的系统。Claude Code 与 Cowork 这类应用便是该模式的典型代表。与此同时，OpenAI 也在逐步完善其 Codex 工具。该工具于去年四月以命令行形式首次推出，仅一个月后便拓展出网页端界面。

如今，OpenAI 正式迈出了追赶的关键一步。当地时间本周一，该公司推出了适配 macOS 系统的全新 Codex 应用，整合了过去一年间广泛流行的各类智能体化开发逻辑。这款新应用支持多智能体并行作业，能够融合不同智能体的能力，并适配当前最前沿的工作流程。此次发布距离 OpenAI 推出其最强编码大模型 GPT-5.2-Codex 尚不足两个月。公司希望凭借此模型吸引 Claude 系列编码工具的现有用户。

OpenAI 首席执行官萨姆·奥尔特曼在媒体电话发布会中谈到：“若要处理复杂场景下的高精尖开发工作，GPT-5.2 是目前性能最强的模型。但它此前的使用门槛偏高，因此我们认为，将这款模型的强大能力封装进更灵活的交互界面，会具备极为重要的价值。”

尽管奥尔特曼对 GPT-5.2 充满信心，但各类编码基准测试的结果却呈现出更复杂的态势。截止发稿时，GPT-5.2 在一项衡量人工智能处理命令行编程任务能力的测试 TerminalBench 中暂居榜首，不过 Gemini 3 与 Claude Opus 的智能体得分与其基本持平（数值略低），处于该基准测试的误差允许范围内。另一项测试人工智能修复真实软件漏洞能力的基准测试 SWE-bench，结果也与之相似，GPT-5.2 并未展现出明显优势。然而，智能体化的应用场景很难通过现有基准进行有效评估，且顶尖模型在用户体验上的差异可能十分显著。

这款 Codex 应用还搭载了多项全新功能，这些功能将帮助其达到与各类竞争产品相当、甚至部分场景下实现反超的水平。应用支持设置自动化任务，可按预设计划在后台自动运行，执行结果会存入队列，待用户返回后统一查看。用户还能根据自身工作风格，为智能体选择不同的交互风格，从务实理性型到共情沟通型均可切换。

但对 OpenAI 而言，这款产品最核心的卖点，是人工智能带来的极致开发效率。奥尔特曼称：“你可以从零开始，仅凭这款工具，在数小时内开发出功能相当复杂的软件。我能多快输入新的创意，软件的开发速度就有多快，这便是唯一的限制。”

来源：https://www.163.com/dy/article/KKQTB0U90511B8LM.html