应对竞争压力，OpenAI发布最强代码生成模型

首页

热心网友

转载

2026-02-09

从写代码到「接管电脑」，GPT-5.3-Codex 正在重新定义什么叫 AI 工具人。

作者｜桦林舞王

编辑｜靖宇

2 月 5 日，Anthropic 在超级碗上发布的讽刺广告，，却被科技圈嘲笑。

现在，Altman 的报复来了！

当地时间 2 月 5 日，OpenAI 发布 GPT-5.3-Codex，这款最新的代码模型不仅在测试中名列前茅，而且能真正接管电脑，自主切换程序，完成复杂任务。

，现在又是 GPT-5.3-Codex，来自 Altman 的反击，是如此迅速。

从「代码助手」到「电脑管家」

传统的 AI 编程工具，包括 GitHub Copilot 和之前的 Codex，本质上都是「代码补全器」——你写一行，它帮你写下一行。但 GPT-5.3-Codex 完全不同。

它能「接管」你的整台电脑。

OpenAI 在发布会上展示的场景让人印象深刻：Codex 不仅能写代码，还能运行测试、调试程序、管理数据库、处理文件系统，甚至能够自主地在不同应用程序之间切换，完成复杂的多步骤任务。

一位 Hacker News 用户的观察很有意思：「Codex 在发现错误和小的不一致性方面非常出色，这让我感到惊讶。Claude Code 在『原始编程』方面很好，但 Codex 在仔细、系统地发现『问题』方面是无敌的。」

说白了，这不再是一个编程工具，而是一个数字员工。

相比于之前的版本，GPT-5.3-Codex 的提升不再仅仅体现在代码生成的正确率，而是在「智能代理（Agentic）」能力上的质变。

5.3 Codex 和自家产品的对比｜图片来源：OpenAI

在保持相同推理深度的情况下，运行速度比GPT-5.2-Codex快了25%。同时，新模型引入了「中途转向（Mid-turn Steering）」。你不再需要等待模型生成完毕后才反馈，可以在它运行长达数小时的任务（如重构整个代码库）时，随时插入指令进行纠偏。

就在 OpenAI 发布 5.3 的同一天（甚至只相差 15 分钟），Anthropic 发布了Claude Opus 4.6，火药味极浓。

OpenAI 和 Anthropic 最新代码模型的数据对比｜图片来源：AI 自制

更有趣的是，这是OpenAI第一个「自己造自己」的模型。

研究团队用 Codex 来监控训练过程、分析代码质量、提出优化建议。AI 开始参与 AI 的诞生过程，这个循环一旦形成，进化速度将是指数级的。

90% 时间在编程的产品经理

最能说明 Codex 影响力的，不是技术指标，而是人的工作方式改变。

OpenAI 产品设计负责人 Ed Bayes 的话很直接：「我现在 90% 的时间都在编程。一年前正好相反，可能只有 10% 的时间。」

一个产品设计师，现在大部分时间在写代码——这个转变背后的逻辑很简单：当 AI 能够理解你的意图并直接实现时，传统的「产品-开发-测试」流水线就被压缩了。

这种变化不只发生在 OpenAI 内部。

两天前 OpenAI 刚刚发布 MacOS 版的 Codex 独立应用｜图片来源：OpenAI

The New Stack 分析师指出：「GPT-5.3-Codex 不仅仅在单个任务上更好，而是朝着能够在现实世界技术工作的全谱中进行推理、构建和执行的单一通用代理迈出了一步。」

但这也带来了新的分工模式。

一位 Hacker News 用户总结了 Codex 与 Anthropic Claude 的区别：「在 Codex 中，定位是一个交互式协作者：你在执行过程中引导它，保持循环，在它工作时纠正方向。而在 Opus 4.6 中，强调的是相反的：一个更自主、更智能、更深思熟虑的系统。」

这意味着，程序员的角色正在从「执行者」转向「指挥者」。

AI Coding 大战升级

Codex 的发布时间点很微妙——就在超级碗前夕，OpenAI 和 Anthropic 都准备了竞争性广告。VentureBeat 将此次发布描述为「AI 编程战争的开场齐射」。

这不是偶然。当 AI 编程工具从「锦上添花」变成「必需品」时，这个市场的竞争就会变得异常激烈。

有 Hacker News 评论员直接警告 Anthropic：「他们最好采取重大行动，否则 OpenAI 将杀死 Claude Code。」话虽然说得直接，但反映了业内的普遍判断：Codex 这次的能力跃升，确实给竞争对手带来了巨大压力。

不过，Every.to 的对比测试显示了另一个角度：「在一项调试测试中，GPT-5.3 Codex 运行了超过 8 个工具调用，逐位分析但错过了实际问题。而 Opus 4.6 只读了一次文档就诊断出了问题。」

这说明，不同的 AI 编程工具正在形成差异化的优势：Codex 更像一个细致的执行者，Claude 更像一个敏锐的诊断师。

但无论如何，Sam Altman 的评价很能说明问题：「感觉，比基准测试显示的更像是一个真正的进步。」当CEO用「感觉」而不是数据来描述产品时，往往意味着这个产品已经超越了现有的评估体系。

这场 AI 编程战争，本质上是在争夺一个问题的答案：在软件开发这个万亿美元市场中，人和 AI 的边界到底在哪里？

Codex 给出的答案是：AI 可以做程序员能做的几乎所有事情，人类负责告诉 AI 要做什么。这个分工模式一旦被验证，整个软件行业的人才需求、薪酬结构、甚至教育体系都会发生根本性改变。

现在的问题不再是「AI 会不会取代程序员」，而是「什么样的程序员，不会被 AI 取代」。

*头图来源：OpenAI

来源:https://www.163.com/dy/article/KL35H26O05119FMA.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：App Store山寨App暴增60%，苹果如何重拳破防？下一篇：NVIDIA CUDA护城河崩塌？AI算力新框架效能暴增82%

相关攻略

业界动态

RPA入门需要编程基础吗

探讨RPA（机器人流程自动化）时，一个普遍被提及的问题是：学习和应用RPA需要编程基础吗？答案并非绝对。这主要取决于三个核心维度：所选RPA工具的特性、待自动化流程的复杂程度，以及实施者自身的技术背景。下面我们将逐一深入分析。一、RPA平台与编程需求不同RPA厂商提供的平台，其技术门槛差异显著

热心网友

05.14

南京大学与伦敦大学学院联合发布编程助手推理能力评估新基准

南京大学与伦敦大学学院联合研究团队近日发布了一项突破性成果，为精准评估大型语言模型在代码生成与编程任务中的真实能力提供了全新框架。相关研究论文《CONTEXTBENCH: 评估代码大模型上下文推理能力的基准》已正式发表于预印本平台arXiv，论文编号为arXiv:2602 05892v2。随着AI

热心网友

05.12

科技数码

学生创意编程作品虚拟拼豆机从失败到国际夺冠之路

苹果Swift学生编程挑战赛揭晓，江苏四名学生获奖。作品涵盖海洋公益游戏、手势控制音乐应用、虚拟拼豆机及机器人实验室游戏，展现了年轻开发者用代码表达创意与解决实际问题的能力。赛事允许使用AI工具辅助开发，但强调批判性思维与原创力仍是核心价值。

热心网友

05.10

编程语言

编程入门指南从零基础到理解核心概念

编程十年的一点分享在软件开发的路上走过十几年，从一个爱好者到以此为业，有些体会或许值得聊聊，就当是抛砖引玉吧。最早接触编程，是从BASIC和C语言开始的。工作后，随着需要，陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业，可以说始于FoxPro 5 0，之后技术栈随着项目

热心网友

05.07

编程语言

编程入门指南什么是编程及其核心概念

编程是什么？在软件行业沉浸多年，回头一想，似乎很少严肃地追问过这个最根本的问题：到底什么是编程？今天，就让我们来好好探讨一下。如果翻开教科书，你会找到这样的标准答案：编程，就是为解决特定问题，使用某种程序设计语言编写代码，并最终让计算机输出结果的过程。其核心在于，人类必须将解决问题的思路、方法和

热心网友

05.07

热门推荐

阿里钉钉文档全功能解析在线协同办公套件使用指南

钉钉文档官网在探讨企业级协同办公解决方案时，钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件，它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接，能够直接同步企业内部组织架构与通讯录，实现团队成员间的即时协作与信息流

热心网友

05.15

商汤小浣熊智能助手基于自研大语言模型

在数字化转型浪潮中，高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手，正是基于自研大语言模型打造的一款创新产品，旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作，即可通过自然对话完成从数据查询、处理到可视化洞察的全流程，让数据价值触手可及。办

热心网友

05.15

MiniMax新一代智能模型矩阵全面解析与应用指南

在人工智能技术快速发展的今天，MiniMax作为一家专注于全栈自研的AI公司，正以其独特的技术路径和前瞻性的布局，在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵，这不仅体现了对核心底层技术自主权的深度掌控，也展现了对未来人机交互与内容生成形态的前瞻思考。那么，M

热心网友

05.15

web3.0

Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景

ApolloCreditFund（ACRED）作为连接传统信贷与DeFi的桥梁，其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产（RWA）的收益捕获与链上流动性释放。短期价格波动难以预测，但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。

热心网友

05.15

智能客服机器人解决方案：AI客服系统提升企业服务效率

在数字化转型浪潮中，一套能够深度适配业务、彰显品牌特色的智能客服系统，已成为企业提升服务效率与用户体验的关键工具。然而，市场上许多解决方案往往模式固化，难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力，更能承载独特的品牌文化与服务哲学？其核心在于系统是否支持深度的自定义与持续的AI训练

热心网友

05.15