游乐游手机版
首页/业界动态/文章详情

GPT-5.3 Codex发布:深度参与式开发,性能提升25%

时间:2026-02-09 22:03
2月6日消息,就在竞争对手Anthropic发布新模型Opus 4 6的几分钟后,OpenAI随即推出了GPT-5 Codex。该模型是周一刚面世的Codex编程工具的重大升级,旨在大幅提升其性能。

2月6日消息,就在竞争对手Anthropic发布新模型Opus 4.6的几分钟后,OpenAI随即推出了GPT-5.3 Codex。该模型是周一刚面世的Codex编程工具的重大升级,旨在大幅提升其性能。


OpenAI表示,GPT-5.3 Codex成功整合了GPT-5.2的推理能力、专业知识以及前沿的编程性能。与上一代(GPT-5.2 Codex)相比,新模型不仅能力更强,运行速度也提升了25%。这使其能够胜任需要长时间运行的复杂任务,例如深度调研、自主调用工具以及端到端的流程执行。

GPT-5.3 Codex是OpenAI首个“深度参与了自身开发”的模型。Codex团队透露,他们曾利用该模型的早期版本来调试训练过程、管理部署工作,并诊断测试结果。这种“自我进化”的能力极大地加快了开发进程。

通过引入这一新模型,Codex已从单纯的“写代码工具”进化为“电脑协作者”。它不仅能处理编程任务,还支持软件生命周期的全流程工作,包括系统监控、撰写产品需求文档(PRD)以及指标分析。此外,它的代理能力也扩展到了通用办公领域。在GDPval测评中,该模型在制作演示文稿(PPT)、财务分析报表等专业知识工作上展现出了极强的实力。

在多项行业基准测试中,GPT-5.3 Codex 均刷新了纪录:

· 在衡量现实世界编程能力的SWE-Bench Pro测试中,它达到了当前最先进水平;

· 在OSWorld电脑操作测试中,它能够利用视觉能力在桌面环境中完成复杂生产力任务,表现已接近人类水平。

为了展示其Web开发能力,OpenAI让新模型在几天内从零开始构建了两款功能完整的复杂游戏(赛车游戏与潜水游戏)。在数百万Token的交互规模下,模型能够根据简单的提示词进行自主迭代,生成的代码质量已接近可直接投产的水平。

在安全性方面,GPT-5.3 Codex是首个被归类为“高能力”的网络安全模型。它经过专门训练,能够识别软件漏洞。为支持防御性研究,OpenAI宣布将投入1000万美元的API额度,用于资助开源软件和关键基础设施的防护工作。据悉,该模型是在英伟达(NVIDIA)GB200 NVL72系统上完成训练并提供服务的。

目前,GPT-5.3 Codex已面向ChatGPT付费用户开放,覆盖了应用端、IDE插件及网页端。

这场发布会背后还有一个极具戏剧性的插曲:OpenAI与Anthropic原本都计划在北京时间凌晨2点发布新工具。但Anthropic在最后关头耍了个“小心思”,将发布时间提前了15分钟,在这场发布竞速中抢占了先机。

来源:https://www.163.com/tech/article/KL2Q9O0M00097U7T.html
上一篇Claude Opus 4.6评测:AI同事能否替代人类工作? 下一篇亚马逊盘后大跌9%!AI豪赌吓坏投资者,市值蒸发2000亿
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
爱心企业捐33万购350套路灯 无奈全是假货
业界动态 · 2026-07-01

爱心企业捐33万购350套路灯 无奈全是假货

7月1日消息,广东阳江阳春市近日有市民反映一起令人愤慨的事件——三年前,当地一家爱心企业定向捐赠给村庄的一批太阳能路灯,使用不久便陆续出现故障。经查,整批路灯均为假冒伪劣的“三无”产品。更令人担忧的是,已有村民因路灯损坏,夜间摸黑出行时不慎摔伤,暴露出严重的安全隐患。 这批路灯背后涉及阳春市志愿者联

Claude Sonnet 5发布部分性能逼近Opus 4.8
业界动态 · 2026-07-01

Claude Sonnet 5发布部分性能逼近Opus 4.8

7月1日,Anthropic发布ClaudeSonnet5,具备自主规划与调用浏览器、终端等工具的智能体能力。性能在BrowseComp等评测中大幅超越Sonnet4 6,部分任务接近Opus4 8。安全方面,不良行为发生率降低,抗提示注入与幻觉率均有改善。

寒武纪成科创板万亿市值,优必选发布仿生人形机器人,红米K90至尊版发布
业界动态 · 2026-07-01

寒武纪成科创板万亿市值,优必选发布仿生人形机器人,红米K90至尊版发布

寒武纪盘中涨7%,市值突破万亿,成科创板首支万亿股票,年内涨幅超75%。优必选发布仿生人形机器人U1系列,主打家庭情感陪伴,预定超1 1万台。REDMIK90至尊版手机发布,搭载骁龙8至尊版、8550mAh电池、100W快充及165Hz直屏。

官方辟谣韩红因冯小刚新片走个面言论道歉退出公益
业界动态 · 2026-07-01

官方辟谣韩红因冯小刚新片走个面言论道歉退出公益

这一事件的来龙去脉颇为耐人寻味——7月1日,韩红在冯小刚新作《抓特务》的宣传活动中,一句“北京兄弟姐妹爷们娘们走个面儿”的喊话迅速引爆热搜。表面听来是一句热情招呼,却意外成为全网热议的“道德绑架”焦点。到底是喊话过于直白,还是网友过于敏感?不妨一同回顾始末。事实上,韩红担任了《抓特务》的配乐制作人,

小米汽车连续三月交付超3万辆 上半年累计逾18万辆
业界动态 · 2026-07-01

小米汽车连续三月交付超3万辆 上半年累计逾18万辆

数字往往最具有说服力。小米汽车正式公布了2026年6月的交付成绩——单月交付量继续稳定在3万辆以上,市场热度丝毫未减。尽管官方公告依然保持了简洁的风格,主要向用户的信赖与支持表达了谢意,但对于关注这个品牌的人来说,其中蕴含的信息已经足够清晰。将上半年的数据串联起来看,小米汽车的整体表现脉络相当清楚: