首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
OpenAI最强编程模型GPT-5.1发布:Codex Max能力解析与实测

OpenAI最强编程模型GPT-5.1发布:Codex Max能力解析与实测

热心网友
13
转载
2025-11-20

11月20日消息,OpenAI于11月19日正式推出GPT-5.1-Codex-Max智能编程模型,该版本在长程推理能力、执行效率与实时交互性能方面均有显著提升。同时,这一全新模型将取代现有的GPT-5.1-Codex,成为Codex集成界面中的默认编程模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

此次发布紧接在谷歌Gemini 3 Pro之后,但在多项关键编程基准测试中,Codex-Max展现出更卓越的实际表现。例如,在衡量实际软件开发问题解决能力的SWE-Bench Verified测试中,Codex-Max以77.9%的准确率小幅领先Gemini 3 Pro的76.2%。

Codex-Max在Terminal-Bench 2.0测试中同样表现出色,达到58.1%的准确率,而Gemini的准确率为54.2%;在竞争更为激烈的LiveCodeBench Pro编码能力评估中,它与Gemini的2439分持平。

GPT-5.1-Codex-Max引入了一项名为“上下文压缩”(Compaction)的重要架构机制。该技术使模型在接近上下文窗口限制时,能够智能保留关键信息并舍弃冗余细节,从而在跨越数百万token的持续任务处理中保持稳定性能,避免效率衰减。

得益于此,该模型在内部测试中已成功实现超过24小时的无间断复杂任务处理,例如进行多步骤代码重构与自主调试。与此同时,这项技术还带来约30%的token效率提升,有效降低了运行成本与响应延迟。

目前新版模型已全面集成至OpenAI自家的多个Codex开发环境中,涵盖其最新命令行工具Codex CLI、内部代码审核系统以及各类交互式编程界面。

开发者可通过这些工具实时体验模型的强大交互能力,例如在可视化界面中进行强化学习训练,或是模拟光学定律的实现过程。不过GPT-5.1-Codex-Max尚未开放公共API接口,但官方最新消息表示即将对外开放。普通用户则需要订阅ChatGPT Plus、Pro或企业版等付费方案方可使用。

OpenAI透露,公司内部95%的工程师每周都会使用Codex系列工具。自采用以来,这些工程师平均多提交了约70%的代码合并请求,显著提升了产品迭代速度。

尽管Codex-Max具备高度自主性,OpenAI仍强调其定位是编程“助手”而非人类替代品。为保障透明度,模型会生成完整的终端日志与测试引用,方便开发者审核并验证其生成的所有代码。此外,模型默认运行在严格的沙盒环境中,并禁用网络访问功能,以确保操作安全性。

来源:https://www.donews.com/news/detail/1/6261382.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenAI再上演资产大逃亡:别等ASI,模型已成流量诱饵
AI
OpenAI再上演资产大逃亡:别等ASI,模型已成流量诱饵

新智元报道编辑:倾倾【新智元导读】全世界都在等ASI降临,OpenAI却在年初悄悄上线广告位。9亿用户撑不起数百亿美元的算力账单,智力正在贬值,神仙也得下凡赚钱!2025年底,一份名为ChatGPT

热心网友
04.01
OpenAI融资1220亿美元:背后技术与市场双轮驱动
AI
OpenAI融资1220亿美元:背后技术与市场双轮驱动

当地时间3月31日,OpenAI宣布完成最新一轮融资,募集资金达1220亿美元,投后估值达8520亿美元。 微信编辑 | 七三

热心网友
04.01
估值超千亿,OpenAI为何迟迟不IPO上市?
科技数码
估值超千亿,OpenAI为何迟迟不IPO上市?

备受瞩目的OpenAI最新轮次融资,终于落下定音槌——当地时间3月31日,OpenAI宣布完成了新一轮融资,融资规模达到惊人的1220亿美元,而投后估值则达到了8520亿美元。亚马逊、英伟达和软银,

热心网友
04.01
OpenAI融资1220亿美元创纪录,首向散户敞开大门
AI
OpenAI融资1220亿美元创纪录,首向散户敞开大门

编辑|Panda昨晚,Anthropic 意外在一个 npm 包更新中泄漏了其核心产品 Claude Code 高达 51 2 万行的底层源代码,参阅《全网疯传fork!刚刚,Claude Code

热心网友
04.01
8417亿史上最大融资:诞生背后的商业逻辑与行业启示
AI
8417亿史上最大融资:诞生背后的商业逻辑与行业启示

智东西编译 李水青编辑 心缘智东西4月1日消息,今早,OpenAI宣布完成了最新一轮融资,募集资金达1220亿美元(约合人民币8416 78亿元),投后估值达8520亿美元(约合人民币58779 4

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

索拉拉是什么币?未来能涨多少?索拉拉币的详细信息介绍
web3.0
索拉拉是什么币?未来能涨多少?索拉拉币的详细信息介绍

索拉拉是什么币?未来能涨多少?索拉拉币的详细信息介绍 最近,圈内有个热议的话题:知名公链Solana正式确定了它的中文名——“索拉拉”。这个名字并非来自项目方的单方面决定,而是由社区发起、最终获得官方认可的集体智慧结晶。它取代了大家此前更耳熟能详的“索拉纳”。那么,这个新名字背后的索拉拉币究竟是什么

热心网友
04.02
低流动性加密货币风险:真实案例
web3.0
低流动性加密货币风险:真实案例

流动性是加密市场的静默引擎 想象一下,当市场的脉搏变弱,交易不再活跃,会发生什么?流动性,这个常常被忽视的指标,恰恰是维持价格稳定的关键。一旦它开始减弱,市场的脆弱性便会暴露无遗。交易量大幅下滑,买卖资产就像在狭窄的通道中穿行,一个不小心,就可能引发剧烈的价格波动。 这种情形并不罕见,通常在年末清淡

热心网友
04.02
如何使用坚果云上传文件-坚果云上传文件的方法
手机教程
如何使用坚果云上传文件-坚果云上传文件的方法

你是否在寻找安全便捷的云端文件存储方案? 坚果云很可能就是你需要的答案。作为一款高效的云存储服务,它让数据同步与文件管理变得异常轻松。本文将详细介绍坚果云的多种文件上传方法,帮助你快速掌握核心操作流程。 注册与登录坚果云 首先,访问坚果云的官方网站,完成账户的注册步骤。随后使用账号密码登录,系统将呈

热心网友
04.02
OPPO K15 Pro系列无缘16GB 产品经理直呼太贵
科技数码
OPPO K15 Pro系列无缘16GB 产品经理直呼太贵

OPPO K15 Pro系列4月1日发布:存储配置引热议 OPPO官方已正式宣布,K15 Pro系列新品将于4月1日正式发布。值得注意的是,尽管尚未正式亮相,该系列的两款新机目前已在OPPO官方商城开放预约。然而,官网配置信息揭示了一个值得关注的现象:全系列目前仅提供12GB运行内存(RAM)版本,

热心网友
04.02
《红色沙漠》采石场隐藏遗迹攻略分享
游戏攻略
《红色沙漠》采石场隐藏遗迹攻略分享

击败《红色沙漠》采石场的马罗尼采石机械后,BOSS战并未真正结束。游戏的深度探索,实际上始于一处隐秘遗迹的触发。你需要寻找到那个特定的入口,然后纵身跃下,方能正式踏入这片鲜为人知的地下秘境。 落地之后,挑战即刻开始。这片地下遗迹并非安宁之地,首先迎接你的往往是那些极具攻击性的球形守卫者,它们行动迅捷

热心网友
04.02