OpenAI发布GPT-5.1升级:Codex-Max支持长任务处理,多场景应用上线
OpenAI正式发布专为长时间编码任务设计的全新Agentic模型——GPT-5.1-Codex-Max。这款创新模型通过突破性的"压缩技术",成功打破了传统上下文窗口的限制,能够在单次任务中稳定处理百万量级的Token,同时显著提升资源利用效率。相较于前代产品,新版模型在响应速度与处理性能方面均有质的飞跃,特别适合需要持续运行的复杂编程场景。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
在模型训练过程中,研发团队引入了真实软件工程任务数据集,涵盖代码审查、前端优化、技术问答及PR创建等核心开发环节。权威测试结果显示,该模型在多项编程评估中表现优异:SWE-Bench Verified(500样本)得分达77.9%,SWE-Lancer IC SWE测评取得79.9%成绩,TerminalBench 2.0测评达到58.1%,三项关键指标均超越前代模型。针对Windows开发环境,团队还进行了专项优化,使模型在跨平台支持方面展现出更强适应性。
面对长时间运行任务,GPT-5.1-Codex-Max展现出独特优势。传统模型常因上下文限制导致任务中断,而新模型能在接近容量阈值时自动压缩对话内容,实现持续运行数小时甚至超过24小时。内部测试表明,在复杂代码重构和持续代理循环场景中,该模型能保持稳定输出,有效解决开发过程中的上下文丢失问题。
推理效率的提升进一步增强了模型实用性。在SWE-Bench Verified测试中,新模型完成相同任务所需的思考Token减少30%,通过"Extra High(xhigh)"模式可针对复杂逻辑进行深度分析。这种优化不仅降低了计算成本,还显著提升了代码生成的准确率,特别适合需要多步骤推理的编程任务。
目前,该模型已集成至Codex CLI、IDE扩展、云端服务及代码评审系统,面向ChatGPT高级订阅用户开放使用,涵盖Plus、Pro、Business、Edu及Enterprise全层级。OpenAI计划近期通过API向开发者提供服务,并逐步将其设为Codex平台的默认模型。此次升级标志着Agentic编程工具向工业化应用迈出关键一步,为大规模软件开发提供更可靠的自动化支持。
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





