首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
GPT5.5深夜炸场,这次OpenAI又行了

GPT5.5深夜炸场,这次OpenAI又行了

热心网友
65
转载
2026-04-25

GPT-5.5深夜突袭:OpenAI打了个漂亮的翻身仗


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

出品|虎嗅科技组

作者|赵致格

编辑|苗正卿

头图|视觉中国

还记得OpenAI CEO奥特曼那段著名的“吓瘫”论吗?他曾用“看到原子弹爆炸”来形容初次体验GPT-5的震撼。结果呢?期待越高,落差越大,那段夸张描述反倒成了网友反复调侃的梗。

不过,这次情况不同了。4月24日,OpenAI毫无预告地在半夜甩出了GPT-5.5。没有天花乱坠的铺垫,惊喜却实实在在。官方将其定位为“面向实际工作和智能体的新型智能”,主攻Agent编程、知识工作和科学研究。目前,ChatGPT和Codex的Plus、Business、Enterprise用户已经能用上,API也将紧随其后。

虽然这次没人被“吓瘫”,但看看第三方评测的分数就明白了:GPT-5.5的综合表现相当亮眼。它不仅比自家的GPT-5.4进步了一大截,在多个关键领域也超越了Claude Opus 4.7、Gemini 3.1 Pro这些老对手。可以说,在过去一段时间里饱受质疑的OpenAI,这回算是打了一场漂亮的翻身仗。

性能实测:多项领先,编程与安全是亮点

先看硬指标。在OpenAI内部用于评估20小时长周期软件工程的Expert-SWE测评中,GPT-5.5的成功率达到了惊人的73.1%,显著高于上一代GPT-5.4的68.5%。

这还不是全部。在衡量复杂命令行工作流的Terminal-Bench2.0测试中,GPT-5.5评分高达82.7%,远高于Claude的69.4%。此外,无论是知识工作任务(GDPval)、高级数学测试(FrontierMath),还是衡量真实电脑操作能力的OSWorld-Verified,GPT-5.5的评分都稳稳压过竞争对手一头。

编程能力方面,GPT-5.5表现不俗,但Opus 4.7在SweetBench Pro测试中依然保持领先,得分64.3%高于GPT-5.5的58.6%。不过,OpenAI对此也有话要说:公司指出,行业报告已显示该评测存在过拟合问题,未必能真实反映编程能力。

另一个显著提升的维度是网络安全。在CyberGym测试中,GPT-5.5拿下81.8%的得分,超过了Opus 4.7的73.1%。在CTF“夺旗”挑战中,它的得分也达到了88.1%,高于GPT-5.4的83.7%。

核心进化:从“参谋”到“执行者”

当然,OpenAI更乐于强调的,是GPT-5.5定位的转变。它不再只是一个聪明的聊天对象,而是被设计成“专为真实工作和智能体任务打造”的模型。用官方账号的话说,它“旨在理解复杂目标、使用工具、检查其工作,并将更多任务进行到底”,这标志着“完成计算机工作的全新方式”。

翻译成更直白的大白话就是:这次升级让GPT获得了“自己动手”的能力。它正在从辅助人类决策的“参谋”,转向参与实际执行的“员工”。你大可以把一个混乱复杂的任务直接丢给它,GPT-5.5能自己理解目标、拆解步骤、调用工具、修正过程,最后把结果交到你手上。

为了证明这一点,OpenAI还公布了内部的使用数据:目前公司超过85%的员工每周都在跨部门使用搭载GPT-5.5的Codex。更直观的是,财务团队已经用它完成了24771份、总计超过7万页的税表审核工作,完工时间比往年足足提前了两年。

不过,这次升级似乎还没做到让人类完全“放手”。多个第三方评测都提到了一个特点:GPT-5.5对任务边界的依赖更强。如果需求描述模糊不清,它不会主动帮你补充完善,而是会严格按照现有信息去执行。这种“高度服从”在某些需要创造性的场景下,反而可能成为一种局限。

效率与成本:更聪明,却未必更“贵”

AI领域有个常见的两难选择:智慧和速度往往不可兼得。模型更大、参数更多,通常意味着更长的思考时间。但GPT-5.5这次打破了这个惯例——在智能水平大幅提升的同时,其真实服务响应速度却与GPT-5.4保持了一致。

另一个关键特征是“省”。GPT-5.5将Token消耗降低到了前一代的三十六分之一。在同类Codex任务中,它也用更少的Token就能搞定。这意味着,尽管此次API价格大幅上调(每百万Token 5美元,Pro版30美元),但由于效率提升和消耗锐减,用户实际增加的成本可能非常有限。

OpenAI联合创始人格雷格·布罗克曼谈及这一点时表示,公司的目标始终是“让企业和普通用户都能用上更前沿的AI能力”。

行业格局:对手的烦恼与OpenAI的算力牌

当OpenAI凭借新模型重回聚光灯下时,它的老对手Anthropic最近的日子却有点不好过。这家长期主打“安全牌”的公司近期爆出了安全丑闻,同时对重度付费用户严厉限流、大面积无差别封号等操作也引发了巨大争议。日益高企的Token费用和消耗,更是让许多用户直呼“用不起”。

此前,OpenAI在内部邮件中曾直言,自己相对于Anthropic的核心优势是“算力”。如今,随着算力充足的OpenAI大秀肌肉,而Anthropic在算力吃紧中用户体验不断打折,这两位一度“贴身肉搏”的巨头,其发展轨迹似乎正在悄然拉开差距。

来源:https://www.163.com/dy/article/KRBBO99K051188EA.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenAI发布工作流Agent,GPTs进入倒计时
AI
OpenAI发布工作流Agent,GPTs进入倒计时

OpenAI凌晨发布了Workspace Agents,GPTs开始进入倒计时 这可不是一次简单的功能更新。OpenAI推出的这个新产品,被定位为GPTs的进化形态,目标非常明确:面向团队协作。它的核心,是把一段可以重复执行的工作流程,打包成一个可共享、可独立运行的智能体(Agent)。 背后由Co

热心网友
04.25
GPT5.5深夜炸场,这次OpenAI又行了
科技数码
GPT5.5深夜炸场,这次OpenAI又行了

GPT-5 5深夜突袭:OpenAI打了个漂亮的翻身仗 出品|虎嗅科技组 作者|赵致格 编辑|苗正卿 头图|视觉中国 还记得OpenAI CEO奥特曼那段著名的“吓瘫”论吗?他曾用“看到原子弹爆炸”来形容初次体验GPT-5的震撼。结果呢?期待越高,落差越大,那段夸张描述反倒成了网友反复调侃的梗。 不

热心网友
04.25
OpenAI 的 GPT-5.5 正式发布,4 月份市场反应积极
web3.0
OpenAI 的 GPT-5.5 正式发布,4 月份市场反应积极

OpenAI 的 GPT-5 5 已正式发布 GPT-5 5的市场定位,终于尘埃落定。截至2026年4月30日,预测市场的答案是:100%是的。 消息确认的威力有多大?看看市场反应就知道了。就在4月23日,相关子市场出现了高达25个点的剧烈飙升,概率从61%一举跃升至86%。紧接着,所有活跃的子市场

热心网友
04.24
OpenAI 发布 GPT-5.5:迈向“超级应用”与自主计算的关键一步
业界动态
OpenAI 发布 GPT-5.5:迈向“超级应用”与自主计算的关键一步

2026年4月23日:OpenAI发布GPT-5 5,向“超级应用”愿景迈进 2026年4月23日,AI领域迎来一个标志性时刻:OpenAI正式发布了其最新旗舰模型GPT-5 5。公司总裁格雷格·布罗克曼(Greg Brockman)毫不掩饰地将其定义为公司历史上“最智能、最直观”的模型。更关键的是

热心网友
04.24
OpenAI版「龙虾」首次登场!不睡觉不离职,越PUA越聪明
AI
OpenAI版「龙虾」首次登场!不睡觉不离职,越PUA越聪明

GPTs的棺材板,钉上了 从2024年底上线至今,GPTs一直有个根本问题没解决:它本质上,还是个“高级聊天框”。你问,它答;窗口一关,一切归零。没有持续记忆,没有独立工作空间,更别提主动触发任务了。 但workspace agents彻底碘伏了这个逻辑。 关键在于,Codex为每个Agent提供了

热心网友
04.23

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币交易者关注上涨空间,BTC守稳110,000美元以上
web3.0
比特币交易者关注上涨空间,BTC守稳110,000美元以上

比特币市场观察:站稳关键心理关口,上涨空间如何演绎? 比特币市场最近的表现,可以说给不少投资者吃了一颗“定心丸”。在经历了一段时期的震荡后,BTC价格稳稳地守在了110,000美元上方。这个位置,如今已被广泛视为一个关键的心理与技术支撑位,市场情绪也正从谨慎观望,逐步转向审慎乐观。 一、BTC上涨空

热心网友
04.25
Anthropic与NEC合作打造日本规模最大的人工智能工程技术团队
科技数码
Anthropic与NEC合作打造日本规模最大的人工智能工程技术团队

NEC与Anthropic达成战略合作,将Claude AI引入日本市场 4月25日,人工智能领域传来一则重磅消息。Anthropic公司正式宣布,日本科技巨头NEC(日本电气公司)将全面采用其Claude人工智能技术。这一合作的核心目标是什么?正是为了在NEC内部打造日本规模领先的原生人工智能工程

热心网友
04.25
王传福夫妇坐地铁参加北京车展被偶遇
科技数码
王传福夫妇坐地铁参加北京车展被偶遇

地铁偶遇王传福:大佬的“绿色出行”与品牌无声的广告 这两天,社交媒体上的一则偶遇帖火了。有网友在北京地铁上,碰巧遇到了比亚迪董事长王传福。更巧的是,车厢拉手上的广告,正是比亚迪自家的宣传。这画面,瞬间引发了围观。 网友们的评论也挺有意思,纷纷感慨“大佬真低调”,称赞这是“绿色出行”的身体力行。确实,

热心网友
04.25
谷歌拟向Anthropic投资至多400亿美元
科技数码
谷歌拟向Anthropic投资至多400亿美元

谷歌豪掷千亿加注Anthropic:AI竞赛进入“军备联盟”新阶段 AI领域的资本故事,总是一波未平,一波又起。就在上周亚马逊宣布对Anthropic进行巨额投资后,另一家科技巨头谷歌也亮出了自己的筹码。根据最新消息,谷歌的出手更为阔绰:一笔高达100亿美元的现金投资已经敲定,而这可能仅仅是个开始。

热心网友
04.25
币安Binance官方APP中文用户安装注册入口链接
web3.0
币安Binance官方APP中文用户安装注册入口链接

币安Binance官方APP中文用户安装注册入口链接 本篇文章旨在为您提供币安Binance官方APP中文用户安装注册入口链接。该应用程序是您便捷管理数字资产的专业平台,致力于提供安全、高效的交易体验。它支持多种数字资产操作,界面友好,功能全面。本文提供的是官方应用下载链接,您可以直接点击链接,即可

热心网友
04.25