首页 游戏 软件 资讯 排行榜 专题
首页
AI
GPT-5.4核心内幕:或具备永久记忆与极限推理新突破

GPT-5.4核心内幕:或具备永久记忆与极限推理新突破

热心网友
31
转载
2026-03-05


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:Aeneas

【新智元导读】GPT-5.4,马上就要来了!目前已经开启测试,一次能写6000行代码。外媒曝出它有极限推理模型,甚至还传闻拥有永久记忆。

如果你觉得最近AI圈有点安静,太不刺激,那可能只是暴风雨前的宁静。

据多方消息,GPT-5.4,已经箭在弦上了!


LMArena上,已经出现了GPT-5.4的身影。


就在刚刚,外媒The Information,剧透了不少关于GPT-5.4的核心内幕。

消息足够炸裂:它有更长的上下文,更极限的推理模型,甚至,可能出现永久记忆!


如果如传闻所言,这些都是真的,那这一代模型很可能不是简单的升级,而是一次能力形态的巨大跃迁。

GPT-5.4提前测试,代码炸裂曝光

最近,GPT-5.4简直在到处泄露。


从Codex错误日志、GitHub PR,到员工误发截图,短短几天时间,GPT-5.4已经被「曝光」了至少三次。


而且,这还都是OpenAI自己意外泄露出来的。

最早,是开发者Corey Noles在使用OpenAI Codex时触发了一次网络安全限制,系统返回的错误日志里出现了一串非常长的模型名称:

gpt-5.4-ab-arm1-1020-1p-codexswic-ev3

这串字符最关键的,就是前面三位——gpt-5.4。

总之,这串字符串可以认为是OpenAI的内部部署ID,翻译过来就是「一个真实部署、正在测试中的GPT-5.4实验版本。」


然后,在OpenAI最新Codex仓库里,出现了两个Pull Request:

一个PR写着:

minimum model version = (5, 4)

另一个PR更直接:

toggle Fast mode for GPT-5.4

看起来,OpenAI给GPT-5.4加了一个「Fast Mode」开关。几小时后,两个PR就被force push删除了。

接下来,更戏剧性的一幕出现:OpenAI Codex团队的一名员工Tibo在社交平台上发布了一张截图。图中,模型选择器里赫然写着GPT-5.4。


没多久,这条帖子就被删掉了。

随后,又有开发者报告,在Codex错误信息中看到类似的模型字符串。

这更加说明,GPT-5.4已经部署在内部服务器,正在进行真实的A/B测试了。

一次提示,生成6000行代码?

而且,目前已经有开发者报告了一个明显变化——速度!

一些测试者表示,模型的推理明显更快,代码生成更长,甚至一次提示可生成6000+行代码!


这在以前几乎不可能。

一些人还发现一个新特征——Fast Mode。

这可能意味着,OpenAI正在尝试新的推理架构,例如多级latency pipeline,或不同速度档位模型。

另外,新模型界面特征也被发现了:部分用户表示,如果在推理摘要(Chain-of-Thought summary)旁边看到点赞或点踩按钮,可能意味着账户已经被分配到GPT-5.4的测试模型。

极限推理模式,性能拉爆

The Information的爆料,也跟以上信息完全对上了。

这次爆料中,最亮的就是这个极限推理模式——Extreme Reasoning Mode了。

传统模型的思考时间都很有限,但这个极限推理模式,直接让模型的性能拉到爆,在遇到困难问题时,能花费更多时间,调用更多计算资源,进行更深层的推理。

有趣的是,根据调查,其实很多普通ChatGPT用户对于推理功能并不太热衷。

而且从商业应用的角度来说,这个功能也不很适用,因为企业要的是AI尽快给一个答案。

因此,OpenAI依然如此重视推理能力,倒是显得动机纯粹了不少。

不过,这个消息,对于科研领域和部分企业客户,倒是重大利好。

显然,在科学研究领域,许多用户很愿意让一个模型在有价值的研究问题上运行数小时,甚至数天。

同时,部分企业也会需要用到GPT-5.4更强的推理能力和长周期任务表现,来构建能够把更复杂业务流程自动化的AI智能体。

根据各方爆料,这个极限推理模式将会很疯狂,这也就把大家的期待拉满了。

上下文直接翻倍,达到1M tokens

对于GPT-5.4来说,这是另一个十分硬核的升级——上下文窗口从40万tokens,升到了一百万tokens。

这样一来,GPT-5.4的上下文窗口将超过当前GPT-5.2的两倍。(当然,也有一些OpenAI模型支持100万token,比如GPT-4.1,但5.2并不支持)

这下,GPT-5.4可以直接塞进去几十万字的文档,分析一整本书,或者长长的代码库和数据了。

这也让终于让这个模型在长上下文能力上,重新追平了谷歌的Gemini和Anthropic的Claude。

毕竟,其他家早就达到了100万token的上下文窗口,现在GPT-5.4终于补齐了这个短板。

而坊间爆料比The Information更夸张:上下文达到了2百万tokens!


GPT-5.4,开始擅长「长任务」

爆料中的另外一个点,就是GPT-5.4在需要持续数小时的任务上表现也更好。

也就是说,它在多个步骤中更能记住用户请求的细节,以及自己被允许或不允许执行的内容,同时也更不容易出错。

显然,这对于OpenAI的Codex编程工具会极有帮助,因为Codex正是使用AI来自动化复杂的长时间任务。

另外,这种长时间任务能力,对于AI Agent来说也非常关键。

Agent可以自己读取需求、查资料、写代码、修bug,并不是每一步都需要人重新提示了。

GPT-5.4,可能拥有永久记忆?

接下来,最疯狂的传闻来了——GPT 5.4,可能拥有永久记忆!

一位工程师在X上给出这个爆料后,立刻炸翻了AI社区,硅谷投资大佬、YC创始人Garry Tan也火速赶来转发。


在这篇帖子中,爆料人是这样介绍GPT-5.4的「持久状态」的。

Jeff Dean在参加latentspacepod播客时就提到了这一点,可以看出,如今各大AI实验室都在思考这个方向。

有人猜测,OpenAI内部很可能已经发现了,如何大规模地有效结合状态空间模型(SSM)和Transformer。

其中的关键,就是SSM的设计本身就是在每一步计算中持续传递隐藏状态(hidden state),而且它的计算复杂度是线性增长,不像Transformer那样随着上下文长度呈二次增长。

这也就和某个传闻相呼应了:据说,GPT-5.4可能拥有200万token的上下文窗口。


所谓持久化状态,本质上意味着AI模型会从电影 《记忆碎片》Guy Pearce的角色一夜之间变成《雨人》里Dustin Hoffman的角色,前者只能依赖短期记忆,而后者拥有稳定而持久的记忆。

换句话说,这将赋予AI模型真正的长期记忆能力。

如果真的能实现,这将会是一次非常巨大的技术突破!


压力山大,OpenAI被迫「月更」

显然,GPT-5之后,OpenAI做了一个明显改变,模型开始高频月更。

今年以来,我们已经迎来了GPT-5.1,GPT-5.2,马上5.4也要来了,更新节奏甚至接近了一个月一次。

显然,OpenAI也是被对手逼到墙角了。

目前,ChatGPT的周活跃用户已达9.1亿,虽然数字看似很惊人,但依然没能达到OpenAI 10亿WAU(活跃用户)的目标。

而谷歌和Anthropic这些竞争对手都在步步紧逼,在长上下文、Agent、推理能力上都在持续加码。

如果GPT-5.4真的拥有1百万长上下文、极限推理、持久状态,那AI形态很可能会变成持续工作的智能体。

而且,如果GPT-5.4真的能开始「记住事情」,这很可能就是大模型历史上的一个关键节点。

奇点已至,我们正在狂飙加速。你,准备好了吗?

参考资料:

https://x.com/marmaduke091/status/2028604854143176958

https://www.theneurondaily.com/p/openai-leaked-gpt-5-4-three-times

https://x.com/daniel_mac8/status/2028849150368862416

https://www.theinformation.com/newsletters/ai-agenda/openais-next-ai-model-will-extreme-reasoning?rc=bfliih

来源:https://www.163.com/dy/article/KN93EQGN0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

《叵测》大结局:背后boss,薛琴以一人之力,搭上7条“人命”!
娱乐
《叵测》大结局:背后boss,薛琴以一人之力,搭上7条“人命”!

悬疑剧《叵测》大结局深度解析:真相揭晓,复杂人性引人深思 热播悬疑剧《叵测》迎来震撼收官,当最终真相浮出水面,无数观众陷入沉默与反思。孟广才的“出轨”表象、弟弟薛永辉的牺牲、焦利军的谋划、汪大柱的义气,这一切竟都是为了掩护核心人物——薛琴。这段纠缠于三男一女之间的复杂关系,交织着扭曲的友谊与爱情,究

热心网友
04.26
坏了,我成AI的乙方了!Anthropic论文爆火,谁还敢无脑Copy?
AI
坏了,我成AI的乙方了!Anthropic论文爆火,谁还敢无脑Copy?

Anthropic开年研究:AI辅助编程,效率幻觉与认知代价 新智元报道 编辑:倾倾 【新智元导读】Anthropic开年发布了一项颇具冲击力的研究,直指一个尖锐问题:AI辅助编程,究竟是在提升效率,还是在悄然削弱开发者的核心能力?研究数据揭示的真相,可能比想象中更为复杂。 论文地址:https:

热心网友
04.14
思科首席执行官Chuck Robbins:公司已启动太空数据中心初步准备
科技数码
思科首席执行官Chuck Robbins:公司已启动太空数据中心初步准备

IT之家 4 月 7 日消息,Cisco 思科首席执行官 Chuck Robbins 在接受外媒 The Verge 采访时表示,该企业已启动太空数据中心的初步早期准备。Chuck Robbins

热心网友
04.07
《黑袍纠察队》主创们震惊地发现自己的剧本竟成为现实
娱乐
《黑袍纠察队》主创们震惊地发现自己的剧本竟成为现实

《黑袍纠察队》主创艾瑞克·克里普克对剧集大结局的播出时间感到有些遗憾,并对发布终章的时机深表惋惜。这位创作人坦言,在2024年美国总统大选之前就完成了最终季的剧本创作,这让他感到由衷的“沮丧”,因

热心网友
04.07
全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙
AI
全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙

新智元报道编辑:Aeneas KingHZ【新智元导读】刚刚,Anthropic首度实锤:大模型真有「情绪」!激活绝望神经元后,Claude会撒谎、作弊甚至勒索。AI内心戏曝光,人类对齐面临失控危机

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

全新雷克萨斯ES北京车展上市:混动首发29.99万,纯电
娱乐
全新雷克萨斯ES北京车展上市:混动首发29.99万,纯电

全新一代雷克萨斯ES北京车展上市:混动首发29 99万,纯电版本后续推出 2026年北京车展,全新一代雷克萨斯ES正式揭开了面纱并公布售价。首发上市的混合动力版本,官方指导价定在了29 99万元。这只是一个开始,后续纯电动版本也将陆续登场。有意思的是,现款的ES200车型并不会就此退市,而是与新车型

热心网友
04.28
黄杨钿甜被质疑找水军洗白,本人破防删评,回应耳环风波翻车了
娱乐
黄杨钿甜被质疑找水军洗白,本人破防删评,回应耳环风波翻车了

还记得05后小花黄杨钿甜天价耳环风波吗? 时隔近一年,当事人黄杨钿甜终于首次接受采访,正式回应了那场沸沸扬扬的“天价耳环”风波。她本人也在第一时间转发了道歉声明。然而,从网友的普遍反应来看,这份迟来的回应与道歉,似乎并没有起到预想中的效果。 目前,黄杨钿甜的社交媒体评论区已然“沦陷”。前排的热门评论

热心网友
04.28
兵男曝《黑袍纠察队》幕后!与鞭炮女的某场戏很难熬
娱乐
兵男曝《黑袍纠察队》幕后!与鞭炮女的某场戏很难熬

《黑袍纠察队》第五季幕后:一场让“士兵男孩”都喊难的戏 《黑袍纠察队》第五季正播得火热,各种名场面轮番轰炸观众的眼球。不过,你可能想不到,剧中有些场景拍起来,对演员来说简直是种“折磨”。最近,“士兵男孩”的扮演者詹森·阿克斯就在采访里大倒苦水,透露了本季最难熬的戏份之一——正是他和“鞭炮女”Fire

热心网友
04.28
布林线(BOLL)交易策略 2026欧易平台波段操作指南
web3.0
布林线(BOLL)交易策略 2026欧易平台波段操作指南

布林带实战指南:在欧易平台捕捉波段机会的六个关键步骤 先明确一个核心逻辑:布林带的收口,往往预示着市场波动率下降、趋势启动在即;而它的开口,则明确告诉我们波动正在加剧,趋势可能延续。但光知道这个可不够,关键在于如何结合欧易平台的K线图、时间周期、三轨间距、价格突破以及中轨方向进行综合判断。下面,我们

热心网友
04.28
《方圆八百米》直到儿子畏罪自杀,陈红兵才知,高松格还有隐瞒
娱乐
《方圆八百米》直到儿子畏罪自杀,陈红兵才知,高松格还有隐瞒

在悬疑剧《方圆八百米》中,陈辉一开始卖药犯罪,只是单纯迫于现实的无奈,但从他用命嫁祸霍开明的那一刻起,他便已经彻底堕落,甚至还多了几分享受的感觉。 最初的陈辉,形象是弱小且无助的,内心充满痛苦与徘徊。他每一次铤而走险,动机都相当明确——为了保护高松格。 然而,事情从这里开始悄然变质。你猜怎么着?后来

热心网友
04.28