新智元报道
编辑:KingHZ 桃子
OpenAI这场翻身仗,已经箭在弦上!今日惊爆全网的重磅消息显示:GPT-5的基石原来仍是GPT-4o。自4o问世以来,其内部预训练屡屡受挫,几乎沦为“弃子”。
OpenAI核心预训练工作是否遭遇滑铁卢?
据知情人士透露,GPT-5的技术基底依然沿用GPT-4o架构,而原计划在GPT-4.5之后推出的预训练版本,均已被OpenAI中途放弃。
这一说法并非空穴来风,核心爆料来源正是权威机构SemiAnalysis的最新专题报告——
OpenAI顶尖技术团队自GPT-4o发布至今,尚未完成任何一次面向下一代前沿模型的完整大规模预训练。
文中资深分析师强调:谷歌正凭借TPUv7这把利器,向英伟达的王者宝座发起冲击,或将改写CUDA护城河的市场格局。
众所周知,OpenAI的全栈模型完全基于英伟达GPU打造。
然而业内人士的关注焦点,大多集中在“模型推理”与“后训练”阶段的硬件需求上。
殊不知,缺失前沿模型的预训练环节,一切终将沦为“无米之炊”。正因这一关键环节,已成为AI硬件领域最难攻克、最耗资源的技术关卡。
如今,一则鲜为人知的内幕消息浮出水面:
事实证明,谷歌TPU已彻底经受住了这一严峻考验。
相比之下,自2024年5月GPT-4o诞生以来,OpenAI的预训练进展几乎停滞不前……
过去两年半间,OpenAI始终未能开展真正意义上的规模化预训练。
GPT系列的预训练工作,或许在GPT-4o之后触及了技术天花板,这也解释了GPT-5性能未达业界预期的根本原因。
有网友直言:这不正是Ilya选择离开的时间节点吗……
恰逢昨日,Ilya最新发声称,模型扩展不会止步,但某些关键要素仍将处于缺失状态。
OpenAI预训练体系遭遇重大挫折
还记得去年底那场铺天盖地的“Orion”传闻吗?
这个神秘项目原本计划以GPT-5身份面世,但因训练效果未达预期,最终被降级为GPT-4.5发布。
在前沿模型预训练领域,OpenAI的研发进程似乎陷入了僵局——
如今第五代旗舰模型GPT-5,包括最新的GPT-5.1,其“技术根基”本质上仍未突破GPT-4o的框架范畴。
SemiAnalysis去年底的专题报道,曾公开披露Orion训练过程面临的困境。
当前,算法进步使得模型每年所需物理计算量减少约三分之一,因此训练运行时间很少超过3个月。
甚至,行业中大多数预训练通常仅需1-2个月。
然而,OpenAI的Orion大规模预训练却打破这一常规,其训练周期超过了3个月。
另据Information同期爆料,Orion不会像前代实现巨大飞跃,相比较从GPT-3到GPT-4的迭代,改进幅度要小得多。
不仅如此,Orion性能提升也基本局限在——语言能力层面,其代码能力甚至不及旧模型,且成本更高。
如今再看2月问世的GPT-4.5,基于代号Orion的模型,OpenAI追求的目标是:
更强的语言能力+更稳定的对话体验+更丰富的知识库
情商,成为了GPT-4.5的关键词。代码虽有所提升,却非主打功能。
这一切的种种,从侧面印证了此前外媒关于“Orion受挫”爆料的准确性——
大语言模型虽有进步,但突破有限。
GPT-4o,成为扩展主线?
今年8月那场GPT-5发布会,奥特曼将其定位为“博士级AI,是通往AGI的又一里程碑”。
实则,业界对GPT-5的反响,唏嘘一片。
大家原本以为,GPT-5将是全面超越前代的跨越式升级,但实际发布后,更像是GPT-4.5的优化版本,而非“颠覆版”。
但至于GPT-5真正基于哪代GPT打造,仍有待证实。
正如之前传闻的猜测,有可能是GPT-4o,还有Reddit网友称是GPT-4.1....
但不论是哪个版本,都证明了GPT-5并未基于全新前沿模型进行大规模预训练淬炼。
耐人寻味的是,那个曾让OpenAI三颗
