GPT-4.5即将在本周空降发布的消息,已经炸开了锅。1T激活参数、120T训练数据——这组数字背后,或许意味着人工智能进入新纪元的信号。

万众期待的GPT-4.5,真的要来了?已经有眼尖的用户发现,ChatGPT安卓版测试版中间出现了“GPT-4.5 research preview”的字样。下方紧跟着一段注释:Pro订阅用户现在可以访问我们最新、最大的模型。网友还晒出了更详细的截图,而网络上关于GPT-4.5的消息也越来越多,几乎可以用这些碎片拼出完整轮廓了。
咱们来梳理一下——
OpenAI最后一个非推理模型的爆料速览
两周前,奥特曼本人亲自发推预告,“GPT-4.5将在未来几周内发布”。他同时证实,GPT-4.5就是此前多次被曝光的Orion(猎户座)——这款从去年8月浮出水面的新旗舰,定位是GPT-4的下一代。更关键的是,奥特曼明确表示,GPT-4.5将会是OpenAI最后一个非推理模型。发布之后,OpenAI将把GPT系列和o系列模型合并为一个单一的AI系统。
就在“未来几周内”的今天,推特上来自The Information的Stephanie Palazzolo透露了一条关键信息:“OpenAI领导者告诉员工,GPT-4.5将于本周推出。”今天可是周四了!而且这个消息并不只是单一信源,网络上陆续有人站出来分享自己获取的已知信息。
量子位筛选整理后,与大家先睹为快。
GPT-4.5基本资料
目前曝光的GPT-4.5是一个参数爆表的庞然大物:1T激活参数的Transformer MoE模型,在120T tokens数据上训练。作为对比,GPT-4的总参数是1.8T。它的上下文窗口长度达到256K,自带知识截至2024年6月。此外,GPT-4.5还是一个具有人类视觉水平的Agent。
不是推理模型,但……
尽管奥特曼明确说过它不是推理模型,但有人发现其输出过程非常与众不同。GPT-4.5是边思考边吐结果的,而不是一次思考过后只吐出一次结果。下面这张爆料人提供的截图显示,蓝色框选部分是它的思考过程——思考一会儿后输出阶段性结果,再思考一会儿,再输出阶段性结果……尽管不是长链式思考(CoT),但这与“非推理模型”的预告似乎有些出入。有网友猜测,这一切可能基于GPT-4.5对整个互联网进行了RAG处理。
能画动画SVG,还会“唱歌”
神通广大的网友连新增功能的效果都一并发出了。主要新增能力有二:
1)制作动画SVG文件。与它交流3-4轮修改意见,就能得到一个会翻白眼的蒙娜丽莎。
2)零样本制作音乐。不过它很有原则:拒绝生成受版权保护的歌曲。来听听一段由GPT-4.5“作曲”的不知名贝多芬变奏:
说起来,OpenAI上一次发音乐模型已经是5年前的事了——2020年4月30日发布的Jukebox,能够在原始音频域中生成完整的音乐作品,包括人声部分。如果传闻为真,GPT-4.5的多模态能力又要加一分。
速度更快,且很便宜
相关爆料人只有短短这一句话,但大家都很期待:1T激活参数的GPT-4.5,到底能有多便宜……
任务表现好坏参半
虽然GPT-4.5很快就要和大家见面,但先别太兴奋。一位测试过该模型的人士透露,GPT-4.5在某些任务上的表现好坏参半。比如Anthropic前天发布的混合推理模型Claude 3.7 Sonnet,就在某些基准测试中击败了它。根据Claude系列的一向强项,很难不让人猜测至少包含了编程领域……
One More Thing
最后需要提醒的是,根据现有信息,GPT-4.5首批似乎只对Pro用户开放——就是那个一个月200美元的高阶订阅。这让不少网友有些不爽,毕竟OpenAI现在四面受敌,至少也该让Plus用户抢先体验吧?不过有网友发出推论:奥特曼作为大模型界的老营销高手,或许先放出“只限Pro”的风声,后面再宣布开放给Plus,这样大家好感度立刻up up。这个套路是不是很耳熟?想开窗,先告诉大家要拆房顶(手动狗头)。
但在正式发布之前,一切都是未知数。还是那句话,“本周发布”,既然今天已经是周四,大家不用着急,再等一会儿吧~
