当地时间6月28日,马斯克在X平台上扔出了一枚深水冲击波:Grok 4.5已经开始在SpaceX和特斯拉内部进行Beta测试,随后才会推向更广泛的用户。这可不是一次小版本迭代——按他的说法,早期评测结果显示,这个模型的性能已经接近、甚至在某些维度上超越了Anthropic的旗舰产品Claude Opus。要知道,Opus一直以来都是大模型领域公认的标杆之一,能与之比肩,本身就意味着Grok 4.5的实力不容小觑。

更值得玩味的是,马斯克特别强调,强化学习(RL)仍在持续显著地优化这个模型,配套的“Grok Build”测试基准也在日趋完善。这暗示着当前的内测版本还不是最终形态,随着RL训练的深入,性能还有可能继续攀升。换句话说,现在看到的“比肩Opus”很可能只是起点。
但真正让人瞪大眼睛的是接下来的计划。这位亿万富翁企业家明确表示,SpaceX计划在今年剩余的时间里,每个月发布一个“完全从零开始训练”的全新人工智能模型。注意措辞——“完全从零开始训练”,这意味着后续的版本不是对现有系统的简单微调或升级,而是每一版都重新训练一个基础模型。如果把常规的大模型迭代比作改造一辆赛车,那马斯克的做法就相当于每个月重新造一辆新车。这种节奏,放在整个行业里都极其激进。
这样一来,xAI的研发周期几乎是在挑战整个行业的极限。当前领先的AI公司——无论是OpenAI、Anthropic还是谷歌——都在竞相提升模型性能和扩展能力,但谁也没有公开承诺过每月发布一个全新基础模型。如果马斯克真的能兑现,那竞争格局很可能会被重新洗牌。当然,从技术实现角度看,每个月从头训练一个千亿甚至万亿参数的大模型,需要的算力、数据和工程资源都是天文数字,这背后必然有SpaceX和特斯拉的算力资源支撑。但话说回来,马斯克向来擅长把“不可能”的时间表变成现实——尽管有时候会延期,方向从没变过。
从行业视角来看,这一系列动作释放了两个明确信号:第一,Grok 4.5的性能已经进入第一梯队,xAI不再是追赶者;第二,马斯克正在用超常规的迭代速度来挤压竞争对手的研发节奏。接下来几个月,整个AI圈恐怕都得盯着日历过日子了。马斯克:Grok 4.5内测已比肩Opus,今年每月都发布一个全新大模型!
