马斯克在X上发布了一条重磅消息:Grok 4.5已开始在SpaceX和特斯拉内部进行Beta测试。待本轮内部验证通过后,才会面向更广泛的用户群体开放。

有几个关键点值得关注。早期评测数据表明,Grok 4.5的性能与Anthropic旗舰模型Claude Opus相比可谓旗鼓相当,甚至在某些维度上实现了反超。更重要的是,强化学习(RL)仍在持续为模型带来显著的优化提升,同时配套的“Grok Build”测试基准也在不断完善。
马斯克还公布了一个更为激进的计划:SpaceX计划在今年剩余时间内,每月发布一个“完全从零开始训练”的全新人工智能模型。这背后释放的信号值得深思——未来的版本迭代并非对现有系统的简单修补,而是通过全新训练构建的全新基础模型。这种更新节奏足以说明,整个行业在模型性能和功能扩展上的竞争已进入白热化阶段。
xAI推行的这种高强度研发周期,显然会加剧与OpenAI、Anthropic、谷歌等一众玩家的正面竞争。月月发布新模型,这样的节奏在业内并不多见。
聚焦软件开发
再来看技术细节。Grok 4.5的基础是1.5万亿参数的V9模型,更关键的是,在补充训练阶段,它特别纳入了热门AI编程工具Cursor的数据。虽然Beta测试期间,马斯克并未提供详尽的Grok 4.5功能信息,但Cursor训练数据的加入已经明确指向一个方向:Grok将继续在软件开发和编码辅助领域发力,而这正是大型语言模型目前最具商业价值的应用场景之一。
需要指出的是,这个Cursor并非随意选择。本月16日,SpaceX宣布将以600亿美元收购Cursor的开发商Anysphere,这笔交易预计在2026年第三季度完成。在此之前,SpaceX对Cursor的关注已持续数月。今年3月,Cursor的两名产品工程负责人已加入SpaceX,参与其月球相关项目及xAI的研发工作。这一系列动作,显然是在加速企业级AI市场的战略布局。
直接在SpaceX和特斯拉内部测试Grok 4.5,更容易获得大规模工程、制造和软件开发方面的一手应用经验。这种实战中打磨出来的能力,往往比单纯的实验室数据更具说服力。
