最近,埃隆·马斯克在个人社交账号上透露了一个重要消息:新一代大语言模型 Grok 4.5 已经在 SpaceX 和特斯拉内部开始试用。这意味着该模型已不再只是实验室中的理论产物,而是真正迈向了业务场景的深度落地。
据马斯克介绍,Grok 4.5 的核心架构基于一个参数规模高达 1.5 万亿的 V9 基座模型。为了在逻辑推理和工程化能力上实现质的飞跃,研发团队在后续微调阶段采取了一个非常明智的策略——专门引入了当前开发者圈中极为热门的 AI 编程助手 Cursor 的高质量交互数据。这一训练路径的目标非常明确:就是要让模型在软件开发、系统调试、多步骤任务规划等关键场景中变得真正好用且可靠。
从初步性能评估来看,Grok 4.5 确实展现出了很强的竞争力。多项基准测试结果显示,其整体表现已经紧追 Anthropic 目前最强的模型 Claude Opus,并且在代码生成、数学推理、长文本理解等细分指标上甚至实现了局部领先。目前项目组正在利用强化学习(RL)框架持续优化模型行为,同时同步升级一套专属评测体系——“Grok Build”,目的是覆盖更广泛的真实负载和极端用例,确保模型既稳健又一致。
此外,马斯克还明确表示,SpaceX 的大模型研发将全面提速。他确认,从即日起到今年年底,公司将严格执行“每月推出一款全新训练模型”的节奏,而且每个版本都是从零开始完整训练的。这种高密度、高强度的迭代策略,不仅凸显了马斯克对 AI 底层技术的长期战略押注,也释放了一个清晰的信号:全球大模型竞争正在快速进入一个高频对抗、快速迭代的新阶段。
