9月20日,埃隆・马斯克旗下的人工智能公司xAI正式发布了新一代AI模型Grok 4 Fast。这款创新产品在保持Grok 4级别推理能力的同时,显著降低了40%的计算资源消耗。
性能测试显示,Grok 4 Fast在多项关键指标上表现出色:其推理能力与标准版Grok 4相当,但计算token使用量平均减少了40%,成本更是降低了98%。

特别值得一提的是,在AIME 2025无工具测试中,该模型取得了92.0%的正确率,超越了前代产品Grok 3 Mini。HMMT 2025数学竞赛等专业测试中也展现了显著优势。


Grok 4 Fast在多跳搜索能力方面表现尤为突出。在LMArena搜索竞技场的测试中,其1163分的Elo评分高居榜首,领先第二名17分。在处理中文搜索和跨平台数据整合等复杂任务时,准确率远超同类竞品。

在LMArena的Text Arena排行榜上,代号为"tahoe"的Grok 4 Fast位列第8名,性能与grok-4-0709相当。值得注意的是,所有同规模模型的排名都在18名开外,印证了其突出的性能体积比。

技术上,Grok 4 Fast实现了重要突破:首次将长链推理与快速响应两种模式集成在单一模型中,通过智能提示系统实现动态切换。这种创新设计不仅减少了响应延迟,还显著降低了Token成本,使其特别适合实时搜索、代码执行等应用场景。开发者可以通过xAI API灵活调整推理深度以适应不同需求。
目前,Grok 4 Fast已全面开放使用,包括免费用户在内均可体验。OpenRouter和Vercel AI Gateway平台还提供了限时免费服务。


商业定价方面,该模型的API调用费用极具竞争力:每100万输入tokens仅需0.20美元(约合1.4元人民币),每100万输出tokens价格为0.50美元(约合3.6元人民币)。


