马斯克xAI发布Grok 4 Fast:性能媲美Grok4,售价直降98%
9月20日,埃隆・马斯克旗下的人工智能公司xAI正式发布了新一代AI模型Grok 4 Fast。这款创新产品在保持Grok 4级别推理能力的同时,显著降低了40%的计算资源消耗。
性能测试显示,Grok 4 Fast在多项关键指标上表现出色:其推理能力与标准版Grok 4相当,但计算token使用量平均减少了40%,成本更是降低了98%。

特别值得一提的是,在AIME 2025无工具测试中,该模型取得了92.0%的正确率,超越了前代产品Grok 3 Mini。HMMT 2025数学竞赛等专业测试中也展现了显著优势。


Grok 4 Fast在多跳搜索能力方面表现尤为突出。在LMArena搜索竞技场的测试中,其1163分的Elo评分高居榜首,领先第二名17分。在处理中文搜索和跨平台数据整合等复杂任务时,准确率远超同类竞品。

在LMArena的Text Arena排行榜上,代号为"tahoe"的Grok 4 Fast位列第8名,性能与grok-4-0709相当。值得注意的是,所有同规模模型的排名都在18名开外,印证了其突出的性能体积比。

技术上,Grok 4 Fast实现了重要突破:首次将长链推理与快速响应两种模式集成在单一模型中,通过智能提示系统实现动态切换。这种创新设计不仅减少了响应延迟,还显著降低了Token成本,使其特别适合实时搜索、代码执行等应用场景。开发者可以通过xAI API灵活调整推理深度以适应不同需求。
目前,Grok 4 Fast已全面开放使用,包括免费用户在内均可体验。OpenRouter和Vercel AI Gateway平台还提供了限时免费服务。


商业定价方面,该模型的API调用费用极具竞争力:每100万输入tokens仅需0.20美元(约合1.4元人民币),每100万输出tokens价格为0.50美元(约合3.6元人民币)。


热门专题
热门推荐
东南亚智能手机市场第一季度平均售价同比上涨19%,达349美元。出货量虽下滑9%,但市场总规模增长8%,呈现“量减价增”态势。这表明消费者开始转向高端机型,市场增长动力正从销量扩张向价值提升转变。
代币归属期指代币在发行后按预定时间表逐步解锁的过程。该机制旨在激励项目长期发展,防止早期投资者或团队成员大量抛售导致市场波动。归属期通常包含锁定期与释放期,具体规则由项目方设定。理解此概念有助于评估代币的潜在流通量与市场风险。
近日,小鹏汽车正式宣布,基于其旗舰SUV车型GX打造的首款Robotaxi(自动驾驶出租车)量产车已成功下线。这一重要进展标志着中国L4级高阶自动驾驶技术的商业化落地,迈出了坚实而关键的一步。 根据官方披露的核心信息,这款自动驾驶车型创造了多项行业纪录:它不仅是中国首款实现全栈自研、前装量产的Rob
5月19日,一则新闻引发广泛关注与讨论:河南濮阳一位主营冷冻榴莲果肉的商家,因遭遇买家恶意发起“仅退款”操作,在沟通无果后,选择驱车数百公里前往山东进行维权。几乎在同一时间,浙江杭州萧山区盈丰街道,也因类似恶意退货退款问题频发,被部分电商商家列入“交易谨慎名单”。这两起典型事件,将长期存在于电商交易
5月19日,AMD完成了一项具有里程碑意义的战略举措:首次将其年度AI开发者大会的主会场设在中国。在上海,AMD董事会主席兼首席执行官苏姿丰博士发表了核心主题演讲,其中所传递的战略信号,其深远意义远超单纯的技术发布。 贯穿整场演讲,一个核心信息被不断强化:中国市场对于AMD的全球战略重要性,已提升至





