马斯克xAI发布Grok-4.1模型：性能升级与关键功能解析

11月18日消息，埃隆・马斯克（Elon Musk）旗下的人工智能公司 xAI 11 月 17 日宣布推出最新大语言模型 Grok 4 1，并已面向所有用户全面推送。本次更新旨在全面提升 Grok

11月18日，埃隆·马斯克旗下人工智能公司xAI正式发布新一代大语言模型Grok 4.1，并已面向全体用户全面推送。

本次版本升级聚焦于全面提升Grok在真实应用场景中的实用价值。全新推出的Grok 4.1不仅承袭了前代模型敏锐的智能洞察与卓越的稳定表现，更在创造性思维、情感感知和协作互动等维度实现了显著突破，使其能够更精准地捕捉用户细微意图，提供更具吸引力且人格连贯的对话体验。

Grok 4.1的性能表现已达到业界顶尖水准。在大型语言模型竞技场（LMArena）的文本能力排行榜中，其具备深度思考能力的版本（代号：quasarflux）以1483的Elo分数高居榜首，领先第二名达31分。

更令人瞩目的是，其无需深度思考的"即时响应"版本同样以1465的Elo分数位列第二，这一表现甚至超越了其他所有模型的"全推理"模式。相较于前代Grok 4（排名第33位），此次更新实现了质的飞跃，充分印证了其底层技术实力的绝对优势。

除了在通用能力基准测试中表现卓越，Grok 4.1在"软实力"方面也取得了长足进步。在衡量模型情商的EQ-Bench3基准测试和评估创意写作能力的Creative Writing v3测试中，新模型均展现出优异素质。

在评估情感理解、洞察力和人际交往能力的EQ-Bench3基准测试中，Grok 4.1的推理与非推理模式包揽了榜单前两名。

在创意写作领域，根据Creative Writing v3基准测试结果，Grok 4.1的两种模式分别位列第二和第三，仅次于早期的GPT-5.1模型。

这意味着Grok 4.1不仅能处理复杂的逻辑推理，还能更好地理解并回应带有情感色彩的问题，进行富有想象力的内容创作，使其在人机交互中更具"人情味"。

另一项关键改进在于模型"幻觉率"的大幅降低。对于配备搜索工具的快速响应模型而言，由于推理深度和工具调用预算有限，容易出现事实性偏差。

xAI在Grok 4.1的训练后期，特别针对优化信息查询类提示，专注于减少事实性幻觉。根据对真实世界查询样本的评估，新模型的幻觉率已显著下降，从而为用户提供更可靠、更准确的信息服务。