Grok Build初体验：马斯克打造比Claude Code更强的编程工具

时间：2026-05-31 15:33

有些事情的到来，总是让人毫无防备。五月初的一个周末，我正利用 Claude Code 重构一个老项目。项目规模适中，大约二十万行代码，前后端横跨六个模块。重构进行到一半，一个老问题再次浮现：上下文窗口不够用。你不得不把代码像切面包片一样，一片片地喂给 AI，它才能勉强摸清全局架构。这种感觉，像是在

有些事情的到来，总是让人毫无防备。

五月初的一个周末，我正利用 Claude Code 重构一个老项目。项目规模适中，大约二十万行代码，前后端横跨六个模块。重构进行到一半，一个老问题再次浮现：上下文窗口不够用。你不得不把代码像切面包片一样，一片片地喂给 AI，它才能勉强摸清全局架构。这种感觉，像是在拼一幅一万块的拼图，眼睛却只能看到眼前十块的区域——能拼，但极度疲惫。

就在我烦躁地刷新终端时，朋友在群里甩了一条消息：

「xAI 今晚发布了 Grok Build，200万 token 上下文，你敢信？」

我的第一反应是：哦，又一个 AI 编程助手？紧接着反应过来：等等，Claude Code 最多不是才 100万 token 吗？

就在那一天，我从一个 Claude Code 的老用户，变成了一个深陷 Grok Build 文档无法自拔的好奇宝宝。

一、故事的缘起

一切还得从那个周末说起。原本只想在 Claude Code 里按部就班地工作，结果硬生生被一个“200万”的数字带跑了。后来仔细想想，这事儿本身就很有意思——技术圈的注意力，有时候就是这么容易被一个关键指标撬动。

二、认识一下这位新朋友

Grok Build 究竟是什么？

简单来说，它是 xAI 推出的首个 AI 编程 Agent。本质上是一个运行在终端里的 CLI 工具，目标用户非常明确：“从事复杂工程的软件工程师”。

它背后运行的是 Grok-4.3 beta 模型，于 2026 年 4 月发布，拥有目前西方闭源模型中最大的上下文窗口：200 万 token。这个数字意味着什么？基本上，它能一口气吞下一个中大型仓库的全部代码。

评价一个工具，不是看它“能做什么”，而是看它“在什么场景下，解决了什么人的什么问题”。Grok Build 瞄准的到底是什么场景？其实很清晰：

维度	实际情况
产品形态	终端 CLI + Agent 架构
底层模型	Grok-4.3，200 万 token
核心理念	先规划后执行，最多 8 个并行 Agent
扩展能力	原生支持 MCP、ACP、Headless 模式
当前阶段	2026 年 5 月刚发布，处于 Early Beta 阶段

它并非又一个 Copilot 或 Cursor 那种“在 IDE 里帮你补全代码”的小助手。Grok Build 是那种“你说要重构整个模块，它会告诉你好，我先出个方案你审审”的大管家。这种玩法，此前确实没见过其他产品做到这个程度。

安装方式与 Claude Code 类似，熟悉的配方：

# Install on macOS / Linux
curl -fsSL "https://x.ai/cli/install.sh" | bash

# Environment variable for headless mode (scripts, CI)
export GROK_CODE_XAI_API_KEY="xai-..."

# Start an interactive session in the project
grok

# One-shot run in headless mode
grok -p "refactor the auth module: use JWT instead of sessions"

# Inspect config and discovered resources (skills, MCP, plugins)
grok inspect

三、Grok Build 的核心能力

3.1 Plan Mode：先规划再执行

这个功能最让人着迷。

你在终端里给它下达一个任务，比如：“把这个项目中所有回调风格的代码，全部改写成 async/await”。Grok Build 不会立刻动手——不是不敢，而是设计如此。

它会先生成一个“逐个文件、逐个步骤”的执行计划。这个计划会详细列出：需要修改哪些文件，每个文件如何修改，修改顺序是什么，以及可能影响哪些模块。然后，它会等你确认。

你可以批准整个计划，也可以对某个步骤提出意见，甚至亲自改写某个步骤。只有当你点头之后，它才开始执行。

爱比克泰德在《手册》里说过：我们做每一件事都应该既小心谨慎，又充满信心。Plan Mode 正是这种态度的工程化体现——小心谨慎，先出方案让你审阅；充满信心，你审完后它高效执行。

这个“先规划再执行”的设计，解决了 AI 编程中的一个核心痛点：AI 闷头跑了半小时，改出一堆你根本不想改的东西，你还不知道如何还原。有了 Plan Mode，你至少知道它要做什么。这一点至关重要。

3.2 并行 Subagents：最多 8 个 Agent 同时工作

Grok Build 支持最多 8 个 Agent 并行工作。这是什么意思呢？一个大任务，它可以拆分成 8 个小任务，分配给 8 个 Agent 同时处理。每个 Agent 都遵循“规划 → 搜索 → 执行”的工作流程。

为了避免并行修改代码时产生冲突——比如同一个文件被两个 Agent 修改，结果一团糟——Grok Build 深度集成了 Git worktree。每个子 Agent 在独立的 worktree 中工作，合并结果时会进行 diff 审查。

这给人的感觉是：xAI 不是在打造一个小工具，而是在构建一个“工程团队”。这个团队有 8 个实习生，你担任项目经理，排好计划交出去，他们就各自开工了。

3.3 MCP + ACP 扩展

MCP（Model Context Protocol）是 Anthropic 推广的开放协议。Grok Build 原生支持，你可以将内部知识库、私有 API、内部 MCP 网关直接接入。

ACP（Agent Client Protocol）是为工程平台准备的。外部工具可以直接对接 Grok Build 的 Agent 能力，无需自己重新封装裸 API。它可以方便地与最流行的 IDE，如 Zed 和 JetBrains，实现无缝对接。在 ACP 方面，目前 Grok Build 的表现优于 Claude Code 和 Codex。

再加上项目级别的 AGENTS.md 指令、插件市场、Arena Mode 自动化评测——Grok Build 形成了一个完整的工程生态。马奇在《经验的疆界》中写道：理论不是真理，而是视角。Grok Build 的视角就是“不做一个孤立工具，而是做一个可扩展的工程平台”。这与某些“用完即走”的 AI 编程工具，完全是两种不同的思路。

3.4 Headless 模式

使用 -p 参数启动，CLI 会跳过交互界面，直接接受提示词并输出结构化结果。

这意味着什么？意味着你可以将 Grok Build 嵌入到 CI/CD 流程中。例如，在 GitHub Actions 里，每次 PR 提交后自动运行 Grok Build 进行代码审查、安全扫描、依赖升级建议，并将结果写回 PR 评论。你也可以将其嵌入到 cron job 中，每天早上自动检查日志、生成异常报告、列出技术债务。

西蒙在《我生活的种种模式》中把迷宫比作探索的隐喻。Headless 模式让你无需每次都亲自走迷宫——你设定好路线，Grok Build 自己就能走完。

四、价格：说实话，有点贵

到了最关心的环节。

SuperGrok Heavy 订阅费用：300 美元/月。看到这个数字，我的第一反应是：天哪。

不过 xAI 也提供了 Early Bird 价格：前 6 个月 99 美元/月，大约是标准价的 33 折。说实话，99 美元每月还算便宜。但 300 美元每月对于个人开发者来说，确实需要慎重考虑。

如果你只是想使用 Grok-4.3 模型，而不需要 CLI 那套功能，还有一个更灵活的方式：通过 API 调用。

五、Grok Build vs Claude Code

将 Grok Build 与 Claude Code 进行对比，是绕不开的话题。并非因为其他原因，而是因为它们实在太相似了——都是 Agent + CLI 形态。但仔细审视下来，差异还是相当明显的：

对比维度	Grok Build	Claude Code
底层模型	Grok-4.3（16-Agent Heavy）	Claude 4.5/4.6/4.7 系列
上下文	200 万 token	最大 100 万 token
定价方式	订阅制 300 美元/月	按 Token 计费
并行 Agent	最多 8 个	支持但配置不同
协议扩展	原生 MCP + ACP	原生 MCP
中大型项目	完胜（200 万上下文是杀手锏）	够用

真正的知识不是你不知道什么，而是你能随时调用什么。对比也是一样——不是能否对比，而是知道在什么场景下该选择什么工具。

如果你经常处理几十万行代码的大型项目，Grok Build 的上下文窗口就是核武器——其他工具还在“切香肠”式地喂代码，它却能一口气吞下一个仓库。如果你是“按需使用”型——今天改个小 bug，明天加个新功能，后天可能完全不写代码——那么 Claude Code 的按量计费模式更适合你。这两个工具并不互斥，很多团队两者都在用。日常编辑用 Claude Code，大活重活用 Grok Build。