有些事情的到来,总是让人毫无防备。
五月初的一个周末,我正利用 Claude Code 重构一个老项目。项目规模适中,大约二十万行代码,前后端横跨六个模块。重构进行到一半,一个老问题再次浮现:上下文窗口不够用。你不得不把代码像切面包片一样,一片片地喂给 AI,它才能勉强摸清全局架构。这种感觉,像是在拼一幅一万块的拼图,眼睛却只能看到眼前十块的区域——能拼,但极度疲惫。
就在我烦躁地刷新终端时,朋友在群里甩了一条消息:
「xAI 今晚发布了 Grok Build,200万 token 上下文,你敢信?」
我的第一反应是:哦,又一个 AI 编程助手?紧接着反应过来:等等,Claude Code 最多不是才 100万 token 吗?
就在那一天,我从一个 Claude Code 的老用户,变成了一个深陷 Grok Build 文档无法自拔的好奇宝宝。
一、故事的缘起
一切还得从那个周末说起。原本只想在 Claude Code 里按部就班地工作,结果硬生生被一个“200万”的数字带跑了。后来仔细想想,这事儿本身就很有意思——技术圈的注意力,有时候就是这么容易被一个关键指标撬动。
二、认识一下这位新朋友
Grok Build 究竟是什么?
简单来说,它是 xAI 推出的首个 AI 编程 Agent。本质上是一个运行在终端里的 CLI 工具,目标用户非常明确:“从事复杂工程的软件工程师”。
它背后运行的是 Grok-4.3 beta 模型,于 2026 年 4 月发布,拥有目前西方闭源模型中最大的上下文窗口:200 万 token。这个数字意味着什么?基本上,它能一口气吞下一个中大型仓库的全部代码。
评价一个工具,不是看它“能做什么”,而是看它“在什么场景下,解决了什么人的什么问题”。Grok Build 瞄准的到底是什么场景?其实很清晰:
| 维度 | 实际情况 |
| 产品形态 | 终端 CLI + Agent 架构 |
| 底层模型 | Grok-4.3,200 万 token |
| 核心理念 | 先规划后执行,最多 8 个并行 Agent |
| 扩展能力 | 原生支持 MCP、ACP、Headless 模式 |
| 当前阶段 | 2026 年 5 月刚发布,处于 Early Beta 阶段 |
它并非又一个 Copilot 或 Cursor 那种“在 IDE 里帮你补全代码”的小助手。Grok Build 是那种“你说要重构整个模块,它会告诉你好,我先出个方案你审审”的大管家。这种玩法,此前确实没见过其他产品做到这个程度。
安装方式与 Claude Code 类似,熟悉的配方:
# Install on macOS / Linux
curl -fsSL "https://x.ai/cli/install.sh" | bash
# Environment variable for headless mode (scripts, CI)
export GROK_CODE_XAI_API_KEY="xai-..."
# Start an interactive session in the project
grok
# One-shot run in headless mode
grok -p "refactor the auth module: use JWT instead of sessions"
# Inspect config and discovered resources (skills, MCP, plugins)
grok inspect
三、Grok Build 的核心能力
3.1 Plan Mode:先规划再执行
这个功能最让人着迷。
你在终端里给它下达一个任务,比如:“把这个项目中所有回调风格的代码,全部改写成 async/await”。Grok Build 不会立刻动手——不是不敢,而是设计如此。
它会先生成一个“逐个文件、逐个步骤”的执行计划。这个计划会详细列出:需要修改哪些文件,每个文件如何修改,修改顺序是什么,以及可能影响哪些模块。然后,它会等你确认。
你可以批准整个计划,也可以对某个步骤提出意见,甚至亲自改写某个步骤。只有当你点头之后,它才开始执行。
爱比克泰德在《手册》里说过:我们做每一件事都应该既小心谨慎,又充满信心。Plan Mode 正是这种态度的工程化体现——小心谨慎,先出方案让你审阅;充满信心,你审完后它高效执行。
这个“先规划再执行”的设计,解决了 AI 编程中的一个核心痛点:AI 闷头跑了半小时,改出一堆你根本不想改的东西,你还不知道如何还原。有了 Plan Mode,你至少知道它要做什么。这一点至关重要。
3.2 并行 Subagents:最多 8 个 Agent 同时工作
Grok Build 支持最多 8 个 Agent 并行工作。这是什么意思呢?一个大任务,它可以拆分成 8 个小任务,分配给 8 个 Agent 同时处理。每个 Agent 都遵循“规划 → 搜索 → 执行”的工作流程。
为了避免并行修改代码时产生冲突——比如同一个文件被两个 Agent 修改,结果一团糟——Grok Build 深度集成了 Git worktree。每个子 Agent 在独立的 worktree 中工作,合并结果时会进行 diff 审查。
这给人的感觉是:xAI 不是在打造一个小工具,而是在构建一个“工程团队”。这个团队有 8 个实习生,你担任项目经理,排好计划交出去,他们就各自开工了。
3.3 MCP + ACP 扩展
MCP(Model Context Protocol)是 Anthropic 推广的开放协议。Grok Build 原生支持,你可以将内部知识库、私有 API、内部 MCP 网关直接接入。
ACP(Agent Client Protocol)是为工程平台准备的。外部工具可以直接对接 Grok Build 的 Agent 能力,无需自己重新封装裸 API。它可以方便地与最流行的 IDE,如 Zed 和 JetBrains,实现无缝对接。在 ACP 方面,目前 Grok Build 的表现优于 Claude Code 和 Codex。
再加上项目级别的 AGENTS.md 指令、插件市场、Arena Mode 自动化评测——Grok Build 形成了一个完整的工程生态。马奇在《经验的疆界》中写道:理论不是真理,而是视角。Grok Build 的视角就是“不做一个孤立工具,而是做一个可扩展的工程平台”。这与某些“用完即走”的 AI 编程工具,完全是两种不同的思路。
3.4 Headless 模式
使用 -p 参数启动,CLI 会跳过交互界面,直接接受提示词并输出结构化结果。
这意味着什么?意味着你可以将 Grok Build 嵌入到 CI/CD 流程中。例如,在 GitHub Actions 里,每次 PR 提交后自动运行 Grok Build 进行代码审查、安全扫描、依赖升级建议,并将结果写回 PR 评论。你也可以将其嵌入到 cron job 中,每天早上自动检查日志、生成异常报告、列出技术债务。
西蒙在《我生活的种种模式》中把迷宫比作探索的隐喻。Headless 模式让你无需每次都亲自走迷宫——你设定好路线,Grok Build 自己就能走完。
四、价格:说实话,有点贵
到了最关心的环节。
SuperGrok Heavy 订阅费用:300 美元/月。看到这个数字,我的第一反应是:天哪。
不过 xAI 也提供了 Early Bird 价格:前 6 个月 99 美元/月,大约是标准价的 33 折。说实话,99 美元每月还算便宜。但 300 美元每月对于个人开发者来说,确实需要慎重考虑。
如果你只是想使用 Grok-4.3 模型,而不需要 CLI 那套功能,还有一个更灵活的方式:通过 API 调用。
五、Grok Build vs Claude Code
将 Grok Build 与 Claude Code 进行对比,是绕不开的话题。并非因为其他原因,而是因为它们实在太相似了——都是 Agent + CLI 形态。但仔细审视下来,差异还是相当明显的:
| 对比维度 | Grok Build | Claude Code |
| 底层模型 | Grok-4.3(16-Agent Heavy) | Claude 4.5/4.6/4.7 系列 |
| 上下文 | 200 万 token | 最大 100 万 token |
| 定价方式 | 订阅制 300 美元/月 | 按 Token 计费 |
| 并行 Agent | 最多 8 个 | 支持但配置不同 |
| 协议扩展 | 原生 MCP + ACP | 原生 MCP |
| 中大型项目 | 完胜(200 万上下文是杀手锏) | 够用 |
真正的知识不是你不知道什么,而是你能随时调用什么。对比也是一样——不是能否对比,而是知道在什么场景下该选择什么工具。
如果你经常处理几十万行代码的大型项目,Grok Build 的上下文窗口就是核武器——其他工具还在“切香肠”式地喂代码,它却能一口气吞下一个仓库。如果你是“按需使用”型——今天改个小 bug,明天加个新功能,后天可能完全不写代码——那么 Claude Code 的按量计费模式更适合你。这两个工具并不互斥,很多团队两者都在用。日常编辑用 Claude Code,大活重活用 Grok Build。
说实话,Grok Build 是一个很有想法的产品。Plan Mode、并行 Subagents、200 万 token——这些能力表明 xAI 在认真思考“AI 编程助手下一步该往哪个方向走”。
但它的问题也很明显:
第一,价格太高。300 美元的月费对个人开发者来说是一道门槛。
第二,产品太新。5 月 14 日才发布,社区生态几乎为零。能找的教程、插件、踩坑经验都少得可怜。
第三,设计偏重。它的设计是针对“大型工程团队”的,而不是针对“个人开发者写个小脚本”的。如果你只是偶尔写写代码,Grok Build 对你来说可能过于沉重。
工具本身并无贵贱轻重之分,它只是为特定场景而设计的。困扰源于你期待它能解决本不属于其场景的问题。想清楚你的使用场景,然后再选择合适的工具。
七、结语:一个轮回
回到开头那个周末。
那个让我烦躁的老项目,后来并没有用 Grok Build 来重构。不是因为不想,而是因为使用频率不值得我每个月花 300 美元。这种感觉像是:以前吃西瓜得切块,现在却能把整个西瓜直接往嘴里塞。粗鲁,但很爽。
Grok Build 会改变 AI 编程的格局吗?我不知道。但我知道的是,200 万 token 的上下文窗口——xAI 已经亮出了一张别人没有的牌。剩下的,就看他们怎么打了。
做每一件事都应该既小心谨慎,又充满信心。——爱比克泰德
无论你是对 Grok Build 充满期待,还是选择先观望——都是对的。关键在于,用起来。
