Claude Code多个Agent同时运行后账单翻四倍，一个配置轻松解决

时间：2026-06-26 16:52

你以为让 Claude Code 帮你重构一个 Spring Boot 模块，就是一次对话、一次 API 调用的事。但实际上，它背地里悄悄起了三个独立子 Agent：一个扫代码结构，一个挖依赖关系，一个动手改文件。每一个子 Agent 都是独立的 Claude 实例，各吃各的 token，各花各的钱

你以为让 Claude Code 帮你重构一个 Spring Boot 模块，就是一次对话、一次 API 调用的事。但实际上，它背地里悄悄起了三个独立子 Agent：一个扫代码结构，一个挖依赖关系，一个动手改文件。每一个子 Agent 都是独立的 Claude 实例，各吃各的 token，各花各的钱。

所以你那一次“轻量任务”，账单直接悄悄乘了三。

好消息是，这个问题有个不折腾代码的解法：把子 Agent 的后端模型单独切到 DeepSeek V4-Flash，主 Agent 继续保留给推理更强的 V4-Pro。我按这个思路跑了一次同样的多 Agent 任务，账单从 $6 降到 6 降到$ 1.2，效果基本没差。

这篇就聊具体怎么配，以及几个容易阴沟里翻船的坑。

Claude Code 开 Agent 的方式和你想的不一样

在动手配置之前，得先搞清楚一件事：Claude Code 的多 Agent 不是你手动“启动”的，它自己看着办。

你扔出一条指令，Claude Code 自己判断这活儿要不要并行干。要的话，就自动拆成子任务，造一批独立的 Agent 实例同时跑。每个 Agent 有自己的工具权限、自己的上下文窗口，彼此完全看不见，干完活了只把结果报给主 Agent。

Claude Code 内部有一套模型路由逻辑：复杂推理任务走“Opus 级”，标准任务走“Sonnet 级”，快速查询和子 Agent 走“Haiku 级”。这三个级别是相对的，具体映射到哪个模型，全看环境变量怎么配。

默认情况下，所有模型都落到了 Anthropic 的官方 Claude 系列头上。子 Agent 用的 Haiku 系虽然比 Sonnet 便宜一点，但一个任务如果开了 3-5 个子 Agent，每个都有独立的上下文，量一上来，成本滚起来很快。

容易被忽视的是：如果你只配了 ANTHROPIC_BASE_URL 指到 DeepSeek，却没明确告诉它子 Agent 用什么模型，Claude Code 内部路由时可能把子 Agent 也塞给了 V4-Pro——跟主 Agent 一样贵，但它干的只是读文件、搜索这种简单活儿。

关键配置：子 Agent 单独路由到 DeepSeek V4-Flash

这是整篇最核心的地方。

DeepSeek 提供了一个 Anthropic 兼容的 API 端点，Claude Code 要改的只有两处：把 API 基础地址改成 DeepSeek 的，然后指定每个模型级别对应的 DeepSeek 模型名。

打开你的 shell 配置文件（~/.zshrc 或 ~/.bashrc），加下面这些：

# DeepSeek API 基础配置export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"export ANTHROPIC_API_KEY="sk-你的 DeepSeek API Key"# 主 Agent：V4-Pro 保证推理质量，附加 [1m] 解锁 1M 上下文export ANTHROPIC_MODEL="deepseek-v4-pro[1m]"export ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]" # Opus 级 → V4-Proexport ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro" # Sonnet 级 → V4-Pro# 子 Agent：V4-Flash，速度快、成本低export ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"# Haiku 级 → V4-Flashexport CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash" # 显式绑定子 Agent 模型# 避免复杂推理超时（V4-Pro 长任务可能超过默认 2 分钟）export CLAUDE_CODE_API_TIMEOUT_MS="600000"

保存后执行：

source ~/.zshrc

几个细节得留意一下：

[1m] 不是什么装饰符——不加它，DeepSeek V4-Pro 默认只有 200K 上下文。多 Agent 任务里主 Agent 要跟踪所有子任务的结果，200K 很容易不够用。

ANTHROPIC_DEFAULT_HAIKU_MODEL 管的是 Claude Code 内部所有“Haiku 级别”调用的实际模型，包括内置的 Explore 子 Agent。改了这个，代码探索类任务就自动跑 V4-Flash 了。

CLAUDE_CODE_SUBAGENT_MODEL 是额外的保险——两个变量一起上，确保自定义 Agent 和内置 Agent 都走 V4-Flash。

图：单模型 vs 分层路由，5 个 Agent 场景下的实际成本对比

验证配置正确

配置完之后，先在命令行里确认环境变量生效了：

# 检查两个关键变量echo $ANTHROPIC_BASE_URL# 应该输出 https://api.deepseek.com/anthropicecho $CLAUDE_CODE_SUBAGENT_MODEL# 应该输出 deepseek-v4-flash

如果输出是空的，说明 source ~/.zshrc 没生效，或者变量写在了错误的配置文件里（macOS 默认用 .zshrc，部分旧系统可能是 .bash_profile）。

然后启动 Claude Code，做一个会触发文件探索的任务：

claude "扫描当前目录的 .ja va 文件，给我一个类名列表，并告诉我你用的是什么模型"

正常响应之后，去 DeepSeek 控制台查看 Usage 记录。如果账单里同时出现 deepseek-v4-pro 和 deepseek-v4-flash 两种模型，说明分层路由已经在工作了——文件扫描走的是 Flash，你的主对话走的是 Pro。

如果只看到一种模型，检查一下 CLAUDE_CODE_SUBAGENT_MODEL 是否真的设成了 deepseek-v4-flash，或者任务太简单、压根没触发子 Agent 创建（换一个更复杂的多文件任务试试）。

给自定义 Agent 单独指定模型

Claude Code 允许你用 Markdown 文件定义自己的 Agent（放在 .claude/agents/ 目录）。文件的 YAML frontmatter 里有个 model 字段，可以直接写死用哪个模型，覆盖全局配置。

代码审查类 Agent 不需要什么深度推理，用 V4-Flash 完全够用：

---name: code-reviewerdescription: |代码质量审查专家。适合在 PR 合并前对具体文件做深度审查。当你需要检查安全漏洞、性能问题或代码规范时调用。model: deepseek-v4-flashtools:- Read- Bash---你是一个专注代码质量的 reviewer，检查以下四个维度：安全漏洞、性能问题、代码规范、测试覆盖。每个问题标注 [CRITICAL] / [WARNING] / [SUGGESTION]，提供具体行号和修改建议。

需要做架构分析、技术选型权衡这类需要深度推理的 Agent，明确指定 V4-Pro：

---name: architectdescription: 系统架构设计和技术选型。需要分析多个方案权衡时调用。model: deepseek-v4-pro[1m]tools:- Read- WebSearch---你是一个系统架构师，擅长分析权衡、给出有立场的技术建议。

这种方式把模型路由决策写进 Agent 定义里，比靠全局环境变量更清晰，代码 review 时也看得见。

图：多 Agent 任务中不同类型请求的路由流程

成本账单：改了之后省多少

拿实际数字来说话。

场景：重构一个有 15 个文件的 Spring Boot 服务，Claude Code 自动起了 4 个子 Agent（2 个 Explore，1 个 General-purpose，1 个 Plan），主 Agent 负责协调和最终修改。总计约 240 万 tokens，输入/输出比约 7:3。

后端配置	主 Agent 成本	子 Agent 成本	合计
全用 Claude Sonnet 4.6	$5.04	$17.4	$22.4
全用 DeepSeek V4-Pro（折扣）	$1.22	$0.82	$2.04
V4-Pro 主 + V4-Flash 子（折扣期）	$0.26	$0.25	$0.51
V4-Pro 主 + V4-Flash 子（折扣后）	$1.04	$0.25	$1.29

折扣到期之后，分层路由配置依然是 Sonnet 单一配置的 1/17。

而且 V4-Flash（ $0.14 / 0.14/$ 0.28）比 Claude Haiku 4.5（ $0.80 / 0.80/$ 4.00）便宜了一个数量级。就算不考虑折扣，把子 Agent 从 Haiku 换成 V4-Flash，每次多 Agent 任务还能额外省 70% 以上。

踩坑记录

坑 1：V4-Pro 不支持图片输入

DeepSeek 的 Anthropic 兼容端点目前不支持 image/document 类型的内容块。如果你的工作流里有截图、UI 稿、日志截图，那部分任务会拿到空白内容，没有报错，只是模型什么都没看到。

临时解法：有图片的任务在命令里加 --model claude-sonnet-4-6 临时切回官方 Claude；或者用 claude-code-router（GitHub 搜 musistudio/claude-code-router）根据是否有图片自动路由。

坑 2：模型名写错不报错，会静默 fallback

DeepSeek 的 Anthropic 端点在遇到不认识的模型名时，会静默 fallback 到 deepseek-v4-flash，不返回错误。如果你以为在跑 V4-Pro 但实际跑的是 Flash，账单会少但质量也会掉——你根本感觉不到异常。配完后去控制台看一眼实际调用的模型名。

坑 3：[1m] 不加就只有 200K 上下文

deepseek-v4-pro 和 deepseek-v4-pro[1m] 是两个不同的路由结果。不加 [1m]，上下文窗口是 200K，多 Agent 协调任务里主 Agent 很容易撑满，任务跑到一半被截断。

坑 4：Agent YAML 里的 model 字段区分大小写

写 Model: 会被当作普通文本忽略，不会生效。必须是小写 model:。Debug 了半天才发现。

坑 5：ANTHROPIC_BASE_URL 末尾不能加 /v1

标准 OpenAI 格式的 base URL 通常是 https://api.example.com/v1，但 DeepSeek 的 Anthropic 兼容端点是 https://api.deepseek.com/anthropic，不含 /v1。加了 /v1 会返回 404。

常见问题

Q: 折扣到 5 月 5 日就结束了，结束后还有必要保持这个配置吗？

A: 很有必要。折扣结束后 V4-Pro 原价是 $1.74 / 1.74/$ 3.48，V4-Flash 是 $0.14 / 0.14/$ 0.28。用 Flash 跑子 Agent 比用 Claude Haiku 4.5（ $0.80 / 0.80/$ 4.00）还便宜。分层路由策略的价值不依赖折扣，折扣结束后依然成立。

Q: oh-my-claudecode 这类工具和这套配置兼容吗？

A: 兼容。OMC 的 ultrawork 和 ralph 模式底层还是走 Claude Code 的 Agent 框架，会读取 CLAUDE_CODE_SUBAGENT_MODEL 和 ANTHROPIC_DEFAULT_HAIKU_MODEL 这些变量。按这篇配置好之后，OMC 跑多 Agent 任务也会自动路由到 DeepSeek。

Q: Agent YAML 里不指定 model 字段，会用什么模型？

A: 按全局环境变量的路由逻辑。Claude Code 根据 Agent 的 description 和 tools 判断任务复杂度，决定用 Opus/Sonnet/Haiku 哪个级别，再映射到你设置的 DeepSeek 模型。文件读取类的 Agent 通常走 Haiku 级，也就是 V4-Flash。

Q: 有没有办法不改 .zshrc，只在特定项目里用 DeepSeek？

A: 有。在项目的 .claude/settings.json 里加 env 字段：

{"env": {"ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic","ANTHROPIC_API_KEY": "sk-你的Key","ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash","CLAUDE_CODE_SUBAGENT_MODEL": "deepseek-v4-flash"}}