游乐游手机版
首页/AI教程/文章详情

Claude Code多个Agent同时运行后账单翻四倍,一个配置轻松解决

时间:2026-06-26 16:52
你以为让 Claude Code 帮你重构一个 Spring Boot 模块,就是一次对话、一次 API 调用的事。但实际上,它背地里悄悄起了三个独立子 Agent:一个扫代码结构,一个挖依赖关系,一个动手改文件。每一个子 Agent 都是独立的 Claude 实例,各吃各的 token,各花各的钱

你以为让 Claude Code 帮你重构一个 Spring Boot 模块,就是一次对话、一次 API 调用的事。但实际上,它背地里悄悄起了三个独立子 Agent:一个扫代码结构,一个挖依赖关系,一个动手改文件。每一个子 Agent 都是独立的 Claude 实例,各吃各的 token,各花各的钱。

所以你那一次“轻量任务”,账单直接悄悄乘了三。

好消息是,这个问题有个不折腾代码的解法:把子 Agent 的后端模型单独切到 DeepSeek V4-Flash,主 Agent 继续保留给推理更强的 V4-Pro。我按这个思路跑了一次同样的多 Agent 任务,账单从 6降到6 降到 1.2,效果基本没差。

这篇就聊具体怎么配,以及几个容易阴沟里翻船的坑。

Claude Code 开 Agent 的方式和你想的不一样

在动手配置之前,得先搞清楚一件事:Claude Code 的多 Agent 不是你手动“启动”的,它自己看着办。

你扔出一条指令,Claude Code 自己判断这活儿要不要并行干。要的话,就自动拆成子任务,造一批独立的 Agent 实例同时跑。每个 Agent 有自己的工具权限、自己的上下文窗口,彼此完全看不见,干完活了只把结果报给主 Agent。

Claude Code 内部有一套模型路由逻辑:复杂推理任务走“Opus 级”,标准任务走“Sonnet 级”,快速查询和子 Agent 走“Haiku 级”。这三个级别是相对的,具体映射到哪个模型,全看环境变量怎么配。

默认情况下,所有模型都落到了 Anthropic 的官方 Claude 系列头上。子 Agent 用的 Haiku 系虽然比 Sonnet 便宜一点,但一个任务如果开了 3-5 个子 Agent,每个都有独立的上下文,量一上来,成本滚起来很快。

容易被忽视的是:如果你只配了 ANTHROPIC_BASE_URL 指到 DeepSeek,却没明确告诉它子 Agent 用什么模型,Claude Code 内部路由时可能把子 Agent 也塞给了 V4-Pro——跟主 Agent 一样贵,但它干的只是读文件、搜索这种简单活儿。

关键配置:子 Agent 单独路由到 DeepSeek V4-Flash

这是整篇最核心的地方。

DeepSeek 提供了一个 Anthropic 兼容的 API 端点,Claude Code 要改的只有两处:把 API 基础地址改成 DeepSeek 的,然后指定每个模型级别对应的 DeepSeek 模型名。

打开你的 shell 配置文件(~/.zshrc~/.bashrc),加下面这些:

# DeepSeek API 基础配置export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"export ANTHROPIC_API_KEY="sk-你的 DeepSeek API Key"# 主 Agent:V4-Pro 保证推理质量,附加 [1m] 解锁 1M 上下文export ANTHROPIC_MODEL="deepseek-v4-pro[1m]"export ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]" # Opus 级 → V4-Proexport ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro" # Sonnet 级 → V4-Pro# 子 Agent:V4-Flash,速度快、成本低export ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"# Haiku 级 → V4-Flashexport CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash" # 显式绑定子 Agent 模型# 避免复杂推理超时(V4-Pro 长任务可能超过默认 2 分钟)export CLAUDE_CODE_API_TIMEOUT_MS="600000"

保存后执行:

source ~/.zshrc

几个细节得留意一下:

[1m] 不是什么装饰符——不加它,DeepSeek V4-Pro 默认只有 200K 上下文。多 Agent 任务里主 Agent 要跟踪所有子任务的结果,200K 很容易不够用。

ANTHROPIC_DEFAULT_HAIKU_MODEL 管的是 Claude Code 内部所有“Haiku 级别”调用的实际模型,包括内置的 Explore 子 Agent。改了这个,代码探索类任务就自动跑 V4-Flash 了。

CLAUDE_CODE_SUBAGENT_MODEL 是额外的保险——两个变量一起上,确保自定义 Agent 和内置 Agent 都走 V4-Flash。

图:单模型 vs 分层路由,5 个 Agent 场景下的实际成本对比

验证配置正确

配置完之后,先在命令行里确认环境变量生效了:

# 检查两个关键变量echo $ANTHROPIC_BASE_URL# 应该输出 https://api.deepseek.com/anthropicecho $CLAUDE_CODE_SUBAGENT_MODEL# 应该输出 deepseek-v4-flash

如果输出是空的,说明 source ~/.zshrc 没生效,或者变量写在了错误的配置文件里(macOS 默认用 .zshrc,部分旧系统可能是 .bash_profile)。

然后启动 Claude Code,做一个会触发文件探索的任务:

claude "扫描当前目录的 .ja va 文件,给我一个类名列表,并告诉我你用的是什么模型"

正常响应之后,去 DeepSeek 控制台查看 Usage 记录。如果账单里同时出现 deepseek-v4-prodeepseek-v4-flash 两种模型,说明分层路由已经在工作了——文件扫描走的是 Flash,你的主对话走的是 Pro。

如果只看到一种模型,检查一下 CLAUDE_CODE_SUBAGENT_MODEL 是否真的设成了 deepseek-v4-flash,或者任务太简单、压根没触发子 Agent 创建(换一个更复杂的多文件任务试试)。

给自定义 Agent 单独指定模型

Claude Code 允许你用 Markdown 文件定义自己的 Agent(放在 .claude/agents/ 目录)。文件的 YAML frontmatter 里有个 model 字段,可以直接写死用哪个模型,覆盖全局配置。

代码审查类 Agent 不需要什么深度推理,用 V4-Flash 完全够用:

---name: code-reviewerdescription: |代码质量审查专家。适合在 PR 合并前对具体文件做深度审查。当你需要检查安全漏洞、性能问题或代码规范时调用。model: deepseek-v4-flashtools:- Read- Bash---你是一个专注代码质量的 reviewer,检查以下四个维度:安全漏洞、性能问题、代码规范、测试覆盖。每个问题标注 [CRITICAL] / [WARNING] / [SUGGESTION],提供具体行号和修改建议。

需要做架构分析、技术选型权衡这类需要深度推理的 Agent,明确指定 V4-Pro:

---name: architectdescription: 系统架构设计和技术选型。需要分析多个方案权衡时调用。model: deepseek-v4-pro[1m]tools:- Read- WebSearch---你是一个系统架构师,擅长分析权衡、给出有立场的技术建议。

这种方式把模型路由决策写进 Agent 定义里,比靠全局环境变量更清晰,代码 review 时也看得见。

图:多 Agent 任务中不同类型请求的路由流程

成本账单:改了之后省多少

拿实际数字来说话。

场景:重构一个有 15 个文件的 Spring Boot 服务,Claude Code 自动起了 4 个子 Agent(2 个 Explore,1 个 General-purpose,1 个 Plan),主 Agent 负责协调和最终修改。总计约 240 万 tokens,输入/输出比约 7:3。

后端配置主 Agent 成本子 Agent 成本合计
全用 Claude Sonnet 4.6$5.04$17.4$22.4
全用 DeepSeek V4-Pro(折扣)$1.22$0.82$2.04
V4-Pro 主 + V4-Flash 子(折扣期)$0.26$0.25$0.51
V4-Pro 主 + V4-Flash 子(折扣后)$1.04$0.25$1.29

折扣到期之后,分层路由配置依然是 Sonnet 单一配置的 1/17。

而且 V4-Flash(0.14/0.14/0.28)比 Claude Haiku 4.5(0.80/0.80/4.00)便宜了一个数量级。就算不考虑折扣,把子 Agent 从 Haiku 换成 V4-Flash,每次多 Agent 任务还能额外省 70% 以上。

踩坑记录

坑 1:V4-Pro 不支持图片输入

DeepSeek 的 Anthropic 兼容端点目前不支持 image/document 类型的内容块。如果你的工作流里有截图、UI 稿、日志截图,那部分任务会拿到空白内容,没有报错,只是模型什么都没看到。

临时解法:有图片的任务在命令里加 --model claude-sonnet-4-6 临时切回官方 Claude;或者用 claude-code-router(GitHub 搜 musistudio/claude-code-router)根据是否有图片自动路由。

坑 2:模型名写错不报错,会静默 fallback

DeepSeek 的 Anthropic 端点在遇到不认识的模型名时,会静默 fallback 到 deepseek-v4-flash,不返回错误。如果你以为在跑 V4-Pro 但实际跑的是 Flash,账单会少但质量也会掉——你根本感觉不到异常。配完后去控制台看一眼实际调用的模型名。

坑 3:[1m] 不加就只有 200K 上下文

deepseek-v4-prodeepseek-v4-pro[1m] 是两个不同的路由结果。不加 [1m],上下文窗口是 200K,多 Agent 协调任务里主 Agent 很容易撑满,任务跑到一半被截断。

坑 4:Agent YAML 里的 model 字段区分大小写

Model: 会被当作普通文本忽略,不会生效。必须是小写 model:。Debug 了半天才发现。

坑 5:ANTHROPIC_BASE_URL 末尾不能加 /v1

标准 OpenAI 格式的 base URL 通常是 https://api.example.com/v1,但 DeepSeek 的 Anthropic 兼容端点是 https://api.deepseek.com/anthropic,不含 /v1。加了 /v1 会返回 404。

常见问题

Q: 折扣到 5 月 5 日就结束了,结束后还有必要保持这个配置吗?

A: 很有必要。折扣结束后 V4-Pro 原价是 1.74/1.74/3.48,V4-Flash 是 0.14/0.14/0.28。用 Flash 跑子 Agent 比用 Claude Haiku 4.5(0.80/0.80/4.00)还便宜。分层路由策略的价值不依赖折扣,折扣结束后依然成立。

Q: oh-my-claudecode 这类工具和这套配置兼容吗?

A: 兼容。OMC 的 ultraworkralph 模式底层还是走 Claude Code 的 Agent 框架,会读取 CLAUDE_CODE_SUBAGENT_MODELANTHROPIC_DEFAULT_HAIKU_MODEL 这些变量。按这篇配置好之后,OMC 跑多 Agent 任务也会自动路由到 DeepSeek。

Q: Agent YAML 里不指定 model 字段,会用什么模型?

A: 按全局环境变量的路由逻辑。Claude Code 根据 Agent 的 description 和 tools 判断任务复杂度,决定用 Opus/Sonnet/Haiku 哪个级别,再映射到你设置的 DeepSeek 模型。文件读取类的 Agent 通常走 Haiku 级,也就是 V4-Flash。

Q: 有没有办法不改 .zshrc,只在特定项目里用 DeepSeek?

A: 有。在项目的 .claude/settings.json 里加 env 字段:

{"env": {"ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic","ANTHROPIC_API_KEY": "sk-你的Key","ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash","CLAUDE_CODE_SUBAGENT_MODEL": "deepseek-v4-flash"}}

只对当前项目生效,不影响其他项目的配置。

Q: 这套配置会影响 Claude Code 的 Hooks 吗?

A: Hooks 是本地脚本,不走模型 API,不受影响。受影响的是所有需要调用模型的操作:对话、子 Agent、Plan 模式。如果发现某个功能行为异常,临时注释掉环境变量回归测试。

其实这套配置没什么高深的,本质上就是把 Claude Code 内部的“模型级别 → 实际模型”映射重新指了一遍。但很多人不知道有这个路由层的存在,默认配置下子 Agent 的模型没有被单独控制,多 Agent 任务一跑,账单自然就超出预期了。

知道原理之后,成本控制就变成了一件可以精确操作的事。

参考资料

  • DeepSeek API 官方定价文档
  • DeepSeek Anthropic 兼容 API 指南
  • Claude Code 自定义 Sub-agents 官方文档
  • claude-code-router GitHub
来源:https://juejin.cn/post/7639282654523260974
上一篇年三款AI办公助手真实测评对比推荐 下一篇AI时代程序员不被淘汰的必学路径
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网